Bon exusez moi si j'évoque mal mon problème...
J'ai un fichier qui est en faite un code html avec plusieurs balises, pleins de texte. L'info qui m'interesse se trouve uniquement entre les balises <PRE> et <\PRE> de ce fichier. Ces balises peuvent etre en debut ou à n'importe quel endroit de la ligne. De plus ces 2 balises peuvent s'etendre sur une ou plusieurs lignes.
Pour extraire mes données voila comment je compte faire:
Code :
- open (fichier,"fichier.html" );
- while (my $ligne =<fichier> ){
- if ($ligne =~ /<PRE>(.*)<\/PRE>/is){
- print $ligne;}
- }
|
MAis ceci ne marche pas comme pour ici:
Extrait de mon fichier:
Code :
- <HR><p><PRE>>X07448|IGHV1-2*01|Homo sapiens|F|V-REGION
- caggtgcagctggtgcagtctggggctgaggtgaagaagcctggggcctcagtgaaggtc
- tcctgcaaggcttctggatacaccttcaccggctactatatgcactgggtgcgacaggcc
- cctggacaagggcttgagtggatgggacggatcaaccctaacagtggtggcacaaactat
- ......
- </PRE><P>
- Suite.....
|