Hum, après pas mal de test :s, j'arrive à extraire mon texte mais j'ai toujours plien d'erreurs lors de l'excution ... si quelqu'un à une idée, je pense que ca doit vraiment être rien :s
à chaque test, voila ce qui en sort :
Citation :
Use of uninitialized value in string eq at test2.pl line 31.
Use of uninitialized value in string eq at test2.pl line 31.
Use of uninitialized value in string eq at test2.pl line 31.
etc..
|
voici le code (J'ai finalement opté pour un accés directe à internet) :
Code :
- #!/usr/bin/perl
- use strict;
- use warnings;
- use LWP::Simple;
- use HTML::Parser;
- use HTML::Form;
- my $page = get( "http://toluna.fr/gradignan_est_parfait-av-919318.html" );
- # création de mon parser
- my $parser = HTML::Parser->new();
- # définition des mes evenements
- $parser->handler( text => \&text, "text" );
- $parser->handler( start => \&start, "tagname,attr" );
- $parser->handler( end => \&end, "tagname" );
- $parser->parse($page);
- print &get_data();
- $parser->eof;
- {
- my $in;
- my @data;
- sub start {
- my ($tag,$attr) = @_;
- $in++ if ($tag eq 'td' and $attr->{class} eq 'avistxt');
- }
- sub end {
- my ($tag) = @_;
- $in-- if ($tag eq 'td' and $in='1');
- }
- sub text {
- my ($text) = @_;
- push @data, $text if ($in );
- }
- sub get_data {
- #print "in : ".$in;
- return @data;
- }
- }
- exit;
|
Message édité par ProjetGTR le 14-09-2007 à 14:49:52