Bonjour,
Je me suis procuré un Parser Allocine disponible sur internet (afin de choper les info des films et pouvoir tout mettre dans ma base SQL)
Tout marche impec sauf le "Genre" du film que je n'arrive pas à récupérer
J'aimerai par exemple pour le film Dark World avoir comme retour de mon script "Comédie dramatique,Fantastique,Policier,Science fiction,Thriller,Romance" dans le champ Genre
J'ai vu qu'il fallait modifier le fichier ParserAlloCine.class.php et plus particulèrement la ligne 25 ou il y a écrit
Code :
- const PATERN_GENRE = '/Genre:(.*)<\/a><br\/>/';
|
ParserAlloCine.class.php
Code :
- <?php
- /**
- * ParserAlloCine 0.1 : Recupere les infos d'un film via Allocine
- *
- * @author : LECOMTE Cyril <cyrhades@free.fr>
- * @version : 14/11/2009
- */
- class ParserAlloCine
- {
- // ON CONSERVE LES PORTIONS UTILE POUR ACCELERER L'EXECUTION (300 a 500 lignes au lieu de +6000 lignes)
- const PAGE_RECHERCHE = 'http://www.allocine.fr/recherche/1/?q=';
- const DEBUT_RECHERCHE = '<table class="totalwidth noborder purehtml">';
- const FIN_RECHERCHE = '</table>';
- const PAGE_FICHE = 'http://www.allocine.fr/film/fichefilm_gen_cfilm=';
- const DEBUT_FICHE = '<div class="boxbasic breadcrumb">';
- const FIN_FICHE = '<div class="morezone">';
- // N'hésitez pas a ameliorer les patterns ils sont vraiment mal étudié (enfin pas étudié du tout ^^)
- const PATERN_ID_FILM = '/fichefilm_gen_cfilm=([0-9]*)\.html/';
- const PATERN_POCHETTE_FILM = '/src=\'(http:\/\/.*)\'alt/';
- const PATERN_TITRE_ORIGINAL_FILM = '/alt=\'(.*)\' \/>/';
- const PATERN_TITRE_FILM = '/fichefilm_gen_cfilm=[0-9]*\.html\'>(.*)<\/a>/';
- const PATERN_INFOS_FILMS = '/<span class="fs11">(.*)<br \/>(.*)<br \/>(.*)<\/span>/';
- const PATERN_GENRE = '/Genre:(.*)<\/a><br\/>/';
- const PATERN_ANNEE = '/ Année de production :(.*)<\/a><br\/>/';
- const PATERN_DUREE = '/<br\/> Dur.*([0-9]{1,2})h([0-9]{2}) min/'; // Bug si ecrit Durée pk ???
- const PATERN_NOTE = '/<span class="moreinfo">\(([0-9]{1},[0-9]{1})\)<\/span>/';
- const PATERN_DATE_SORTIE_CINE = '/\?week=([0-9]{4}-[0-9]{2}-[0-9]{2})/';
- const PATERN_SYNOPSIS = "/Synopsis : <\/span>(.*)<\/p><\/div><\/div><ul id/"; // Bug si chaine de fin plus courte Pk???
- //-- Attribut privé
- private $reponseAlloCine;
- private $reponseAlloCineToJson;
- private $ficheFilmAlloCine;
- private $ficheFilmAlloCineToJson;
- private $ResultatRechercheFilm;
- //constructeur inutile ici
- public function __construct() { }
- ..... ?>
|
Le script est installé sur mon site ici et si vous voulez avoir les fichiers c'est ici
Si quelqu'un pouvait me dire ou est l'erreur dans cette ligne ça serait super.
Merci d'avance
Message édité par mashable le 10-04-2010 à 21:04:45