PHP

Récupération de données sur allociné

Recherche :

Mot : Pseudo : Filtrer
Bas de page
Auteur	Sujet : Récupération de données sur allociné

Orission

Salut,

J'ai un problème pour récuperer une information sur allociné.

Voici le code html :

Code :

<li>
<span class="film_info lighten fl">Nationalité</span>
<div class="oflow_a">
<span class="acLnk 1F4446484E1FCB4FC3C21FC04AC6C21E232025241F underline">Iranien</span>
</div>
</li>

et mon code php :

Code :

<?php
preg_match('#<li><span class="film_info lighten fl">Nationalité</span><div class="oflow_a">(.*?)</div></li>#is', $recup, $nationalite);
$sortie['nationalite'] = (empty($nationalite)) ? $absent['nationalite'] : utf8_decode(trim(strip_tags($nationalite[0])));
?>

Le problème est qu'il ne me renvoie rien

---------------
“ Un avis d’un homme non avisé ne doit jamais être pris en compte par un homme avisé. ” Jean Plancher, 1810, Taverne « Chez Bonaparte »

Publicité

sparks79

Salut,
Peut-être un problème avec le caractère accentué de 'Nationalité'...
Personnellement je fait un utf8_decode sur le contenu à traiter, et je sauvegarde mes fichiers php en ANSI.

Orission

la page est en utf8 donc pas de soucis

---------------
“ Un avis d’un homme non avisé ne doit jamais être pris en compte par un homme avisé. ” Jean Plancher, 1810, Taverne « Chez Bonaparte »

sparks79

Pour vérifier que le problème viens bien du caractère accentué, tu peux essayer de le remplacer par un point (.).

preg_match('#<li><span class="film_info lighten fl">Nationalit.</span><div class="oflow_a">(.*?)</div></li>#is', $recup, $nationalite);
echo "<pre>" . htmlspecialchars( print_r( $nationalite, TRUE)) . "</pre>";

Par défaut les fonctions « preg » ne traitent pas de l'UTF-8.
Si tu veux rester en UTF-8, tu peux essayer le modifier "u" en plus de "is" (#...#ius).

Orission

ça ne fonctionne pas hélas

---------------
“ Un avis d’un homme non avisé ne doit jamais être pris en compte par un homme avisé. ” Jean Plancher, 1810, Taverne « Chez Bonaparte »

sparks79

J'ai testé ce bout de code dans mon scraper :

Code :

preg_match('/<li> <span class="film_info lighten fl">Nationalit.</span> <div class="oflow_a">(.*?)</div> </li>/', $recup, $nationalite);
echo "<pre>" . htmlspecialchars( print_r( $nationalite, TRUE)) . "</pre>";

Et comme tu peut le voir, ça match :

Array
(
[0] => <li> <span class="film_info lighten fl">Nationalité</span> <div class="oflow_a"> <span class="acLnk 1F4446484E1FCB4FC3C21FC04AC6C21E232020211F underline">Américain</span> </div> </li>
[1] => <span class="acLnk 1F4446484E1FCB4FC3C21FC04AC6C21E232020211F underline">Américain</span>
)

Mais l'une des première chose que je fait après avoir récupére le flux HTML UTF-8 sur allocine, c'est de le décoder (entre autre).
J'ai eu trop de problèmes avec les caractères accentués.

Code :

$contents= file_get_contents( $url, false, $context);
$contents= utf8_decode( $contents);

Je m'assure aussi que mon fichier php ne soit pas en UTF-8 mais bien en ANSI (l'utilisation d'un éditeur comme Notepad++
est très pratique pour ça).
Mes expressions régulières sont un peu plus simple aussi :

Code :

if (preg_match( "/Nationalité(.*?)<\/div>/", $contents, $pays) > 0) {
        $data['pays']= trim( strip_tags( $pays[1]));
    }

Tu peut toujours sortir de l'UTF-8 en réencodant (je le fait pour des flux XML) :

Code :

$value= $xml->createTextNode( utf8_encode( $data['pays']));

tylerball

Si tu veux scrapper des des données, je te conseille d'utiliser http://simplehtmldom.sourceforge.net/, tu iras 100 fois plus vite dans la construction de ton scrapper

bouillbou

As-tu essayé http://sites.google.com/site/apiallocine/ ?

Orission

Tout fonctionne, et j'ai regardé l'api c'est pas trop mal !

Merci !

---------------
“ Un avis d’un homme non avisé ne doit jamais être pris en compte par un homme avisé. ” Jean Plancher, 1810, Taverne « Chez Bonaparte »

bouillbou

Je t'en prie.

FORUM HardWare.fr

Programmation

PHP

Récupération de données sur allociné

Sujets relatifs
comment recuperer les données d'un formulaire dans un autre	VBA couper une partie des données dans une autre colonne
requete sur type de données	[deb][python]choix type données pour un tri
[c#] Problème de récupération membervalue depuis combobox	Récupération de la date et de lheure sur un serveur de temps.
Question Bases de données des banques	[BATCH] récupération taille total disque
Problème connection base de données en C++	[POO] Héritage vers Base de données relationelle
Plus de sujets relatifs à : Récupération de données sur allociné

Page générée en 0.047 secondes