Il peut aussi parser directement la page pour en extraire les informations de la page. Avec un parseur XML sir elle est en XHTML.
Par exemple, si sur ce forum, tu cherche la liste des sujets :
<a href="/hardwarefr/Programmation/activePERL-images-affichent-CSS-sujet-71272-1.htm" class="cCatTopic" title="Sujet n°71272">[activePERL] les images ne s'affichent pas ni mon CSS</a>
|
(langage bidon)
foreach a in page.getElementByTagName ('a') {
if (a.getAttribute ('class') == 'cCatTopic') {
document.write (a.innerText);
}
}
---------------
JE JE SUIS LIBERTINEEEEEEEEEEE JE SUIS UNE CATINNNNNNNNN §§§§§§§§