récupération données tableau html avec python

Recherche :

Mot : Pseudo : Filtrer
Bas de page
Auteur	Sujet : récupération données tableau html avec python

julietter

Bonjour à tous,

Je débute tout juste sur ce forum et sur python, je suis donc navrée si ce sujet n'est pas au bon endroit ou s'il est mal formulé.

Pour mon travail, je chercher à récupérer des données d'un tableau html pris sur www.societe.com à l'aide du logiciel python. Mais celui-ci me donne du fil à retordre :$. En effet, il ne semble pas à même de compter les colonnes dans chaque ligne pour prélever les données que je souhaite. Mon code est le suivant:

from bs4 import BeautifulSoup
import urllib
url = 'http://www.societe.com/bilan/air-liquide-sante-international-552134728201312311.html'
html_file = urllib.request.urlopen(url)
soup = BeautifulSoup(html_file)
tables = soup.findAll('table')
for money in tables[0].findAll('tr'):
tds=money.findAll('td')
print (tds[0].string, '=>', tds[1].string)

et le message d'erreur est: IndexError: list index out of range.

L'un d'entre vous aurait-il une idée?

Merci d'avance et bonne journée à tous.

Publicité

masklinn

í dag viðrar vel til loftárása

Le premier <tr> de ta table contient des <th>, pas de <td>. Donc money.findAll('td') est une liste vide, et donc erreur. Normal.

---------------
Stick a parrot in a Call of Duty lobby, and you're gonna get a racist parrot. — Cody

FORUM HardWare.fr

Programmation

Python

récupération données tableau html avec python

Sujets relatifs
HTML ou PHP ?	[Résolu] Récupération d'id ne se fait pas
[HTML/CSS & ECLIPSE] [résolu]	d3.js : filtrer X dernières données d'un .csv
Macro copier tableau avec plusieurs critères	problèmes récupération checkbox dynamique
Ajout de variables dans un tableau	tableau outofBound
Send email from HTML page	Python : Demande d'avis pour coup de gueule !
Plus de sujets relatifs à : récupération données tableau html avec python

Page générée en 0.042 secondes