Bonsoir,
Je débute sous Python (depuis cet après midi) et je me suis fait un petit script qui va récupérer quelques valeurs d'une page HTML.
Je me sers pour cela du module "re", avec par exemple des re.findall(blabla, pouet)
Tout ceci fonctionne tant bien que mal sauf... quand un accent apparait. Deja un simple print me donne :
Code :
- ---------Infos Générales----------
|
De plus quand je cherche à récupérer mes valeurs avec mes re.findall, le moindre accent empeche de trouver quelque chose.
Genre:
Code :
- Héraults : [] exp des héraults : []
- Soldats: ['237'] (OFF) | ['210'] (DEF)
- Mercenaires: [] (OFF) | [] (DEF)
|
La ligne sans accent passe, les accent dans le re.find bloquent.
J'ai essayé de regler le "coding" avec
Code :
- # -*- coding=latin-1 -*-
|
utf-8, latin-1, iso-8859-1 (ce dernier etant le codage de la page), mais pas de changement notable
Si vous avez un tuyau, je prends...