|
Bas de page | |
---|---|
Auteur | Sujet : [Python]Parser un fichier XML contenant des accents |
Shadew | Bonjour, je cherche à parser un fichier XML contenant des accents. J'éprouve des problèmes d'encodage et je trouve assez difficilement des informations sur le net. J'utilise pour le moment minidom pour parser un fichier encodé en ISO-8859-1. Voici mon code:
Message cité 1 fois Message édité par Shadew le 12-10-2008 à 10:26:32 |
Publicité | Posté le 12-10-2008 à 10:25:53 |
masklinn í dag viðrar vel til loftárása |
Message édité par masklinn le 12-10-2008 à 14:45:37 --------------- Stick a parrot in a Call of Duty lobby, and you're gonna get a racist parrot. — Cody |
Shadew | Euh...C'est censé encoder la chaîne en ISO, pour que python puisse interpréter les symboles accentués (j'ai aussi essayé avec la fonction unicode mais ça fonctionne pas mieux) |
masklinn í dag viðrar vel til loftárása |
Donc là tu réencodes un truc encodé, bizarrement ya des chances que ça fasse des trucs pas voulus. Ce dont tu as besoin ici, c'est de décoder ta chaîne pas de l'encoder, et accessoirement
De plus ton try/except n'a aucun intérêt, donc
Message édité par masklinn le 12-10-2008 à 16:16:06 --------------- Stick a parrot in a Call of Duty lobby, and you're gonna get a racist parrot. — Cody |
masklinn í dag viðrar vel til loftárása |
--------------- Stick a parrot in a Call of Duty lobby, and you're gonna get a racist parrot. — Cody |
Shadew | Oui, quand je l'ouvre avec IE sans mettre d'encodage ou en mettant utf-8 ça foire, et quand je met iso-8859-1, il s'ouvre correctement et les accents sont affichés correctement.
Message cité 1 fois Message édité par Shadew le 12-10-2008 à 17:00:47 |
masklinn í dag viðrar vel til loftárása |
--------------- Stick a parrot in a Call of Duty lobby, and you're gonna get a racist parrot. — Cody |
Shadew |
J'ai déjà essayé parse, et avec ça j'obtiens:
J'ai pas forcément besoin d'utiliser minidom mais avec ElementTree, j'obtiens la même erreur que celle 3 lignes plus haut :s Message édité par Shadew le 12-10-2008 à 17:46:57 |
masklinn í dag viðrar vel til loftárása | Ben no se alors, si tu peux fournir le fichier XML (directement, sans coller son contenu ici, j'ai besoin de l'original) je peux essayer de regarder, sinon pas vraiment. Message édité par masklinn le 12-10-2008 à 17:48:56 --------------- Stick a parrot in a Call of Duty lobby, and you're gonna get a racist parrot. — Cody |
Publicité | Posté le 12-10-2008 à 17:48:46 |
Shadew | Je t'ai envoyé le fichier sur ton adresse hotmail. Merci de ton aide !! |
masklinn í dag viðrar vel til loftárása | Bon, trouvé, en fait ElementTree.parse et ElementTree.fromstring prennent du texte encodé (et je présume que minidom est pareil) et refusent les documents unicode. Sauf que dans ET 1.2.6, effbot ne fournit pas de moyen de forcer un encoding, et tire celui-ci du document. Or ton document n'indique aucun encoding dans son prologue (le machin <? xml ... ?> en haut du fichier), ce qui indique qu'il est encodé en utf-8 (ou en utf-16) d'après la spec XML (ton document est donc complètement illégal et malformé). Tu as donc 3 possibilités:
note 2: encoding & ET 1.3
note 3: via BeautifulSoup
Message édité par masklinn le 12-10-2008 à 19:23:37 --------------- Stick a parrot in a Call of Duty lobby, and you're gonna get a racist parrot. — Cody |
Shadew | Kikoo, c'est nickel, j'ai réussi à ouvrir mon fichier grâce à toi!!! Merci beaucoup!!!!
Message édité par Shadew le 12-10-2008 à 20:44:20 |
masklinn í dag viðrar vel til loftárása | Avec quelle méthode? --------------- Stick a parrot in a Call of Duty lobby, and you're gonna get a racist parrot. — Cody |
Shadew | En réalité, j'ai commencé avec la 1 mais ça fonctionnait pas avec ma version de ET, j'ai donc voulu télécharger la dernière version de ET (1.3), mais il fallait commencer à utiliser svn co, etc pour l'installer. Et comme je souhaite que cela reste assez simple à installer pour n'importe quel quidam, je me suis rabattu sur la 3. BS ne demande qu'un rajout d'un fichier dans le dossier contenant Python. Message édité par Shadew le 13-10-2008 à 09:58:27 |
Sujets relatifs | |
---|---|
vbscript - probleme de copie de fichier | creation de fichier dans les sous repertoires |
[VBA] Ouvrir un fichier Excel qui commence par... | copier un fichier dans une variable |
Edition de fichier texte. | Création d'un fichier installateur |
Open XML API : insérer une image dans Word | Comptabiliser le nombre de fois que se répète un mot dans un fichier |
lire des donnees dans un fichier texte | parser du texte ? |
Plus de sujets relatifs à : [Python]Parser un fichier XML contenant des accents |