Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1302 connectés 

  FORUM HardWare.fr
  Programmation
  Python

  inverser re.escape() pour des caractères non ASCII

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

inverser re.escape() pour des caractères non ASCII

n°2201013
suizokukan
Posté le 28-08-2013 à 17:43:43  profilanswer
 

Bonjour, je travaille avec Python3 dans un environnement (programme et éditeur) 100% UTF-8 .
 
J'ai testé différentes méthodes pour inverser l'effet de l'appel à re.escape() sur des caractères non ASCII. Sauf erreur de ma part, aucune ne fonctionne. Dois-je en passer par une fonction ad hoc comme celle que je vois ici (http://mentaljetsam.wordpress.com/ [...] ed-string/) ? Serait-ce une erreur propre à Python ou y a-t-il quelque chose que je ne comprends pas ? J'ouvre ce thread suite à celui que j'ai ouvert, sans grand succès, sur Stackoverflow (http://stackoverflow.com/questions [...] characters).
 
Merci de votre aide !
 
Voici mes essais :

Code :
  1. # pure ASCII string : ok
  2. mystring = "a\n" # expected unescaped string : "a\n"
  3. cod = codecs.getencoder('unicode_escape')
  4. print( cod(mystring) )
  5. # non ASCII string : method #1
  6. mystring = "€\n"
  7. # equivalent to : mystring = codecs.unicode_escape_decode(mystring)
  8. cod = codecs.getdecoder('unicode_escape')
  9. print(cod(mystring))
  10. # RESULT = ('â\x82¬\n', 5) INSTEAD OF ("€\n", 2)
  11. # non ASCII string : method #2
  12. mystring = "€\n"
  13. mystring = bytes(mystring, 'utf-8').decode('unicode_escape')
  14. print(mystring)
  15. # RESULT = â\202¬ INSTEAD OF "€\n"


---------------
rule #1 : trust the python
mood
Publicité
Posté le 28-08-2013 à 17:43:43  profilanswer
 


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Programmation
  Python

  inverser re.escape() pour des caractères non ASCII

 

Sujets relatifs
VBA et chaine de caractères[BATCH] choix des caractères
Tester si une variable contient des caractèresdécouper une chaine de caractères d'un fichier en java
Suppression des doublons dans un tableau des chaines des caractères[c][Lire et ecrire dans un tableau de caracteres en dimension 2]
Batch afficher les 10 derniers caractères de chaques lignesConcatenation de chaines d caracteres avec balise php
Caractères é pour les accentstableaux et chaines de caractères
Plus de sujets relatifs à : inverser re.escape() pour des caractères non ASCII


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR