Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1554 connectés 

  FORUM HardWare.fr
  Programmation
  C

  chargement de regexp, UTF-8 vs ASCII

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

chargement de regexp, UTF-8 vs ASCII

n°1968371
ztg
Posté le 23-02-2010 à 06:30:19  profilanswer
 

salut a tous
 
j'ai un programme en C qui charge une regex specifiee dans un XML via xmlGetProp() en libxml2
mon XML est encode en UTF-8
 
maintenant, ma regexp est (je crois) en style ascii, cad [a-zA-Z0-9] pour les caracteres alphanumeriques par exemple
 
si je donne a mon prog en C la regex en hardcodant

Code :
  1. char* regex = "[a-z]+";


j'ai un match
 
en revanche si je la charge depuis mon XML j'ai pas de match
 
qqn saurait il comment resoudre ca?
 
j'aimerais rester en tout- UTF8 pour des raisons de proprete evidentes (donc avoir un XML en ascii n'est pas une option)
 
 
merci d'avance

mood
Publicité
Posté le 23-02-2010 à 06:30:19  profilanswer
 

n°1968392
olivthill
Posté le 23-02-2010 à 09:44:30  profilanswer
 

L'UTF-8 pour les caractères alphanumériques normaux a le même encodage que l'Ascii (voir http://fr.wikipedia.org/wiki/UTF-8). Mais cela ne veut pas dire que ce soit forcément de l'Ascii. l'UTF-8 se démarque de l'Ascii pour les caractères accentués et autres caractères non américains.
 
Cela dit, quelle est la question ?

n°1968545
ztg
Posté le 23-02-2010 à 15:28:04  profilanswer
 

ma regex ne contient que des caracteres alphanumeriques, un trait d'union et le symbole $
 
la question est:
 
que dois je modifier (la regex, son chargement dans un char*, sa compilation?) pour faire un match?

n°1968557
ztg
Posté le 23-02-2010 à 15:49:52  profilanswer
 

bon c'est ma faute
 
il fallait que je quadruple les backslash dans mon XML au lieu des les doubler :)

n°1968559
ztg
Posté le 23-02-2010 à 15:54:25  profilanswer
 

pardon c'est l'inverse, 2x moins de \ dans le XML que dans le char* :jap:


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Programmation
  C

  chargement de regexp, UTF-8 vs ASCII

 

Sujets relatifs
[PHP] Système de chargement de ma pageProbleme de chargement de module PHP 5.3 PHP_SNMP.DLL
[Résolut] Sauvegarde et chargement d'une arbre un peu particulier.Chargement du module [delphi 2009]
[Javascript] Greybox : chargement foireuxPerl regexp
[C++] Conversion Unicode à ASCII sous linuxEmpecher l'erreur lors du chargement du XML
Temps de chargement des pagesCaractères spéciaux regexp
Plus de sujets relatifs à : chargement de regexp, UTF-8 vs ASCII


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR