DarkLord a écrit a écrit :
bah non en fait parce que c'est du XML UTF-8
mais bon je me pose pas la question plus longtemps puisque ca fonctionne ...
|
UTF-8 est un encodage d'Unicode où chaque caractère a une longueur variable, entre 1 et 5 octets, en fonction de sa valeur. Le principal intérêt d'UTF-8 est qu'on y a la garantie qu'aucune chaîne ne contient d'octet à zéro, ce qui permet de manipuler toute chaîne UTF-8 pour un classique char* en C.
Maintenant, que ce soit largement utilisé par XML, c'est pour la même raison... même si sous nos latitudes, on utilise plutôt l'encodage ISO-Latin-1 (ou iso-8859-1, renommé win-1252 par Microsoft), qui a l'avantage d'encoder tous les caractères sur 1 octet et de contenir les 256 premiers caractères d'Unicode (d'où une conversion Unicode <--> ISO-Latin-1 très facile).
Message édité par BifaceMcLeOD le 23-10-2002 à 14:32:04