convertir des données utf-8 en iso-8859-1 - Divers - Programmation
Marsh Posté le 27-12-2004 à 21:03:07
non c'est un utf-8 la source
et c'est le dump officiel de wikipedia donc ça serait bizarre quand même qu'il soit mal foutu
Marsh Posté le 27-12-2004 à 21:07:23
ah, ben tout simplement parce que iso-8859-15 ne peut pas représenter tous les caractères qu'unicode permet
Marsh Posté le 27-12-2004 à 21:07:58
oui mais -c -s permet de zapper les caractères non représentable justement
Marsh Posté le 27-12-2004 à 21:16:15
en fait y'a la fonction utf8_decode en php qui fait ça.
je vais donc passer par le php pour convertir mes données ou si j'ai le temps j'irais fouiner dans les sources de php pour voir comment il fait
Marsh Posté le 27-12-2004 à 20:59:31
J'ai besoin d'utiliser le dump fr de wikipedia (http://download.wikimedia.org/).
Malheureusement il est en utf-8 et mes pages php qui l'utilisent sont en iso-8859-1 et je ne veux pas les passer en utf-8.
Je cherche donc un moyen de convertir ces données en iso-8859-1.
Le seul moyen que j'ai trouvé pour l'instant c'est iconv (sous nux) mais bizarrement il plante au milieu de la conversion ("iconv: Séquence d'échappement illégale" même avec l'option -c -s).
Y'a aussi une fonction en php qui semble faire ça mais le module correspondant n'est pas installé sur le serveur et de toute façon je suppose qu'elle doit être basée sur iconv.
N'y a-t-il pas une autre solution?
Merci !