Comment détecter l'encodage d'un fichier? - Codes et scripts - Linux et OS Alternatifs
Marsh Posté le 02-05-2008 à 14:14:10
file -i fait ça :
[jules@tue-amour ~]$ file -i licence |
Marsh Posté le 30-03-2009 à 14:07:25
Ca ne marche pas exactement comme ça ; file -i retourne l'en-tête mime du fichier. Alors, oui, sur certains fichiers, l'en-tête mime contient le codage, mais ce n'est pas toujours le cas (dans un fichier HTML par exemple, ça, va simplement retourner text/html)
Une autre solution ?
Marsh Posté le 30-03-2009 à 14:44:15
ça reste un paquet d'octet. On ne peut pas détecter, on ne peut que deviner.
Marsh Posté le 30-03-2009 à 16:01:37
iconv éventuellement, ou des modules perls, mais effectivement comme le dit Taz, ca ne marche pas à tous les coups .... c'est uniquement des probas/statistiques/heristiques
Marsh Posté le 30-03-2009 à 16:34:32
OK... je vais m'arranger pour ne passer à la moulinette que les fichiers dotn je suis sur qu'ils sont en iso (pcq un utf8 converti en utf8 c le bordel )
Marsh Posté le 02-05-2008 à 13:38:13
Bonjour à tous,
J'ai besoin de faire un script qui détecte tous les fichiers texte dont l'encodage est différent de UTF8 pour les convertir en UTF8 avec iconv (iconv -f ISO-8859-15 -t UTF8 $i > tmp_$i ), mais, je n'ai pas trouvé comment détecter en script (perl, python, bash, C, peu importe) l'encodage utilisé par un fichier.
Une idée?
Merci,
vw.