Comment détecter l'encodage d'un fichier?

Comment détecter l'encodage d'un fichier? - Codes et scripts - Linux et OS Alternatifs

Marsh Posté le 02-05-2008 à 13:38:13    

Bonjour à tous,
 
J'ai besoin de faire un script qui détecte tous les fichiers texte dont l'encodage est différent de UTF8 pour les convertir en UTF8 avec iconv (iconv -f ISO-8859-15 -t UTF8 $i > tmp_$i ), mais, je n'ai pas trouvé comment détecter en script (perl, python, bash, C, peu importe) l'encodage utilisé par un fichier.
 
Une idée?
 
Merci,
vw.

Reply

Marsh Posté le 02-05-2008 à 13:38:13   

Reply

Marsh Posté le 02-05-2008 à 14:14:10    

file -i fait ça :

[jules@tue-amour ~]$ file -i licence
licence: text/plain charset=us-ascii
[jules@tue-amour ~]$ file -i paquets
paquets: text/plain charset=utf-8



Message édité par Mjules le 02-05-2008 à 14:18:54

---------------
Celui qui pose une question est idiot 5 minutes. Celui qui n'en pose pas le reste toute sa vie. |  Membre du grand complot pharmaceutico-médico-scientifico-judéo-maçonnique.
Reply

Marsh Posté le 03-05-2008 à 09:40:12    

Merci beaucoup !

Reply

Marsh Posté le 30-03-2009 à 14:07:25    

Ca ne marche pas exactement comme ça ; file -i retourne l'en-tête mime du fichier. Alors, oui, sur certains fichiers, l'en-tête mime contient le codage, mais ce n'est pas toujours le cas (dans un fichier HTML par exemple, ça, va simplement retourner text/html)
 
Une autre solution ?


---------------
"Par moment j'me d'mande si chui pas con" G. de Suresnes
Reply

Marsh Posté le 30-03-2009 à 14:44:15    

ça reste un paquet d'octet. On ne peut pas détecter, on ne peut que deviner.

Reply

Marsh Posté le 30-03-2009 à 16:01:37    

iconv éventuellement, ou des modules perls, mais effectivement comme le dit Taz, ca ne marche pas à tous les coups .... c'est uniquement des probas/statistiques/heristiques

Reply

Marsh Posté le 30-03-2009 à 16:34:32    

OK... je vais m'arranger pour ne passer à la moulinette que les fichiers dotn je suis sur qu'ils sont en iso (pcq un utf8 converti en utf8 c le bordel :))


---------------
"Par moment j'me d'mande si chui pas con" G. de Suresnes
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed