Perl : lire un fichier UTF-8 - Perl - Programmation
Marsh Posté le 03-03-2006 à 17:03:24
Bonsoir.
J'ai fini par trouver :
"UTF-8 files sometimes start with a byte-order marker (BOM) to indicate that they are encoded in UTF-8. This is commonly used on Windows."
C'est sur :
http://evanjones.ca/python-utf8.html
Marsh Posté le 02-03-2006 à 21:41:19
Bonsoir.
J'ai écrit un programme en Perl, que j'ai enregistré en UTF-8 (dans Word 2002).
J'ai mis en tête de ce programme le pragma
use utf-8;
Ce programme ouvre un fichier, qui a été lui-même enregistré en UTF-8.
La première ligne de ce fichier est :
<sum>
Cette ligne est lue correctement par le programme Perl, sauf qu'il lit en plus, au début de la ligne, un caractère dont le numéro est 65279.
Pourtant, si je visualise le fichier dans Word ou dans le bloc-notes, le premier caractère visible est bien <
Voici les instructions du programme relatives à cela :
use utf-8;
if (! defined(open(FICHTTS, "<:encoding(utf-8)", $nomDuFichier) ) )
{
# envoyer un message d'erreur
return 0;
}
if ( defined($ligne = <FICHTTS> ) )
{
print 'Le premier caractère de $ligne a pour numéro ' . sprintf("%d", ord(substr($ligne, 0, 1)))
}
Quelqu'un peut-il m'expliquer d'où vient ce caractère 65279 ?
Merci d'avance ?