Perl : lire un fichier UTF-8

Perl : lire un fichier UTF-8 - Perl - Programmation

Marsh Posté le 02-03-2006 à 21:41:19    

Bonsoir.
 
J'ai écrit un programme en Perl, que j'ai enregistré en UTF-8 (dans Word 2002).
 
J'ai mis en tête de ce programme le pragma
 
use utf-8;
 
Ce programme ouvre un fichier, qui a été lui-même enregistré en UTF-8.
 
La première ligne de ce fichier est :
<sum>
 
Cette ligne est lue correctement par le programme Perl, sauf qu'il lit en plus, au début de la ligne, un caractère dont le numéro est 65279.
 
Pourtant, si je visualise le fichier dans Word ou dans le bloc-notes, le premier caractère visible est bien <
 
Voici les instructions du programme relatives à cela :
 
  use utf-8;
 
 
  if (! defined(open(FICHTTS, "<:encoding(utf-8)", $nomDuFichier) ) )
  {
    # envoyer un message d'erreur
    return 0;
  }
 
 
  if ( defined($ligne = <FICHTTS> ) )
  {
    print  'Le premier caractère de $ligne a pour numéro ' . sprintf("%d", ord(substr($ligne, 0, 1)))
  }
 
Quelqu'un peut-il m'expliquer d'où vient ce caractère 65279 ?
 
Merci d'avance ?

Reply

Marsh Posté le 02-03-2006 à 21:41:19   

Reply

Marsh Posté le 03-03-2006 à 17:03:24    

Bonsoir.
 
J'ai fini par trouver :
 
"UTF-8 files sometimes start with a byte-order marker (BOM) to indicate that they are encoded in UTF-8. This is commonly used on Windows."
 
C'est sur :
 
http://evanjones.ca/python-utf8.html

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed