Erreur copie contenu fichier .odt dans fichier html

Erreur copie contenu fichier .odt dans fichier html - HTML/CSS - Programmation

Marsh Posté le 26-06-2024 à 11:10:14    

Bonjour,
 
Je débute en développement web et j'essaye de créer une page web en utilisant un fichier html, via l'éditeur de texte jEdit sous Linux.
Pour ça, je m'aide d'un guide pratique qui me recommande de coder en iso-8859-1.
Voici la balise meta du code source proposée par le guide :

Code :
  1. <meta http-equiv="Content-type" content="text/html; charset=iso-8859-1" />


J'aimerais copier le contenu d'un fichier texte LibreOffice Writer (.odt) dans un fichier html et je suis confronté à un problème. Lorsque j'essaie de le faire, j'obtiens le message d'erreur suivant :
 
"Enregistrement impossible de java.io.CharConversionException: Encodage du caractère suivant impossible :
'’' (U+2019) colonne 2 ligne 50 encodé en "iso-8859-1"."
 
Bien sûr, l'erreur ne concerne pas qu'un caractère et est présente tout au long du contenu copié.
Lorsque j'efface les caractères concernés et les réécris manuellement directement dans le fichier html via l'interface de jEdit, cela fonctionne évidemment.
Je suppose donc que le contenu de mon fichier .odt est codé en UTF-8.
Le texte que j'ai à copier est plutôt long et j'aimerais pouvoir l'insérer directement par un copier-coller au lieu d'avoir à le recopier manuellement. Est-ce possible et si oui, comment?
 
J'ai fait une recherche sur le forum sans avoir trouvé de réponse.
 
Merci  :)

Reply

Marsh Posté le 26-06-2024 à 11:10:14   

Reply

Marsh Posté le 26-06-2024 à 14:17:23    

Ton guide pratique doit dater de 1990 car cela fait bien longtemps que l'on préconise plutôt l'usage de l'UTF-8.
Je te conseille de suivre un tuto html5 plus récent avec comme minimum de code html un truc de ce genre:

Code :
  1. <!DOCTYPE html>
  2. <html lang="fr">
  3.     <head>
  4.         <meta charset="utf-8">
  5.         <title>Le titre de ma page</title>
  6.     </head>
  7.     <body>
  8.     </body>
  9. </html>


---------------
D3
Reply

Marsh Posté le 26-06-2024 à 16:26:00    

Salut mechkurt, merci pour ta réponse.
 
Oui tu as raison, il date de 2013. Du coup j'ai changé le code source minimum, en cherchant sur internet pour confirmer il s'avère que j'ai trouvé le même que tu as mis.
Malheureusement j'ai toujours la même erreur.
 
Par contre, en bricolant un peu, j'ai trouvé quelque-chose qui fonctionne à priori.
J'ai d'abord copié le texte issu du fichier .odt et je l'ai collé dans un fichier html vide. J'ai rajouté dans un second temps le code source minimum de la page. Je n'ai plus cette erreur pour le moment, mais la page n'est pas encore balisée en-dehors du code source minimum. Mais bon, puisque c'est entre la balise body, ma logique de débutant me dirait que le reste devrait suivre.
 
Je tiendrai au courant, mais si il y a une explication ça m'intéresserait.
 
Merci  :)


Message édité par mafe le 26-06-2024 à 16:29:13
Reply

Marsh Posté le 26-06-2024 à 16:41:19    

Tu as essayé d'enregistrer depuis en ton .odt en html  pour voir le contenu (et le charset) que LibreOffice génère ?


---------------
D3
Reply

Marsh Posté le 28-06-2024 à 09:51:03    

Salut,
 
Oui j'ai essayé de manipuler les fichiers sous LibreOffice Writer de plusieurs façons et même en choisissant le type d'encodage, ça ne changeait rien.
 
Là tout fonctionne et j'ai remarqué la chose suivante :  
- L'erreur était présente lorsque j'essayais de travailler sur les tout premiers fichiers que j'avais créés.
- En créant de nouveaux fichiers vides .html, cela fonctionne normalement, même avec le code source minimum que j'utilisais lorsqu'il y avait l'erreur. Donc même avec un encodage iso-8859-1.
J'en déduis qu'il devait y avoir un problème au niveau de ces fameux premiers fichiers. Si c'est ça, certains auront peut-être une explication.
 
J'utilise tout-de-même un code source plus récent maintenant, merci mechkurt.
 
Salut :)

Reply

Marsh Posté le 28-06-2024 à 12:44:45    

Ah mais ton premier fichier était surement encodé différemment que ce que tu disais dans ton charset (c'était ptet bien de l'utf-8 d'ailleurs vu que c'est plutôt standard).
L'encodage du fichier dans ton outils d’édition de texte c'est au autre réglage que juste dire dans ton fichier texte <meta charset="utf-8">.
Et tu peux aussi avoir des galères d'encodage en important du contenu depuis une base de donnée ou un json, c'est pour ca que tout avoir en utf-8 c'est rudement plus simple... ;)


---------------
D3
Reply

Marsh Posté le 03-07-2024 à 10:27:45    

Salut,
 
Merci mechkurt et désolé pour ma réponse tardive.
 
Alors il y a des choses dans ton message que je ne comprends pas mais je vois l'idée.
Je ne crois pas avoir modifié les réglages de jEdit entre les deux observations, mais peut-être par inadvertance...
Et puis pour l'importation de contenu, je ne connais pas la notion de "json" et ne sais pas grand-chose des bases de données.
En tout cas cela continue de fonctionner et c'est cool  ;)  
 
Merci  :)

Reply

Marsh Posté le 07-07-2024 à 11:20:51    

mafe a écrit :

Bonjour,
 
Je débute en développement web et j'essaye de créer une page web en utilisant un fichier html, via l'éditeur de texte jEdit sous Linux.
Pour ça, je m'aide d'un guide pratique qui me recommande de coder en iso-8859-1.
Voici la balise meta du code source proposée par le guide :

Code :
  1. <meta http-equiv="Content-type" content="text/html; charset=iso-8859-1" />


J'aimerais copier le contenu d'un fichier texte LibreOffice Writer (.odt) dans un fichier html et je suis confronté à un problème. Lorsque j'essaie de le faire, j'obtiens le message d'erreur suivant :
 
"Enregistrement impossible de java.io.CharConversionException: Encodage du caractère suivant impossible :
'’' (U+2019) colonne 2 ligne 50 encodé en "iso-8859-1"."
 
Bien sûr, l'erreur ne concerne pas qu'un caractère et est présente tout au long du contenu copié.
Lorsque j'efface les caractères concernés et les réécris manuellement directement dans le fichier html via l'interface de jEdit, cela fonctionne évidemment.
Je suppose donc que le contenu de mon fichier .odt est codé en UTF-8.
Le texte que j'ai à copier est plutôt long et j'aimerais pouvoir l'insérer directement par un copier-coller au lieu d'avoir à le recopier manuellement. Est-ce possible et si oui, comment?
 
J'ai fait une recherche sur le forum sans avoir trouvé de réponse.
 
Merci  :)


 
Sans vouloir rentrer dans des polémiques concernant l'éditeur de code que tu utilises, c'est quand même un drole de choix en 2024... C'est moi qui ait créé le thread jEdit sur ce forum ( https://forum.hardware.fr/hfr/Progr [...] 2641_1.htm )
 
Mais je ne pourrais plus te conseiller cet éditeur en 2024. Si tu veux du gratuit, tu as maintenant Visual Studio Code (qui a un nombre incalculable de plugins et que tu peux parfaitement installer sous Linux). Tu as aussi plein d'autres éditeurs.


---------------
Expert en expertises
Reply

Marsh Posté le 12-07-2024 à 16:20:27    

Salut,
 
Merci Hermes le Messager pour ton message.
 

Citation :

Sans vouloir rentrer dans des polémiques concernant l'éditeur de code que tu utilises, c'est quand même un drole de choix en 2024... C'est moi qui ait créé le thread jEdit sur ce forum ( https://forum.hardware.fr/hfr/Progr [...] 2641_1.htm )
 
Mais je ne pourrais plus te conseiller cet éditeur en 2024. Si tu veux du gratuit, tu as maintenant Visual Studio Code (qui a un nombre incalculable de plugins et que tu peux parfaitement installer sous Linux). Tu as aussi plein d'autres éditeurs.


 
C'est toujours pour la même raison, c'est conseillé dans le livre avec lequel je me suis initié au développement web, et il commence à dater.
Je note ce que tu as écrit.
 
Merci  :)

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed