Extraire du texte "Highlited" (surbrillance) d'un fichier texte

Extraire du texte "Highlited" (surbrillance) d'un fichier texte - Divers - Linux et OS Alternatifs

Marsh Posté le 25-03-2008 à 14:51:17    

Bonjour,
 
j'ai un ensemble de fichiers contenants du texte "Highlited" (en sur-brillance) dont je souhaite extraie le contenu au format texte pur.
 
 
Que puis-je utiliser et éventuellement comment ?
 
Je suis sur une Gnu/Linux Sarge
 
Merci. [:romf]


Message édité par Profil supprimé le 25-03-2008 à 14:51:56
Reply

Marsh Posté le 25-03-2008 à 14:51:17   

Reply

Marsh Posté le 25-03-2008 à 14:53:00    

Tu as un fichier texte avec du texte en surbrillance, tu as des codes ASCII qui font en sorte qu'ils sont surbrillant ? :heink:
c'est à dire ?

Message cité 1 fois
Message édité par o'gure le 25-03-2008 à 14:53:23

---------------
Relax. Take a deep breath !
Reply

Marsh Posté le 25-03-2008 à 14:57:08    

o'gure a écrit :

Tu as un fichier texte avec du texte en surbrillance, tu as des codes ASCII qui font en sorte qu'ils sont surbrillant ? :heink:
c'est à dire ?


y'a un "système" qui permet de faire ressortir du texte dans un fichier ASCII:
 
*bla* : gras
_bla_ : souligné
/bla/ : italique
etc ...
 
Il parle p'tet de ça [:mrbrelle]


---------------
Wedge#2487 @HS -#- PW: +∞ -#- Khaz-Modan/Boltiz @WoW
Reply

Marsh Posté le 25-03-2008 à 14:58:31    

Merci o'gure !
 
 
Lorsque je lis le fichier avec less, du text apparaît en sur-brillance...
 
J'ai des séquence de caractère du genre  


*^H**^H**^H**^H**^H**^H* L^HL^*^H**^H**^H**^H**^H**^H*


pour mettre un L en surbrillance

Reply

Marsh Posté le 25-03-2008 à 15:01:04    

Tu peux nous dire ce que donne

file ton_fichier.txt


ou ton_fichier.txt est le nom du fichier que tu veux regarder :jap:


---------------
Wedge#2487 @HS -#- PW: +∞ -#- Khaz-Modan/Boltiz @WoW
Reply

Marsh Posté le 25-03-2008 à 15:02:47    


 
 
 
Non, c'est pas ça ...
En faite la ligne ci-dessus est ****** L ******

Reply

Marsh Posté le 25-03-2008 à 15:03:34    

wedgeant a écrit :

Tu peux nous dire ce que donne

file ton_fichier.txt


ou ton_fichier.txt est le nom du fichier que tu veux regarder :jap:


 
 
ISO-8859 text, with overstriking
 
exactly (désolé)


Message édité par Profil supprimé le 25-03-2008 à 15:07:32
Reply

Marsh Posté le 25-03-2008 à 15:05:27    

Ok, donc tu veux supprimer les "*" qui sont autour du "L", c'est bien ça ?
Tu pourrais faire un copier/coller d'un bout de ton fichier stp ?


---------------
Wedge#2487 @HS -#- PW: +∞ -#- Khaz-Modan/Boltiz @WoW
Reply

Marsh Posté le 25-03-2008 à 15:10:29    

wedgeant a écrit :

Ok, donc tu veux supprimer les "*" qui sont autour du "L", c'est bien ça ?
Tu pourrais faire un copier/coller d'un bout de ton fichier stp ?


 
 
Non, je souhaite suprimé les ^?H ou ? est le caractère en surbrillance. en gros, je ne connais pas le codage du fichier en fait
 
quel est le caratère ^ en réalité ?
 
La première ligne du fichier brut de passage page le web  
 


************ LLiivvrree ddee llaa GGeennèèssee ************

Reply

Marsh Posté le 25-03-2008 à 15:11:42    

Le caractère dans les cadre semble être de '0008'

Reply

Marsh Posté le 25-03-2008 à 15:11:42   

Reply

Marsh Posté le 25-03-2008 à 15:12:55    

hexedit et hexdump devrait de donner les codes hexa.


---------------
Relax. Take a deep breath !
Reply

Marsh Posté le 25-03-2008 à 15:15:52    

ça ressemble à un fichier au format dos ça :/


---------------
Wedge#2487 @HS -#- PW: +∞ -#- Khaz-Modan/Boltiz @WoW
Reply

Marsh Posté le 25-03-2008 à 15:20:14    

wedgeant a écrit :

ça ressemble à un fichier au format dos ça :/


 
Avec html2text version 1.3.2a

Reply

Marsh Posté le 25-03-2008 à 15:28:45    

Yep !
 
Je vais utiliser l'option -nobs de html2text.
 
 
Désolé pour le dérangement [:dawa]

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed