compression de texte : algo efficace même sur peu de données

compression de texte : algo efficace même sur peu de données - Algo - Programmation

Marsh Posté le 28-07-2004 à 00:26:41    

plop. je cherche un algo pour compresser du texte uniquement (du code, donc de l'ascii pur). Mais je cherche un algo efficace même sur un petit volume (typiquement < 1Ko, voir beaucoup plus petit), je me demande si Huffman n'irait pas ... si vous avez des idées

Reply

Marsh Posté le 28-07-2004 à 00:26:41   

Reply

Marsh Posté le 28-07-2004 à 00:27:53    

Taz a écrit :

plop. je cherche un algo pour compresser du texte uniquement (du code, donc de l'ascii pur). Mais je cherche un algo efficace même sur un petit volume (typiquement < 1Ko, voir beaucoup plus petit), je me demande si Huffman n'irait pas ... si vous avez des idées


 
non, il ne répond pas a tes attentes


---------------
from here and there -- \o__________________________________ -- la révolution de la terre, en silence
Reply

Marsh Posté le 28-07-2004 à 00:47:51    

Taz > c'est un truc style pleins de petits fichiers du même type ?  
 
tu peux pas faire un alphabet quelconque dont les tables de convertion sont dans les clients ?


---------------
trainoo.com, c'est fini
Reply

Marsh Posté le 28-07-2004 à 00:49:09    

pourquoi ? je stocke du code, ma table est prédéfinie (code en anglais), j'ai 63 caractères différents d'ailleurs

Reply

Marsh Posté le 28-07-2004 à 00:56:29    

bon, bah roule, tu peux peut-être même tenter un Huffman sur moins d'un octet.


---------------
trainoo.com, c'est fini
Reply

Marsh Posté le 28-07-2004 à 01:19:53    

bah je vais tenter Huffman de toutes façons

Reply

Marsh Posté le 28-07-2004 à 05:12:41    

Pour compresser des données perso,
J'utilisais une fenetre glissante.  
 
L'avantage c'est qu'il n'y a aucun charge fixe et que c'est très rapide à compresser et à décompresser. Par contre c'est probablement moins efficace qu'un huffman générique.
 
Ceci dit c'était des données très spécifiques dont je savais à l'avance qu'elles se compresserait bien avec cet algo. (un peu comme quand tu fais du RLE).

Reply

Marsh Posté le 28-07-2004 à 08:03:58    

en fait, voilà l'application que je fais. actuellement, je génère des signatures avec du md. seulement dans pas mal de cas, les données sont de taille du même ordre que l'empreinte. et moi ce qui me rendrait service, c'est justement d'avoir la donnée, mais sans rajouter d'octet

Reply

Marsh Posté le 28-07-2004 à 08:39:53    

Google me donne un bon site : http://datacompression.info/
 
Si tu n'as pas de contraintes CPU tu peux p-ê essayer le codage arithmétique, qui est plus efficace qu'Huffman.
 
Sinon, dans le temps, j'avais implémenté un Huffman canonique (http://www.compressconsult.com/huffman/),  une ruse qui permet d'éviter d'avoir à stocker la table de correspondances.  
Et Huffman adaptatif (la méthode de la fenêtre glissante) est généralement nettement plus efficace qu'Huffman tout court. Je ne sais pas s'il est possible de faire un Huffman canonique adaptatif.


Message édité par el muchacho le 28-07-2004 à 08:46:49

---------------
Les aéroports où il fait bon attendre, voila un topic qu'il est bien
Reply

Marsh Posté le 28-07-2004 à 08:51:22    

ok, je vais regarder tout ça au boulot, merci (mais c'est pas pour le boulot n'est-ce pas:;)

Reply

Marsh Posté le 28-07-2004 à 08:51:22   

Reply

Marsh Posté le 28-07-2004 à 08:54:26    

pour l'adaptif > ça va pas me servir à grand chose vu que j'ai (très) peu de données

Reply

Marsh Posté le 28-07-2004 à 08:57:19    

Oui, l'adaptatif n'est utile que pour les grands textes.


---------------
Les aéroports où il fait bon attendre, voila un topic qu'il est bien
Reply

Marsh Posté le 31-07-2004 à 19:50:07    

Taz a écrit :

ma table est prédéfinie


 
Je vois pas ce que fait la méthode adaptative dans ce topic !

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed