Acrobat : compression des images pour la création d'un PDF ?

Acrobat : compression des images pour la création d'un PDF ? - Logiciels - Windows & Software

Marsh Posté le 19-05-2010 à 11:29:49    

Bonjour,
 
Je cherche à comprendre comment les sites tels que Gallica ou Google Books parviennent à proposer des fichiers PDF de qualité et qui prennent peu de place (plus de 300 pages pour moins de 8 Mo, par exemple, pour des images de livres).
 
En fait, j'ai extrait une page d'un de ces PDF. En PDF, cette page fait 41,5 Ko. Mais une fois extraite dans Photoshop, je vois qu'elle une résolution de 300 ppp et une définition de 1159*1967, soit une taille de 201 Ko en JPG.
 
Bref, comment faire pour passer de 201 Ko à 41 Ko sans sacrifier la qualité ? Je ne trouve pas d'option pour compresser l'image lors de la création d'un PDF...
 
Merci.

Reply

Marsh Posté le 19-05-2010 à 11:29:49   

Reply

Marsh Posté le 19-05-2010 à 12:11:30    

Gallica compresse ses pages par la méthode ccitt fax group 3.
 
C'est une méthode utilisée pour les fax. C'est une compression sans perte contrairement au jpeg.
 
C'est une méthode assez performante, à condition que les images soient bicolores (noir et blanc), et qu'une couleur soit assez fortement dominante (le blanc entre les pixels noirs des caractères).
 
L'algorithme (qu'il ma fallu plusieurs semaines pour bien comprendre), est basé sur du rle pour la première ligne du document, puis sur les décalages entre la ligne en cours et la ligne précédente. On appelle cela de la compression bi-directionnelle (contrairement à la compression uni-directionnelle utilisée antérieurement pour les anciens fax).
 
Google books utilise la méthode de compression flatdecode, autrement dit celle du zlib, que l'on retrouve par exemple dans les images png. C'est assez performant, peut-être même plus que le ccitt fax 3, bien que cela le soit moins que le pkzip, par exemple.
 
Mais les différences des ratios de compression entre les différentes méthodes ne sont pas très importantes. Ce qui compte surtout est d'avoir un seul bit par pixel, car on utilise le noir et blanc, au lieu de 24 bits par pixel comme c'est souvent (pas obligatoirement) le cas en jpeg, qui est souvent configuré pour une compression couleur (alors qu'il peut aussi faire une compression noir et blanc).


Message édité par olivthill le 19-05-2010 à 12:19:03
Reply

Marsh Posté le 19-05-2010 à 12:42:04    

Génial, merci beaucoup pour cette réponse rapide et très précise ! Est-ce que les méthodes de compression dont tu parles sont gratuites ou intégrées à des logiciels ?...
 
C'est-à-dire, concrètement, comment puis-je faire pour créer un fichier PDF léger à partir d'images noir et blanc en utilisant "ccitt fax group" ou "flatdecode" ? Je dois partir de quel format d'image, etc. ?
 
Ce qui m'étonne, c'est que dans l'exemple que j'avais pris, l'image n'est pas en N&B, le fond est coloré mais semble tout lisse, non-pixelisé, en tout cas quand on zoome fortement dessus : http://img10.hostingpics.net/thumbs/mini_827339Pages_de_187...jpg


Message édité par lux_perpetua le 19-05-2010 à 12:52:37
Reply

Marsh Posté le 19-05-2010 à 13:32:35    

L'algorithme de zlib (appelé flatdecode par Adobe) est supposé libre, bien qu'il ne soit pas très facile de trouver des explications détaillés sur son fonctionnement. Chercher zlib dans Google.
 
L'algorithme du ccitt fax group 3 est public. Par exemple, je l'ai trouvé dans un livre à la bibliothèque de la cité des sciences de la Villette. Mais c'est un algorithme qui n'est presque plus utilisé, mis à part, par Gallica (le Gallica que je fréquentais autrefois, avant la "nouvelle version", et je ne sais pas s'il y a eu des changements avec le nouveau Gallica pour la compression).
 
L'image en exemple me semble provenir de Google books. Si je me souviens bien, Google books utilise en réalité deux images par page, une en noir et blanc pour le texte, et une autre en couleur pour le fond (qui change d'une page à l'autre). L'effet de pixellisation est peut-être diminué par le viewer de PDF, si celui-ci fait de l'anti-aliasing.

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed