Nettoyeur de PDF

Nettoyeur de PDF - Logiciels - Windows & Software

Marsh Posté le 30-09-2015 à 01:59:29    

Bonjour à tous, je voudrais savoir si vous connaissez un nettoyeur de PDF. Je m'explique:
J'ai un fichier PDF de 750 pages, que son créateur a constitué à partir d'images (Scan de pages d'un livre presque introuvable datant de 1830 qui n'a jamais été réédité). La qualité du scan est très bonne et donnerait un résultat parfait en impression couleur. Mais voilà, 700 pages en couleur, le mieux que j'ai trouvé, c'est 150 euros en qualité optimale par une boutique d'impression sur paris. L'édition à la demande il faut pas y penser, c'est automatisé, donc ils feront pas du bon boulot.
 
Je suis donc condamné au noir et blanc.
Pour ça j'ai une bonne grosse xerox qui en a dans le ventre :jap: , mais comme il s'agit de fichiers images compilés dans un PDF, et que la moitié est en cyrillique ancien, et bien on voit assez mal (bruit), et ce n'est pas agréable. Le bouquin scanné est vieux donc jauni, et le jaune en impression noir et blanc, bah ça donne du brouillard gris :pfff:  
 
Du coup il me faut un logiciel qui me nettoie mon PDF correctement et d'un seul coup parce que je ne peux pas passer 6 semaines à traiter chaque page. En ce moment j'essaye d'extraire les images, pour ensuite les traiter en lot, donc j'explore aussi la piste du logiciel photo, même si je ne sais pas non plus là encore quel logiciel utiliser. Donc soit logiciel de traitement d'un gros pdf (400mb) d'un seul coup, soit traitement en un coup (ou en plusieurs si ça bloque niveau mémoire) d'un lot de 700 images.
 
Voilà. N’hésitez pas si vous avez des conseils, je pense aussi que ça servira à d'autres et vous gagnerez toute mon estime :jap:

Reply

Marsh Posté le 30-09-2015 à 01:59:29   

Reply

Marsh Posté le 02-10-2015 à 04:04:53    

Personne n'a jamais essayé d'optimiser un scan de texte couleur pour l'imprimer correctement en noir et blanc?
 
J'ai progréssé, j'ai réussi à décomposer le fichier PDF (sans perte je crois) en 700 images avec un logiciel du nom de Nitro pro 9.5.1.5, et je sais maintenant comment faire un traitement par lot avec une version recente de photoshop. Il me reste à savoir comment l'on fait pour optimiser un scan couleur d'un texte en vu de son impression sur une imprimante laser noir et blanc.
 
Je vais ouvrir un nouveau sujet puisqu'il s'agit d'une question sensiblement differente. Mais je suis toujours partant si vous avez une solution clefs en main (façon de parler) pour nettoyer un PDF couleur de haute qualité en vue d'une impreesion n&b.
 
Je suis assez dégouté quand je vois les scans de livres d'anciens effectués par la firme Google (Google books), ou par la BNF. C'est toujours crado.
L'idéal serait évidement un OCR (reconnaissance de texte) mais ce n'est pas au point pour reconnaitre du cyrillique du début du XIXème siecle, d'après ce que j'ai vu il faut entrainer le moteur de reconnaissance puis corriger les nombreuses erreurs ligne par ligne, page par page:
http://bdinski.obdurodon.org/ocr-procedure.html (La c'est du slavon, mais j'imagine que je rencontrerai les mêmes difficultés)
Un travail d'éditeur en somme...
 
L'avantage de l'OCR est qu'on a suprimé le fond et que l'on a plus une image mais des polices de caractère programées toutes lisses impécables à l'impression :love: Les imprimantes gèrent très bien les polices, mais les textes sous forme d'image sont reproduits de manière excecrable.

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed