Océriser pdf en ligne de commande

Océriser pdf en ligne de commande - Logiciels - Windows & Software

Marsh Posté le 10-10-2017 à 12:04:08    

Bonjour,
 
  Je cherche à automatiser l'océrisation de mes PDF scannés. Pour les non scannés je peux récupérer le text avec pdftotext.
  J'ai tester quelques logiciel dont PDFXchange ou tesseract mais pour le 1er je ne trouve pas de ligne de commande pour océriser mon pdf et le second demande des images donc je devrais en plus convertir mon PDF en plusieurs image et lancer la commande :

Code :
  1. "C:\Program Files (x86)\Tesseract-OCR\tesseract.exe" "01.jpg" output.txt


 
  Il me faudrait un outil qui océrise le PDF (= génère le texte directement dans le fichier) pour ensuite récupérer le texte avec pdftotext
 
  Un outil compatible à Windows voire Linux car je ne sais pas encore si j'aurai besoin de l'installer sur mon hébergement OVH. Gratuit/libre ou pas trop cher.
 
Merci par avance.

Reply

Marsh Posté le 10-10-2017 à 12:04:08   

Reply

Marsh Posté le 10-10-2017 à 13:00:06    

Je ne vais pas pouvoir t'aider, mais fais gaffe aux droits sur les documents pdf ...
tu n'as pas forcément le droit de faire ce que tu cherches à faire.


---------------
#TeamNoBidouille || Come to the Dark Side, we have cookies || Mangez 5 fruits et légumes par an ! || Le digital, c'est les doigts
Reply

Marsh Posté le 10-10-2017 à 14:13:00    

Bonjour,
 
  Il s'agit de courriers numérisés. Le but est d’auto-indexé mes documents donc je pense qu'il n'y a pas de soucis de droits, non ?


Message édité par snike le 11-10-2017 à 11:10:35
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed