[OCR] Plug-in OCR pour Acrobat (ou autre PDF Reader)

Salut les geeks !

Je dois pour le boulot éplucher un paquet de gros PDF constitués de copies papier typographiées numérisées (en gros, des scans de documents) pour y pêcher des informations diverses … seulement voilà, autant quand il s’agit de prendre des chiffres ici et là dans un tableau, ça va, autant quand j’ai plusieurs paragraphes de texte à repomper, je me sens un peu con.

Donc, un plug-in de reconnaissance de caractères pour Acrobat Reader me sauverait d’un travail de moine copiste (la robe de bure et la tonsure me vont moyen, n’est pas Sean Connery qui veut) et augmenterait ma productivité de ouatmille% (selon une étude très poussée)

Il existe des trucs de ce genre dans le domaine du gratuit (je rêve un peu) ? Et dans le payant, qu’est-ce qui fonctionne à peu près bien ?

La simple fonction Save as Text de Reader ne te suffit pas?
Sinon, des PDF to Doc, il y en a des tas, masi souvent ils t’exportent le texte sous forme d’images collées dans un document word :confused:

Non, justement, le document source est simplement scanné, mais sans OCR, donc le « save as text » ne me donne rien B)

Compte tenu du bordel du format pdf, a mon avis , le plus simple est de convertir tes pdf en tiff (multipage) et de lancer un OCR (omnipage, par exemple) qui va te générer un pdf avec texte (ou un rtf).

Pdf encapsulant les bitmaps, je pense qu’un plug in agira de meme

T’as combien de documents ?
C’est pour une fois ou c’est pour monter un processus en production ?

[quote=“ElRed, post:4, topic: 32855”]T’as combien de documents ?
C’est pour une fois ou c’est pour monter un processus en production ?[/quote]

Je vais avoir près d’une centaine de docs comme ça, dans lesquels je devrai récupérer à chaque fois quelques paragraphes (10 minutes de copie à chaque fois, grosso modo).

EDIT : Je suis en train de prendre la version démo d’Omnipage 15, elle avale directement les PDF (la coquine) et fonctionne pendant 15 jours … j’espère que ça suffira B)

si tu as la possibilité, je te conseille de prendre FineReader (8 pro) qui est un cran au dessus d’omnipage et est aussi pdf proof.

On vient de me le conseiller par mail justement B)

Néanmoins, je viens d’essayer Omnipage, que j’avais pas installé depuis 5/6 ans, et pour l’instant ça me convertit mes PDF en Word NICKEL, mise en page respectée et tout … donc je vais rester dessus pour le moment.