Reconnaissance de texte et récupération automatisée?

Great_Hebus_Man · Septembre 25, 2019, 11:51

Salut à la fine fleur de la geekerie mondiale !

J’ai un problème, et mes google skills ne m’ont pas aidé terriblement, je ne suis d’ailleurs même pas sur qu’une solution telle que je l’envisage existe.

J’aimerais, à partir d’une capture d’écran, qui comporterait moult images et un peu de texte dans des endroits spécifiques, extraire ces bribes de texte, et en fonction de leur position, les insérer dans un tableur quelconque.

Pour préciser, imaginez que j’ai un genre de pokédex, je fais une capture de ma page où apparaissent mes pokemons, et je voudrais que le programme miracle que je cherche, puisse « lire » leur nom, leur niveau et leurs points de vie, par exemple, et puisse les importer directement dans ma feuille google spreadsheet or whatever, avec dans une colonne leur nom, et dans les autres en face, les infos récoltées.
C’est pas tout à fait ça, mais ça résume bien.

Pensez vous que ce soit possible ? Avec quel(s) soft(s) ? Il y en a pas mal qui remontent pour transformer une image d’un document scanné en pdf ou texte, mais j’ai pas tout à fait envie de les tester tous un à un avec mon besoin spécifique. Je me disais que vous auriez surement un avis, une recommandation, voire, comme je vous connais, une manière détournée de ne pas résoudre mon problème

vylsain · Septembre 25, 2019, 12:32

Ma première recherche DDG à base de « ocr on specific area » me retourne ceci qui semble correspondre https://docparser.com/blog/zonal-ocr/

Je ne sais pas si tu veux/peux développer un truc toi même, mais ici : https://ironsoftware.com/csharp/ocr/ ils ont l’air d’avoir une lib qui fait ce que tu veux. En C#.

Great_Hebus_Man · Septembre 25, 2019, 1:54

Ça semble pas mal effectivement, je vais tester ça. Merci !

Great_Hebus_Man · Septembre 25, 2019, 2:22

Bon, c’était prometteur mais la reconnaissance de caractères ne fonctionne pas sur mes images/pdf, certains textes sont superposés aux images, j’imagine que c’est ça qui bloque. Je vais continuer à chercher.

Edit : Du coup, j’essaie pour voir plusieurs « free ocr » proposés par google, c’est la cata. Quelques rares parties de texte reconnues, mais rien d’exploitable, les chiffres encore moins…

Ewi · Septembre 25, 2019, 2:47

T’as plus qu’à utiliser tensor flow ou fastai pour te faire ton réseau de neurones

kaneloon · Septembre 25, 2019, 7:50

Gaffe à ce que t’installes, c’est un peu la fête des malware ce genre de soft.

Great_Hebus_Man · Septembre 26, 2019, 8:02

Yes, pour l’instant je n’ai testé que des trucs en ligne. J’en ai trouvé un qui faisait le taf niveau reconnaissance, à peu près, mais après pour récupérer les infos, trop de boulot pour automatiser, puisque j’avais un bloc de texte. Tant pis, je continuerais à la main je pense.

GloP · Septembre 27, 2019, 7:03

T’as maté cote AWS? https://aws.amazon.com/textract/?nc=sn&loc=2&dn=10
Et autre services de AI/ML pour des usages spécifiques? C’est « fait pour » automatiser, mais c’est orienté developeur.

Great_Hebus_Man · Septembre 27, 2019, 10:19

Non, je ne connaissais pas du tout. Je vais me renseigner. Même si pour faire ma connerie, c’est peut être overkill ^^

Edit : Créer un compte AWS, puis demander une inscription à un service pro (adresse pro, type d’usage pro), c’est effectivement too much pour mes bricoles.

GloP · Septembre 28, 2019, 5:26

Moi j’ai un compte perso a la maison pour les DNS/etc, ca mange pas de pain pour tester ca peut etre sympa, surtout que: