Reconnaissance de texte et récupération automatisée?

Salut à la fine fleur de la geekerie mondiale !

J’ai un problème, et mes google skills ne m’ont pas aidé terriblement, je ne suis d’ailleurs même pas sur qu’une solution telle que je l’envisage existe.

J’aimerais, à partir d’une capture d’écran, qui comporterait moult images et un peu de texte dans des endroits spécifiques, extraire ces bribes de texte, et en fonction de leur position, les insérer dans un tableur quelconque.

Pour préciser, imaginez que j’ai un genre de pokédex, je fais une capture de ma page où apparaissent mes pokemons, et je voudrais que le programme miracle que je cherche, puisse « lire » leur nom, leur niveau et leurs points de vie, par exemple, et puisse les importer directement dans ma feuille google spreadsheet or whatever, avec dans une colonne leur nom, et dans les autres en face, les infos récoltées.
C’est pas tout à fait ça, mais ça résume bien.

Pensez vous que ce soit possible ? Avec quel(s) soft(s) ? Il y en a pas mal qui remontent pour transformer une image d’un document scanné en pdf ou texte, mais j’ai pas tout à fait envie de les tester tous un à un avec mon besoin spécifique. Je me disais que vous auriez surement un avis, une recommandation, voire, comme je vous connais, une manière détournée de ne pas résoudre mon problème :wink:

Ma première recherche DDG à base de « ocr on specific area » me retourne ceci qui semble correspondre https://docparser.com/blog/zonal-ocr/

Je ne sais pas si tu veux/peux développer un truc toi même, mais ici : https://ironsoftware.com/csharp/ocr/ ils ont l’air d’avoir une lib qui fait ce que tu veux. En C#.

1 J'aime

Ça semble pas mal effectivement, je vais tester ça. Merci !

Bon, c’était prometteur mais la reconnaissance de caractères ne fonctionne pas sur mes images/pdf, certains textes sont superposés aux images, j’imagine que c’est ça qui bloque. Je vais continuer à chercher.

Edit : Du coup, j’essaie pour voir plusieurs « free ocr » proposés par google, c’est la cata. Quelques rares parties de texte reconnues, mais rien d’exploitable, les chiffres encore moins… :confused:

T’as plus qu’à utiliser tensor flow ou fastai pour te faire ton réseau de neurones :rofl:

Gaffe à ce que t’installes, c’est un peu la fête des malware ce genre de soft.

Yes, pour l’instant je n’ai testé que des trucs en ligne. J’en ai trouvé un qui faisait le taf niveau reconnaissance, à peu près, mais après pour récupérer les infos, trop de boulot pour automatiser, puisque j’avais un bloc de texte. Tant pis, je continuerais à la main je pense.

T’as maté cote AWS? https://aws.amazon.com/textract/?nc=sn&loc=2&dn=10
Et autre services de AI/ML pour des usages spécifiques? C’est « fait pour » automatiser, mais c’est orienté developeur.

Non, je ne connaissais pas du tout. Je vais me renseigner. Même si pour faire ma connerie, c’est peut être overkill ^^

Edit : Créer un compte AWS, puis demander une inscription à un service pro (adresse pro, type d’usage pro), c’est effectivement too much pour mes bricoles.

Moi j’ai un compte perso a la maison pour les DNS/etc, ca mange pas de pain :slight_smile: pour tester ca peut etre sympa, surtout que: