Complexité d’un correcteur grammatical

ced1er · Janvier 4, 2008, 2:54

J’étais en train de relire un document tapé dans ce bon vieux Word quand je vois la faute :

« Les personnes présentes ont discutés sur ce sujet. »

Word ne m’a pas signalé cette faute, et là je me suis dis ce qu’on se dit sûrement tous :
« Pourquoi est-ce que ce gros nul de Word ne repère pas toute les fautes ? »
(Je tape ce message sous Word 2002, « toute les fautes », ça ne le dérange pas)

Les règles de la grammaire française dont clairement définies. C’est bourré d’exceptions, d’accord, mais ces exceptions sont clairement définies elles aussi.

Ca fait quoi, 15 ans que des mecs bossent sur le correcteur grammatical, et un accord avec l’auxiliaire avoir lui fait perdre les pédales.

Je ne suis pas développeur, et je me doute bien que si c’était si simple ce serait fait depuis longtemps. Mais vraiment j’aimerais savoir :
Quelle est la raison, la difficulté majeure qui fait qu’aujourd’hui encore, aucune appli n’est fichue d’avoir 20/20 à la dictée de Pivot ?

Styx31 · Janvier 4, 2008, 2:58

Ca veut dire que le programme doit simplement « comprendre » ton texte. Un véritable analyseur lexical pour une langue complète c’est des années de boulot.

Exemple pour ton cas : Passé composé => on recherche un COD/COI (qui répond à la question quoi ? qui ?), et on évalue la règle selon s’il est placé avant ou après le verbe. Faire un algorithme capable de répondre à cette question demande que le programme connaisse aussi le sens du verbe.

Tout simplement pas possible, ou pas assez rentable étant donné le nombre de langues/cas à gérer.

Haza · Janvier 4, 2008, 2:59

Les regles du jeu de dames sont extrements simple, plus que bien connus, et pourtant aucun (presque) programme n’est capable de rivaliser avec un être humain ayant un Q/I supérieur a celui de Paris Hilton (donc 99.99% de la population mondiale).

500 milliards de milliards de mouvements possibles, c’est le nombre de combinaisons possible au jeu de dames.

Ok, il n’y en as peut-être pas autant en français, mais il y a des millions de régles a gérer en même temps. Et quand toi tu te sert de ton “oreille” pour trouver défois le bon accord, la bonne terminaison, le programme lui, il ne peux pas.

Ben · Janvier 4, 2008, 3:02

[quote=« ced1er, post:1, topic: 46915 »]J’étais en train de relire un document tapé dans ce bon vieux Word quand je vois la faute :

« Les personnes présentes ont discutés sur ce sujet. »

Word ne m’a pas signalé cette faute, et là je me suis dis ce qu’on se dit sûrement tous :
« Pourquoi est-ce que ce gros nul de Word ne repère pas toute les fautes ? »
(Je tape ce message sous Word 2002, « toute les fautes », ça ne le dérange pas)

Les règles de la grammaire française dont clairement définies. C’est bourré d’exceptions, d’accord, mais ces exceptions sont clairement définies elles aussi.

Ca fait quoi, 15 ans que des mecs bossent sur le correcteur grammatical, et un accord avec l’auxiliaire avoir lui fait perdre les pédales.

Je ne suis pas développeur, et je me doute bien que si c’était si simple ce serait fait depuis longtemps. Mais vraiment j’aimerais savoir :
Quelle est la raison, la difficulté majeure qui fait qu’aujourd’hui encore, aucune appli n’est fichue d’avoir 20/20 à la dictée de Pivot ?[/quote]

C’est un assez gros probleme en faite. En ecole d’ingé, j’ai pris une option intelligence artificielle, et on a bien sur étudier la manipulation du langage naturel.
Et le gros probleme, avec les correcteurs grammaticaux, ne vient pas des regles de grammaire, qui sont effectivement assez simple a « coder ». La difficulté vient de la sémantique. En effet, en fonction du sens, une meme phrase peut etre grammaticalement juste ou fausse. Et c’est toute la difficulté.
Parce que s’il est simple de coder des regles d’accord, faire comprendre a un ordinateur le sens d’une phrase est une autre paire de manche.
Voila en tres gros ou se situe le principal enjeu de la manipulation du langage naturel par ordinateur. En tout cas, c’etait le cas en 97/98, je sais pas ou on en est aujourd’hui.

edit : ouned
edit2 : hazadess : le coup des dames n’a juste rien a voir. Tu parles d’algorithme d’exploration d’arbre. Il y a plein d’autre approche en IA pour gerer un jeu de dame. Et il n’y a pas de millions de regles en francais, et on trouve pas l’accord a l’oreille normalement :crying: Les regles de grammaire sont tres clair, sinon on se foutrait sur la gueule a chaque dictée. Le probleme est vraiment un probleme de semantique, pas de complexité des regles de grammaire.
edit 3 : d’autant que tu as dit une connerie pour les dames. 15 secondes de recherche sous google :

[quote name=’« intelligence artificielle, jeux de dames, échecs, go »’]Les jeux classiques sont un bon terrain d’expérimentation de l’intelligence artificielle:

Dame: dépasse l’homme
Échecs: disons, à égalité
GO: encore très loin de l’homme

En 1999 Chellapilla et Fogel ont conçu des joueurs neuroniques et les ont mis en compétition.
Au départ, 15 réseaux neuroniques. Après 250 générations et sélections des plus doués, le meilleur s’est classé au niveau A du classement de ce jeu, juste après les experts et les maîtres.

Exploit à noter car: le programme tourne sur un PC domestique classique

quelques jours de calculs pour arriver à cette génération performante
aucune entrée de données savante dans le système
L’ordinateur a fabriqué son propre joueur de première catégorie
C’est une première

Janvier 2000
Ce programme n’a pas battu cependant
le programme Cinook (Alberta , Canada)
Le plus grand joueur de tous les temps est Marion Tinsley mort en 1995.

Il a perdu 5 parties dans sa vie
dont 2 contre Chinook en 1992.

Chinook n’a plus de rival.

Nombre de combinaisons possibles
cinq cent millions de millions de millions (5 10 20 );

impossible pour un ordinateur de calculer tous ces coups

Chinook pour les dames anglaises connaît toutes les finales impliquant 8 pièces[/quote]

Leto5 · Janvier 17, 2008, 3:33

Tu parles des dames, fait une recherche sur le Go, question limite de l’intelligence machine… … actuelle