Enfin un robot utile ?

anon28414862 · Avril 16, 2008, 3:21

Andrew Ng, de l’université Stanford, a récemment présenté un robot qui pose les jalons de l’intelligence artificielle : STAIR (pour STanford Articial Intelligence Robot).

Ma bonne Gisèle, me direz-vous, que fait-il de si particulier, ce robot ? Une tâche prépondérante chez l’humain, apogée de l’évolution : il va chercher les agrafeuses ! Si si, sans déconner. Et ce n’est pas tout ! Il peut aussi aller chercher des ciseaux, des tasses de café, et même ranger la vaisselle.

On a déjà vu des robots guider les gens, répondre à des questions basiques, ou même des voitures qui roulent toutes seules en ville (vidéo).

Mais là, c’est différent. Si les participants des DARPA Grand Challenge et Urban Challenge se « contentaient » de la reconnaissance de scène, STAIR combine plusieurs techniques d’apprentissage machine:
[ul]
[li]La création d’environnement 3D à partir d’une seule image. Cette technique a déjà été présentée avec le site Make 3D qui permet à tout un chacun d’uploader ses photos et de voir le résultat.[/li][li]L’apprentissage par renforcement. Un peu comme le dressage d’animaux, on laisse le robot prendre des décisions et on le punit s’il n’a pas choisi la bonne. Andrew Ng n’est pas un novice dans le domaine puisqu’il a appliqué cette technique au contrôle d’hélicoptère avec un succès incontestable. (Attention, c’est 90 Mo. La partie impressionnante est à partir d’1min10s).[/li][li]La reconnaissance d’images. Là, on retombe dans le domaine du DARPA Grand Challenge. STAIR modélise la vision humaine par deux webcams : la première est immobile et sert à voir l’environnement global à faible résolution. La seconde peut bouger et zoomer et regarde les points intéressants en haute résolution.[/li][/ul]
STAIRible, mais quid de l’agrafeuse ? Dans cette vidéo, on peut voir un membre de l’équipe demander à STAIR d’aller la chercher dans son bureau. STAIR possède en mémoire un plan de l’immeuble ainsi que les emplacements des portes. En revanche, il ne sait pas où est placée la poignée et commence donc par inspecter la porte pour la trouver (on peut voir cette vidéo pour découvrir comment il s’adapte à de nouvelles portes). Il parcourt ensuite la pièce pour chercher l’agrafeuse, utilisant les deux webcams susmentionnées.

Et ils cherchent des teSTAIR, ces gens-là ? Bah vi, Stanford a prévu de faire construire 10 STAIR qu’ils vendront à prix coûtant pour accélérer le développement. Pas de détails sur le montant exact, mais il sera « suffisamment raisonnable pour que des labos d’université puissent se l’offrir », dixit Ng.

Peut-être que ce genre de recherche pourra aussi améliorer l’IA des jeux (encore bien trop modélisée par de simples règles, même si l’équipe de Nitro Stunt Racing considère l’utilisation de réseaux de neurones)…

Cafeine · Avril 18, 2008, 10:57

Désolé pour le classement de ta news Genji. Un jour, un PUTAIN DE JOUR, on aura un vrai CMS intégré avec un forum. /cry

Drakulls · Avril 18, 2008, 11:11

super interessante ta news ! en effet , je ne l’avais pas vu…
Sans vouloir se repeter, on se rapproche vraiment des clichés futur/robots évoqués dans les romans et films d’il y a quelques années/décennies…

C’est aussi un peu stressant…

rolyat · Avril 18, 2008, 12:03

[quote=« genji, post:1, topic: 47284 »]Andrew Ng, de l’université Stanford, a récemment présenté un robot qui pose les jalons de l’intelligence artificielle : STAIR (pour STanford Articial Intelligence Robot).
(…)
Peut-être que ce genre de recherche pourra aussi améliorer l’IA des jeux (encore bien trop modélisée par de simples règles, même si l’équipe de Nitro Stunt Racing considère l’utilisation de réseaux de neurones)…[/quote]

Euh… T’es gen(j)til genji, mais ça fait déjà un paquet d’années que les « jalons de l’intelligence artificielle » sont posés hein…

L’air de dire que ce sur quoi j’essaye de bosser, c’est nada :crying:

Et pour ce qui est de l’IA des jeux, c’est pas si simple hein… Cf. le dossier que Gameblog a pondu il y a quelques semaines… Tu vends plus facilement des shaders que de l’IA. Parce que l’IA tu ne la voie pas sur les screenshots… C’est hasbeen les réseaux de neurones… Aujourd’hui, on parle de BDI, Beliefs Decisions et euh… mince… Instict je crois

Disclaimer: quand je dis que les réseaux de neurones c’est hasbeen, je rigole hein, on n’a pas dû utiliser 10% de leurs capacités.

Drealmer · Avril 18, 2008, 12:09

« Excuse me, I believe you have my stapler »

(fallait que quelqu’un la fasse, non ?)

Coldorak · Avril 18, 2008, 12:26

Faut retourner sur Glopnuke

Neomatt · Avril 18, 2008, 12:52

« Toujours aucune nouvelle de ColdFire, 5 jours apres la diffusion de ce commentaire. Certains pistent sont etudiees par la police, comprenant un suicide, car, pour citer l’inspecteur en charge de l’affaire ‹ Non mais puis quoi encore, il cherchait la merde, la ›. Nous vous tiendrons informés si de nouveaux developpements nous arrivent. »

Sinon, cool, un robot qui peut aller chercher les bieres. Voire les decapsuler et les verser sans faux-col.

anon28414862 · Avril 18, 2008, 1:00

[quote=« rolyat, post:4, topic: 47284 »]Euh… T’es gen(j)til genji, mais ça fait déjà un paquet d’années que les « jalons de l’intelligence artificielle » sont posés hein…

L’air de dire que ce sur quoi j’essaye de bosser, c’est nada :crying:[/quote]

Je ne dis pas que c’est rien, mais la majorité des choses que l’on a vues jusqu’à présent n’avaient que peu de choses à voir avec l’intelligence. Les méthodes à noyau, c’est peut-être très joli, mais ça n’a rien d’intelligent. La plupart des gens qui veulent résoudre des problèmes non jouets mettent plein de connaissances a priori dans leur algo.

[quote=« rolyat, post:4, topic: 47284 »]C’est hasbeen les réseaux de neurones… Aujourd’hui, on parle de BDI, Beliefs Decisions et euh… mince… Instict je crois

Disclaimer: quand je dis que les réseaux de neurones c’est hasbeen, je rigole hein, on n’a pas dû utiliser 10% de leurs capacités.[/quote]

Tu veux dire si on oublie:

les réseaux à convolution (Yann Le Cun) qui torchent tout en reconnaissance d’images et qui servent à reconnaître 95% des chèques aux Etats-Unis
les Deep Belief Networks (Geoff Hinton) qui obtiennent les meilleures performances en réduction de dimensionnalité sur du texte et de faire du semantic hashing efficace (en permettant de trouver les documents semblables à un document donné en temps linéaire)
les réseaux utilisés par Ronan Collobert pour le traitement de la langue qui là encore éclatent toutes les autres méthodes
?

Avec la backprop en 83 (Le Cun et Hinton, justement), les gens ont pris les réseaux de neurones pour le Graal en pensant que ça allait résoudre tous leurs problèmes. Ne sachant pas les optimiser, ils se sont cassé les dents et l’arrivée des méthodes à noyau en 92 a détourné plein de gens qui ont été séduit par les garanties qu’elles offraient (et il faut bien reconnaître que ce serait con d’essayer un réseau de neurones avant une SVM sur un problème donné). Maintenant, pour ceux qui prennent le temps de voir comment ça marche, ça donne vraiment des résultats impressionnants. En revanche, on met beaucoup moins facilement de la connaissance a priori qu’avec d’autres algos, donc si tu veux résoudre un problème précis pour dans 10 jours, ne va surtout pas utiliser un réseau de neurones.

Ah, et je ne connais pas les BDI…

Désolé pour la digression, mais j’ai trop entendu de gens dire que les réseaux de neurones étaient morts pour ne pas réagir.

Drealmer · Avril 18, 2008, 1:01

Au fait, je pense que le jeu de mots “STAIRible” devrait valoir à son auteur d’être victime de quelque chose d’extrêmement grave.

anon28414862 · Avril 18, 2008, 1:04

Nan mais j’ai bien vu qu’on préférait les musées aux agrafeuses sur ce site. Pauvre France…

Au fait, je voulais embedder les vidéos Youtube mais je n’ai pas trouvé comment faire. C’est réservé aux admins ou j’ai raté une commande ?

Cafeine · Avril 18, 2008, 1:09

[quote=“genji, post:10, topic: 47284”]Nan mais j’ai bien vu qu’on préférait les musées aux agrafeuses sur ce site. Pauvre France…

Au fait, je voulais embedder les vidéos Youtube mais je n’ai pas trouvé comment faire. C’est réservé aux admins ou j’ai raté une commande ?[/quote]

Nan, l’HTML était pas activé sur ce forum. Et mélanger les deux (BB Code + html) fait une soupe horrible, qui en plus charge à mort la home page. Et puis là c’était pas indispensable du tout. Donc j’ai tout intégré aux liens.

skid · Avril 18, 2008, 1:44

[quote=« Drealmer, post:5, topic: 47284 »]« Excuse me, I believe you have my stapler » :crying:

(fallait que quelqu’un la fasse, non ?)[/quote]

J’ai ri

En tout cas un robot qui fait des choses a ma place j’en revais , me reste plus qu’a trouver celui qui redige les procedures a ma place

rolyat · Avril 18, 2008, 1:57

genji: moi aussi je suis parti au quart de tour, enfin surtout quand j’ai lu ta phrase: « vient de poser les jalons (…) ». Désolé. Ca fait plaisir de voir quelqu’un qui s’y connait en IA (d’autant plus quand on voit ton cursus ). Je continuerai bien en PM si j’ai le temps… un jour…

Je vais essayer de creuser pour le BDI (j’ai découvert ça quand j’ai abordé les agents… encore un truc que l’on a du mal à définir… clairement j’entends).

Sinon pour Ravine qui m’avait demander la référence de l’article de Gameblog, la voici:

Beaux mais cons.

Edit: Genji: du coup tu m’as donné plein de lecture à lire, merci beaucoup :crying:

Ravine · Avril 18, 2008, 2:09

(ah ouais ok, c’est pas récent cet article tout de meme :crying: … « quelques semaines », 52 semaines, 1 an quoi Merci bieng)

rolyat · Avril 18, 2008, 2:31

Oops… Oui, quelques semaines hein… j’ai pas donné d’ordre de grandeur

Azhag · Avril 18, 2008, 3:56

Yeah plein de lecture pour moi aussi, merci de citer les mecs qui publient, c’est cool

Sinon pour le robot lui-même, je trouve ça marrant mais pas si révolutionnaire (comme d’hab). Je trouve la recherche d’agraffeuse bien intéressante, avec les deux sources possibles, c’est pas mal comme décomposition forcée du problème

Ah et dire « noyau » à la place de Kernel comme tout le monde, désolé c’est bizarre :crying:

Et sinon les trucs les plus « intelligents » qu’on arrive à faire, à mon avis, c’est toutes les réductions de dimensionalités. Ca touche à la définition de ce qu’est un concept, ce qui définit qqch, et du coup t’as l’air bien con quand tu dois expliquer que « l’algo a trouvé ces concepts-là comme les plus importants, mais je dois dire que je comprends pas pourquoi », tout ça parce que l’être humain à des notions à-priori sur les concepts qu’il faut utiliser…
Et les réseaux de neurone, c’est trop bien, mais ça serait vachement mieux si on arrivait à pouvoir analyser leurs composants (genre pouvoir dire: « ok ce sous-ensemble là s’occupe de reconnaitre tel truc »).

anon28414862 · Avril 18, 2008, 4:13

Ah bah merde, moi qui me suis forcé à traduire en pensant que c’était le terme enseigné en France…

Tu peux assez bien le faire pour la première couche en regardant les poids des connexions. En reconnaissances d’images, tu obtiens assez souvent des filtres de Gabor (un exemple ici). Pour les couches supérieures, c’est en effet plus compliqué. Je pense toutefois que l’on pourrait déterminer la sous-tâche qui est effectuée, mais que personne ne veut le faire parce que ça n’aurait aucun rapport avec les sous-tâches « intuitives » que l’humain effectue.

Pour ce genre de choses, on peut aussi regarder les travaux de Mike Lewicki et Bruno Olshausen.

Azhag · Avril 18, 2008, 4:32

[quote=« genji, post:17, topic: 47284 »]Ah bah merde, moi qui me suis forcé à traduire en pensant que c’était le terme enseigné en France…

Tu peux assez bien le faire pour la première couche en regardant les poids des connexions. En reconnaissances d’images, tu obtiens assez souvent des filtres de Gabor (un exemple ici). Pour les couches supérieures, c’est en effet plus compliqué.[/quote]
Yep je pensais justement à ça. Ca marche bien pour les images, mais pour d’autres applications c’est moins facile.

[quote]Je pense toutefois que l’on pourrait déterminer la sous-tâche qui est effectuée, mais que personne ne veut le faire parce que ça n’aurait aucun rapport avec les sous-tâches « intuitives » que l’humain effectue.

Pour ce genre de choses, on peut aussi regarder les travaux de Mike Lewicki et Bruno Olshausen.[/quote]
C’est justement là qu’il y a qqch à approfondir à mon avis: et si justement les sous-tâches coïncidaient ? Pouvoir discuter sur la décomposition du problème par un humain et par celle d’un agent artificiel me semble justement intéressant (quels critères de décomposition, pour optimiser quoi, sous quelles contraintes, etc).
Mais bon c’est un peu mon intérêt personnel aussi (relations biologie <-> informatique)

Je jetterai un oeil sur les travaux que tu cites, merci bien.

piaz · Avril 18, 2008, 6:56

Ouais, s’il déconne il l’envoie au coin.
Oh, ça va, c’était pour détendre… Sinon, chouette news, STAIRéssant.
…
Désolé

SuperLegume · Avril 19, 2008, 2:50

Ouais, mais, aller chercher les agrafeuses, c’est le boulot d’une secrétaire. Et on sait tous que JAMAIS un robot ne pourra chuchoter “oh, monsieur le directeur, mais qu’est que vous faites ?”.

(enfin, on sait jamais)