Bon, j’ai regardé le documentaire et je l’ai trouvé problématique. Il y a notamment deux points qui sont occultés et qui changent complètement les conclusions. Il ne dit rien de clairement faux mais je pense qu’il est trompeur.
Premièrement, il y a une surestimation immense, et c’est répandu aussi dans les médias, des capacités des systèmes d’IA. Il y a de l’emballement car certains succès récents ont été marquants mais il ne faut oublier, ni le spectre limité des tâches où une IA est aujourd’hui compétente, ni le travail humain qui a été mis en oeuvre pour arriver à ce résultat. Quelques exemples:
- Beaucoup d’articles mentionnent le fait que les réseaux à convolution arrivent à dépasser les humains en reconnaissance d’images. D’une part, ces systèmes ont appris sur des millions d’images pour lesquels la bonne réponse était donnée, bien plus que ce dont aucun humain a besoin. Deuxièmement, la performance est mesurée sur des images extrêmement similaires aux images utilisées pour entraîner le modèle. Un article de 2011 s’est amusé à tester des réseaux à convolution appris sur un jeu de données d’images pour le tester sur un autre, a priori similaire (mêmes objects, les tailles ont été normalisées, etc.) Les performances sont bien moins bonnes.
- Le premier article sur les réseaux à convolution remonte à 1989. De loin, on ne voit aucune différence entre l’architecture de cette époque et celle utilisée aujourd’hui. Quand on regarde dans les détails, on se rend compte que l’architecture utilisée pour la reconnaissance d’images n’est pas la même que pour la reconnaissance de chiffres, quand bien même les problèmes seraient similaires. Il y a aujourd’hui un paquet de labos qui bossent sur l’IA pour la langue naturelle et on est encore loin du compte.
- On est en train d’atteindre un mur. Comme dit plus haut (et dans mon autre post sur le sujet), toutes les avancées reposent sur l’existence de gigantesques bases de données pour lesquelles on a la bonne réponse. Je ne pense pas que la taille de ces bases va pouvoir maintenir la croissance qu’elle a eue Si on prend FB, par exemple, le nombre d’images dépend du nombre d’utilisateurs. A moins de contact extraterrestre, ce nombre devrait se stabiliser. On ne sait pas aujourd’hui comment utiliser des données pour lesquelles on ne connaît pas la réponse. On y arrivera un jour mais on ne sait pas quand. De plus, tout comme les réseaux à convolution ont mis 25 ans à être largement utilisés, il faudra du temps pour mettre à profit notre nouvelle utilisation des données.
- Il parle de la voiture autonome (de manière amusante, il montre des voitures avec un LIDAR qui n’est a priori pas la techno qui va se répandre) en parlant de millions de kilomètres, mais ces kilomètres ont été parcourus dans des directions précises. On est encore loin aujourd’hui d’une voiture autonome qui aurait la même versatilité qu’un humain. Je vais y revenir à la fin.
Deuxièmement, et c’est un argument plus économique et politique, il présente le remplacement d’humains par des robots comme une catastrophe. Supposons que demain, 45% (comme il le dit) des emplois soient parfaitement remplis par des robots. C’est donc qu’on a généré la même valeur qu’auparavant avec 45% de travailleurs en moins. C’est une nouvelle fantastique, à une condition: que cela profite à tous. Or, aujourd’hui, on est encore dans un mode de pensée où le revenu est associé au travail. Dans ce mode-là, effectivement, l’arrivée de robots est problématique. Si, en revanche, on décorrèle les deux, alors le tableau est beaucoup moins sombre. Bien sûr, il y a énormément de points à résoudre, économiques comme politiques, pour arriver à un changement de paradigme. Mais, si on y repense, la révolution industrielle n’a pas fait que faire évoluer les emplois. Elle nous a aussi permis de travailler moins.
Maintenant, j’aimerais revenir plus en profondeur sur le point que je mentionnais pour les voitures. Il faut savoir qu’aujourd’hui, la publication scientifique et l’adoption de nouvelles méthodes se fait par la mesure de la performance. Si vous lisez un article, vous verrez que l’algorithme X fait en moyenne 4% d’erreur alors que Y faisait 5%, donc X est mieux. Sauf que personne ne dit ce que signifie “en moyenne”. Pour moi, l’intelligence est la capacité à agir de manière adaptée dans les situations qui se présentent. Sauf que, en tant qu’humain, les situations qui se présentent sont le résultat d’une nécessité (je dois conduire de nuit sous la neige pour amener mon bébé à l’hôpital) et d’un choix (je vais attendre qu’il fasse beau pour partir en vacances en voiture). Pour les algorithmes, la moyenne calculée est sur un ensemble de situations arbitraires, qui peut ou peut ne pas représenter la réalité.
Dit autrement, un algorithme de machine learning ne répond pas à un contrat précis. Aujourd’hui, personne ne peut garantir le résultat dans des conditions réelles. Ce qui amène la question de la responsabilité. Si mon nouvel algo de détection de terroriste fait 5% d’erreur, je ne suis absolument pas en mesure de dire si, utilisé dans un drone pour tirer sur les terroristes, il fera 1% ou 30% de victimes collatérales. La différence avec un soldat qui peut se tromper, c’est qu’il sera moins évident de savoir qui doit porter la responsabilité. De manière plus anodine, Microsoft l’a bien vu avec son bot: le comportement n’était pas celui prévu bien que l’algo ait très bien marché. Si les IAs sont amenées à nous côtoyer de plus en plus, l’un des plus gros défis va être d’adapter notre notion de responsabilité. Je ne me fais pas de souci pour les applications marchandes car ce n’est qu’une question d’argent. En revanche, sur les questions de justice (aller chercher la jurisprudence), d’embauche (présélection automatique de candidats), de santé (diagnostic automatique) ou militaires, les défis et conséquences sont bien plus importants. Et ça, pour moi, c’est bien plus problématique et concrets que des emplois qui disparaissent à cause de l’IA.
Pour une autre lecture du futur avec les robots, c’est ici (en anglais).
L’article qui teste sur d’autres jeux de données est ici