IA, éthique, tout ça

C’est une partie de mon taff. Calmer le PDG de ma boîte à chaque fois qu’il entend parler d’un truc révolutionnaire qui utilise l’IA :sweat_smile:.

Si quelqu’un a un site qui faire une bonne veille. Je prend.

1 « J'aime »
1 « J'aime »

Oui les capacités de « raisonnement » des llm sont limités et oui ils se font facilement piéger par des énoncés ressemblant à des textes surreprésentés dans les données d’entrainement. Par contre dire qu’ils ne sont capable de donner une réponse correcte que si la réponse était présente dans les données d’entrainement me parait un peu excessif sinon comment expliquer que Claude 3.5 arrive à faire cette réponse alors qu’il n’y a aucun doute que cette image n’était pas présente dans ses données d’entrainement. On peut dire que mon tres court prompt l’a quand même mis sur la piste mais il aurait pu faire une réponse confirmant juste qu’il y a un problème et inventer une justification complètement à coté de la plaque. Là il a correctement repéré que le problème venait de la représentation du nfp par rapport à ensemble. (et juste point de détail : sans meme parler de capacité d’analyse des données sur l’image, ne serait ce qu’avoir cette qualité de reconnaissance de caractère sur une image de ce type c’était impensable il y a ne serait ce que 10 ans)

Et pour revenir rapidement sur l’utilité de ces technos, avoir un chatbot qui me répond ca n’a pas grand intérêt. Par contre pouvoir à travers une api interroger un llm qui me fera une réponse structurée (par exemple en json) facilement interprétable dans du code classique ca permettrait de proposer à la régie de tf1 un outil qui leur met une petite icone :warning: sur les infographie qu’ils s’apprêtent à diffuser si un problème est détecté. Ca ne sera pas parfait et pas aussi fiable que ce que pourrait faire un humain mais visiblement ils ont pas les compétences humaines en interne pour le faire donc autant les aider avec un llm même imparfait…

Je serais curieux de tenter un « Non, c’est faux. » et de voir sur quoi il enchaîne… :smirk:

2 « J'aime »

SI tu essaies de le pieger tu y arriveras, tout comme tu arriveras à faire douter le petit stagiaire pas tres sur de lui qui est responsable de la validation des infographies avant diffusion :sweat_smile:

Comme attendu il se fait bien sur piéger, mais comme dit quelque message plus haut la phase de RLHF pousse le modèle à trop facilement admettre des erreurs.

J’aime bien comme il réponds que 577 est différends de 577

1 « J'aime »

WTF, mon message est resté bloqué. Le voilà quand même :

Je ne crois pas avoir besoin de plus de connaissances derrière ce qui génère aujourd’hui une hérésie de debauche de moyens pour juger que c’est inutile, dangereux et irresponsable.
L’IA, tu voudrais qu’on maîtrise mieux ce que ça veut dire pour avoir le droit de juger, mais justement, ça ne veut rien dire.
Quand on m’apprenait le Prolog, on parlait déjà d’IA, définir des règles de base pour ensuite que le langage s’appuie dessus pour « raisonner ». L’IA dont on parle aujourd’hui inverse la logique en analysant directement les solutions (en nombre considérablement élevé) pour statistiquement (je pense) pouvoir reproduire (créer, si on veut, mais surtout reproduire) les bouts de solution qui lui semble le plus correspondre au problème qu’elle doit résoudre.
C’est probablement très réducteur, n’empêche on s’en fout, en fait, aujourd’hui ce qui se passe, c’est que les grosses boites qui investissent dans le secteur veulent amasser le maximum de données pour proposer des modèles crédibles (ou pas) à vendre.
Que cela ne remette pas en cause la pertinence de ce qu’un système est capable de faire à périmètre contraint (connaissances médicales pour appuyer un diagnostic, données statistiques pour effectuer des projections, modèles météorologiques pour fiabiliser les prévisions, …) ne justifie pas non plus qu’on expérimente à grande échelle des bots conversationnels ou de la génération d’images sans contrôle ni garde fou (du moins non contournables).
Comme souvent, les innovations ou technos ne présentent pas intrinsèquement de failles ou de dangers, c’est l’usage qu’on en fait qui est souvent à côté de la plaque.
C’est mon avis, j’y connais rien, mais beaucoup de décideurs qui misent sur la techno ne semblent pas en connaitre grand chose non plus, donc ce serait bien que ça pète, et vite, et que les recherches se continuent chez ceux qui maîtrisent et ont de vrais idées de débouchés.

Oui c’est bien pourri ca :sweat_smile: . Mais pour ca que je dis que ce mode de fonctionnement « chatbot » a en fait peu d’intérêt.

Si je modifie mon prompt en « analyse cette image pour trouver des incohérence entre les chiffres et la représentation graphique. La réponse doit être au format json. Elle doit contenir un field boolean « valid » indiquant la validité ou non de la représentation. Si la représentation est invalide le json doit aussi contenir un field « detail » résumant en une phrase la raison »

Il me répond :

{
  "valid": false,
  "detail": "La représentation graphique du groupe 'Ensemble' (168 sièges) occupe une plus grande portion du demi-cercle que celle du groupe 'NFP' (182 sièges), ce qui est incohérent avec les chiffres indiqués."
}

Beaucoup plus intéressant et utile.

Si on veut lutter efficacement contre quelque chose qui nous fait « peur » je pense qu’il est toujours mieux de se renseigner en détail sur le sujet pour avoir des arguments qui ne se feront pas démonter par le premier beau parleur venu. let’s agree to disagree hein

OK, mais du coup en quoi comprendre ce qu’on peut faire de bien avec empecherait de penser que ce qu’on nous déballe publiquement, les investissements foireux et débauche de moyens / d’énergie n’est pas viable et ne représente du coup pas une si pertinente vitrine que ce qu’on veut bien nous faire croire ?

2 « J'aime »

J’espere que tu n’as pas de voiture, car on peut lui faire le meme reproche de la voiture comme moyen de transport individuel :stuck_out_tongue: .

Et pareil pour toutes les industries « de consommation ».

Il faudrait peut-être un exemple un peu plus pertinent. Car faire bosser un LLM pour déterminer si un graphe est correct alors que n’importe quelle réaction potable à un dev interne qui le génère au vol (Comme par exemple Liberation ou le Monde le font sur leurs sites) c’est effectivement du gaspillage. Tu ne mets pas un outil pour vérifier la sortie alors que tu as un moyen simple de générer la sortie proprement. Garbage In, garbage out. C’est la base.
Encore plus avec un outillage qui n’est même pas fiable.

Parce que si tu connais peu le domaine et que tu pars du principe que globalement ca sert à rien parce que « chatgtp il dit que des conneries et midjourney ils volent les artistes » tu trouveras forcement que les investissements sont totalement disproportionnés et débiles.
En 2012 tu trouvais ca par exemple normal que facebook en entrant en bourse soit valorisé près de 15 milliards (et ca été considéré comme un echec) ou que deux ans plus tard whatsapp soit racheté 20 milliards (pour un outil de chat…sans ia pour le coup :sweat_smile: )?
Et l’investissement mondial colossal en infrastructure pour le net (cable sous marin, fibre deployée dans les pays, datacenter etc.) qui se chiffre en milliers de milliards c’était justifié ou pas? Parce que bon globalement si on a dépensé tout ca juste pour s’échanger des photos de chats ca parait quand même bien disproportionné et y avait surement mieux à faire pour l’humanité avec toutes ces ressources.

(et pour rappel dès mon premier message de cette longue discussion je disais que OUI il y a une bulle financière)

Bien évidemment! et c’est d’ailleurs ce que je disais dans le post d’origine sur « trucs completement idiots » Mon exemple était plus une « boutade ». Il y a par contre pas mal de situations dans le monde réel où tu as du garbage in et tu as aucun contrôle dessus. Et donc avoir une techno qui te permet de quand même réussir à faire quelque chose avec bah c’est pas totalement inintéressant.

Le problème c’est clairement la disproportion entre les trucs un peu cons et les trucs utiles.
Perso je bosse aux chemins de fer en Belgique, et il y a justement un nouveau truc IA qui est sorti en interne. Quand tu regardes les applications de l’IA, c’est systématiquement pour des trucs qui fonctionnent très bien sans, soit des trucs qui concernent des trucs que l’IA ne permettra jamais de résoudre, et pour lesquelles il faudrait plus de moyens matériels et / ou de personnel.
J’ai vraiment l’impression que c’est juste comme pour plein d’autres boites, où il faut dire qu’on fait de l’IA parce que tous les autres le font et que sinon ça donnera l’impression de ne pas être à la pointe.

3 « J'aime »

C’est exactement ça et c’est en ça que je me permets une comparaison avec la blockchain. C’est pas complètement inutile et il y a sûrement des choses très intéressantes à en faire. Mais la quantité de boîtes qui se lancent dedans et le montant des investissements sont complètement débiles, alors que bien peu ont réellement un besoin qui justifierait cela. Tout ça à cause d’un bon gros FOMO…

Et puis surtout, on est vraiment en train de se prendre le bouleversement climatique en pleine tronche, il n’y a pas une journée sans que ça ne se vérifie. Mais au lieu de travailler à corriger ça avant que le monde ne devienne réellement invivable, on préfère développer des technos toujours plus énergivores et dont l’utilité est au mieux discutable.

Oui, se doter de datacenter gorgés de puces Nvidia qui pompent une énergie folle, ça ne me semble pas une bonne idée, que ce a fasse avancer la recherche ou pas. Et oui aussi, aujourd’hui ceux qui investissent le plus, construisent le plus, calculent le plus, c’est pour des usages à la con.
Idem, oui, tous ces datacenters et infras/réseaux pour une part trop importante de vidéos de chats (comprendre tous les contenus principalement vidéo de Youtube ou des applis type « réseaux sociaux »), c’est également non pertinent.

À ce propos il me semble que le plus grand pays d’Asie l’utilise à fond, et pas en bien.

Tout n’a pas besoin d’être « pertinent » dans la vie, sinon on s’ennuierait ! (mais bien sur, il faut raisonner les usages, et sur l’IA, on a tendance à faire n’importe quoi parce que c’est la mode)

1 « J'aime »

Personne ne le nie et ca n’est justement pas en mélangeant tout, en se renseignant peu et en s’offusquant sur le dernier truc à la mode que ca aide à vraiment comprendre les dangers réel et immédiat de ces technos qui peuvent être déployée de manière très diffuse et « anodine » (coucou l’autorisation d’expérimentation de « video intelligente » pour les JO. Lancement de l’expérimentation « vidéo-intelligentes » en vue de la sécurisation des Jeux Olympiques | Ministère de l'Intérieur et des Outre-mer)

Ca ca m’inquiète beaucoup plus que le fait que Microsoft crame des 100enes de milliards en gpu nvidia pour faire un chatbot bancal intégré à windows. Surtout si derrière ca me permet d’exploiter des modeles offrant des fonctionnalités impossible à coder de manière « classique » et proposer des fonctions qui simplifie l’acces à l’informatique par des non technophiles. Et pour le problème de la conso énergétique oui c’est un vrai sujet et un vrai problème mais si je devais choisir je préfère qu’on crame de l’énergie pour avoir des machines qui ont des capacités que je pensais réservé à la science fiction depuis que je suis gamin plutot que pour fabriquer des vetements que les gens achètent/jettent par brouette chaque mois. Mais ca c’est mon coté geek avec une garde robe de deux jeans et cinq t-shirt depuis 15 ans qui parle :sweat_smile: