IA, éthique, tout ça

Phil · Juin 13, 2024, 7:30

Moui. En tout cas sur les sites marketing appeau SEO qui étaient déjà vides de sens quand c’était écrit par des humains, font passer ces proses pour de la haute littérature quand c’est écrit par une IA: des pages entières complètement creuses de chez creuses.

blind_man · Juin 13, 2024, 8:51

Faskil · Juin 15, 2024, 4:43

Je ne sais pas si c’est une impression subjective (et pas du tout justifiée) de ma part, mais j’ai l’impression de croiser de plus en plus de chaînes YT qui sont clairement générées par IA à 100%, mélangeant script de toute évidence rédigé par une IA, stock images/videos et voix de synthèse. C’est ça le futur ?

On est déjà noyé de bruit partout, ça ne va pas s’améliorer.

SirAkuse · Juin 15, 2024, 5:20

A force d’émettre du bruit, il n’est pas impossible (oui je garde une part de foi) que l’IA se tue elle même rendant le contenu inintéressant. Malheureusement ça se fera sans doute au prix d’une casse « sociale » puisque les chaines pertinentes risquent de disparaitre entre temps, noyées par le bruit (un peu ce que vivent les sites Web en ce moment).

Perso, l’usage tel que promu et mis en oeuvre sur le Web ne me fait pas rêver.

Ewi · Juin 15, 2024, 5:26

Pas sur que YouTube laisse faire. Ils avaient ban à la chaîne les chaînes qui « vocalisaient » des posts Reddit.

Faskil · Juin 15, 2024, 5:30

C’est pas l’impression que ça donne depuis plusieurs mois. Je tombe de plus en plus régulièrement sur des chaînes qui cochent toutes les cases du « AI generated » et elles ont plutôt l’air de prospérer (elles figurent même systématiquement dans mes « recommandations »).

Faskil · Juin 15, 2024, 5:48

AnA-l · Juin 15, 2024, 6:40

Je me posait la question ce matin justement, je voyait des gens poster leur AI-robots.txt pour « pas que les mechants robots de l’ia viennent voler leur contenu » et je me demandais si c’etait vraiment techniquement fait ou si en mentant sur le user-agent ou en ignorant completement ce txt ca passait quand meme. Je crois que j’ai la reponse, et ca ne m’etonne pas du tout venant de ce genre de boites hein…

Ravine · Juin 15, 2024, 9:11

Je regardais des trucs sur YT y’a 2 jours au boulot, et je vois dans la liste des recommendations une pochette d’album de metal. C’est pas le genre musical que j’écoute le plus, mais je suis curieux, et un peu perplexe, parce que la couverture semble etre du midjourney/stable diffusion (oui, au bout d’un moment les choix stylistiques de ces générateurs tournent en rond, et c’est reconnaissable).

Je me dis ok, vérifions ma suspicion, je veux vérifier que la pochette est bien générée. J’ouvre, je commence à écouter. C’est générique, y’a une intro bateau en voice over, la couv est effectivement un truc Mid-Diffusion (ou StableJourney), 2 magiciens, une épée… et y’a un truc bizarre dans ce que j’écoute, que j’arrive pas à placer. Je lis les commentaires, et lo and behold, tout l’album est généré. Les commentaires du compte en réponse aux accusations de « AI slop » sont générés, pour dire que « oui mais ça va s’améliorer et c’est pas si mal » et je sais plus quoi.

40 minutes de régurgitation synthétique.

Mais bon, je me dis que si c’est monétisable, ça doit être profitable.

Faskil · Juin 15, 2024, 9:40

Ce serait tellement drôle à suivre, si ça cramait pas des forêts en sus.

Faskil · Juin 16, 2024, 8:27

Eh ben super…

Ewi · Juin 16, 2024, 10:15

On a un topic pour parler des outils/veille ML et séparer le bullshit de l’utilisable ?

SkullyFM · Juin 16, 2024, 11:17

Comme deja écrit sur DIscord cette nuit:

je crois que le mec confond un crawl et un simple get… ca fait des années que les outils ont ce type d’implémentation. si je fais par exemple un wget sur une url il n’y a pas de robots.txt qui intervient mais si je fais un wget --recursive il y a bien lecture pour voir ce qui a le droit d’être crawlé après la page passée en paramètre.

Bref, un robots.txt n’a jamais permis de ban un certain type de browser par exemple

Il y a quelques autres conclusions assenées comme des vérités dans le post qui me paraissent douteuses.

Faskil · Juin 16, 2024, 4:40

Ewi · Juin 16, 2024, 5:13

Ça rappelle la classifications des radios de poumons covidé par IA qui avait simplement accouché d’un classifieur de poumons d’enfant/adulte.

Faskil · Juin 17, 2024, 5:07

Sarbian · Juin 17, 2024, 5:33

(Un peu à la bourre) Tu n’es pas le seul à le penser. La BBC a fait un sujet sur les chaines YouTube IA qui font du contenu pour enfants. Et Kyle Hill a fait une vidéo en 2023 et une autre en 2024 sur des vidéos qui semblent générées par IA et qui volent du contenu sur d’autres chaines.

GloP · Juin 17, 2024, 9:00

Ou le fameux classificateur de tank russes qui en fait decidait si le tank etait au soleil ou dans l’ombre

(Qui est en fait une legende urbaine, mais chuuuut: https://gwern.net/tank )

blind_man · Juin 18, 2024, 8:06

sur les capacités de raisonnement des llm :
Getting 50% (SoTA) on ARC-AGI with GPT-4o

ARC est un benchmark conçu par Francois Cholet pour tester les capacités de raisonnement et de généralisation. Pour le moment tous les modèles testés ont des performances pourries sur ce bench car les taches sont extrêmement différentes et donc aucun modèle n’a de capacité de généralisation suffisante…sauf si comme dans l’article on utilise un llm pour générer des programmes pour résoudre chaque tache et qu’on crée une boucle : création d’un programme → exécution → vérification du résultat → correction du programme

Sarbian · Juin 18, 2024, 12:01

Donc si on génère 8000 réponses et qu’on filtres les bonnes on peut voir qu’un LLM est intelligent ?

Je peux passer 8000 fois le concours de médecine ?