IA, éthique, tout ça

blind_man · Juin 18, 2024, 12:18

Les bonnes réponses sont filtrées par le llm lui même…

Cet article n’est bien sur par là pour montrer que gtp4o est une AGI mais montre plutôt qu’il est extrêmement difficile de concevoir un benchmark qui serait une preuve d’intelligence et de capacité de raisonnement. Ca montre aussi qu’utilisé d’une certaine manière les llm sont capable de s’attaquer à des taches qu’on pensait hors de leur capacité. Et je pense que ca montre aussi que l’ « AGI » n’arrivera pas d’un coup du jour au lendemain avec une nouvelle architecture de modèle qui change totalement la donne mais plutôt de manière diffuse avec des systèmes capable de résoudre des taches de plus en plus en complexes et variées.

Ewi · Juin 18, 2024, 1:53

Aujourd’hui, l’archi qui marche c’est LLM-Agent et dans cette archi, ce qui compte c’est le « consensus » que tes agents vont attendre (consensus, délibération ou vote, y a plein de méthodes). Le choix de ces méthodes peuvent être confié a un LLM (ou non). L’intérêt, c’est que dans ces multiples appels, tu interroges plusieurs types de LLM (car LLM, c’est comme dire « patate », y a plein de variétés derrière…).

Pour en revenir a ta comparaison, c’est comme si plusieurs personnes se réunissaient pour traiter un problème commun. On fait un tour de table et a la fin, y a une solution qui sort. C’est pas débile dans le monde physique, pourquoi ca le serait avec des agents?

Ici comme c’est logiciel, ta réunion, elle se fait avec autant de participant que ta CB le permet. Tu peux meme ajouter un agent « débile » qui prend le 1er résultat d’un moteur de recherche histoire de faire douter les autres agents.

dff180 · Juin 18, 2024, 6:06

Vu ce qui sort de certaines réunions, je n’ai pas envie de voir ce qui sortirait de wouatmille itérations de ce type

Faskil · Juin 19, 2024, 12:08

https://ludic.mataroa.blog/blog/i-will-fucking-piledrive-you-if-you-mention-ai-again/

Twin · Juin 19, 2024, 1:18

Haha, il en a gros !

Sarbian · Juin 19, 2024, 2:53

« Everyone is talking about Retrieval Augmented Generation, but most companies don’t actually have any internal documentation worth retrieving. Fix. Your. Shit. »

Il faut que je l’affiche au bureau celle là.

Faskil · Juin 22, 2024, 3:25

Cafeine · Juin 22, 2024, 6:50

Oh putain, vous aussi ? -_-

Faskil · Juin 23, 2024, 12:48

6aa88fda09b57f12

SkullyFM · Juin 23, 2024, 3:53

Ouhla, plein de trucs mélangés qui confondent tout. On reprend parceque la partie sur les robots.txt c’est pareil que l’article déjà linké au-dessus. WIRED le confirme d’ailleurs dans la description de leur « experience »:

Immediately after a WIRED reporter prompted the Perplexity chatbot to summarize the website’s content, the server logged that the IP address visited the site.

Le prompt utilisé demande précisément de résumer une url. C’est un simple wget pour récupérer le contenu. Bref, rien qui en temps normal nécessite un robots.txt
Je remarque qu’il n’y a jamais d’expérience qui pose une question générique où WIRED aurait un bon SEO pour voir si Perplexity de lui-même va crawler le site. Parceque là, oui, il n’y aurait pas respect du robots.txt

Dans les articles linkés d’Engadget on trouve des takes du genre:

Its AI bots are copying hard-paywalled content without proper attribution

It’s resulting in a loss of advertising revenue or ability to reach subscribers

Là aussi je suis perplexe. Comment un crawler pourrait accéder à du contenu derrière un Paywal? Et l’article auquel font référence Wired, Engadet et autres disait justement que Perplexity faisait du headless. Donc les pubs seraient bien affichés…

En fait le vrai intérêt pour ces boîtes il est ici:

At a $1 billion valuation, Perplexity AI has offered us and our peers exactly $0

Même combat que pour récupérer de la thune chez Google News.
Parceque LA feature de Perplexity qui pose problème c’est celle-là:
https://www.perplexity.ai/page/Eric-Schmidts-AI-boKJzWQcRFmCLk5XjgKJEQ
Pouvoir compiler plusieurs recherches dans une URL publique.
Les sources, quoi qu’en pense Forbes, sont bien citées et mises en évidence.
Mais une fois que tu as un résumé, il n’y a plus besoin de lire l’article originel. On est très loin des 3 lignes dans Google News ou dans un lecteur RSS.
En même temps, est-ce différent d’un blog qui analyse l’actu ou d’un Wikipedia? J’en sais rien, je n’ai pas la réponse.

Et pour finir sur les accusations de « plagiat » parceque les résumés sont trop proches c’est vrai qu’il est difficile de re-phraser du contenu quand toutes les sources ont deja des titres similaires:

(Forbes a depuis changé son titre)

Faskil · Juin 24, 2024, 7:30

Tomma · Juin 24, 2024, 8:33

Faskil · Juin 25, 2024, 10:21

Faskil · Juin 25, 2024, 11:18

blind_man · Juin 25, 2024, 2:34

il y a quand meme des pistes d’amelioration

Gomme · Juin 25, 2024, 3:57

48d

Lemm · Juin 25, 2024, 4:40

J’ai enfin écouté! Purée ça, ça fait froid dans le dos

AnA-l · Juin 26, 2024, 3:36

Du caca plaqué or, ca reste du caca.

SkullyFM · Juin 26, 2024, 6:58

Tiens, j’ai loupé le moment où Geekzone c’est devenu le nouveau Pinboard…

blind_man · Juin 26, 2024, 7:16

On note partout un appauvrissement du débat, remplacé par des remarques simplistes et caricaturales empechant toute discussion. Je vois que ca n’epargne pas geekzone…triste.