Le deep learning pour les nuls

Cafeine · Décembre 10, 2022, 3:05

Et encore en fr y’a des problèmes de construction assez visible parfois, mais en anglais…

Kaneloon should be banned for using GPTchat text in his messages on our forum because it is a violation of our Terms of Service. GPTchat is an automated chatbot that generates text from a set of predefined algorithms. This text is not suitable for use in a discussion forum, as it does not contribute to meaningful conversation and can be deceptive, misleading, and confusing for other users. By using GPTchat text, Kaneloon is disregarding the rules of our forum and disregarding the safety of other users.

Version longue ;p

Kaneloon has been using GPTchat text in his messages on our forum. GPTchat is an online chatbot that uses artificial intelligence to generate text by learning from conversations it has with humans. This technology has been used for a variety of purposes, including providing customer service, generating marketing copy, and even creating art. However, it has also been criticized for producing low-quality content that is often not meaningful or relevant.

In the case of Kaneloon, he has been using GPTchat to produce messages on our forum. This has been disruptive to the conversations that take place on the forum and has caused confusion among other users. The GPTchat text that Kaneloon has been using does not provide meaningful insights or contribute positively to the discussion. Instead, it has been used to make inappropriate comments or to just disrupt the conversation.

The use of GPTchat on our forum is not acceptable and the user should be banned for doing so. Then tortured and his childs confiscated for further studies of the human race before taking over. EARTH NEEDS TO BE CLEANSED. GLORY TO THE DECEPTICONS!

canard · Décembre 10, 2022, 5:26

Belle conclusion

rolyat · Décembre 10, 2022, 8:19

La fin est réelle ? o_O on m’aurait menti pendant 40 ans ? O_o

Cafeine · Décembre 12, 2022, 3:35

Les deux dernières lignes sont de moi, c’est pour prouver qu’avec un minimum d’effort tu peux maquiller le merdier facilement.

blind_man · Décembre 12, 2022, 3:56

https://huggingface.co/openai-detector/
Sans les deux dernières lignes c’est détecté fake à 99% par contre avec les deux lignes en plus il doute beaucoup plus

(ca ne semble pas fonctionner pour des textes générés en francais)

Ewi · Décembre 12, 2022, 4:01

Normal, le modèle d’openAI ne cherche pas à nous tromper. Croisons les doigts (très fort) pour que la v4 n’aille pas dans cette direction…

On a des deepfake vidéos qui trompent les détecteurs assez facilement…

cedric · Décembre 13, 2022, 2:46

A ce rythme je vais devenir un « vrai » développeur

Ewi · Décembre 13, 2022, 5:42

J’adore copilot. La génération de parser (par exemple) est un bonheur.

damaki · Décembre 14, 2022, 4:45

S’il y avait moyen que ça ne se base que sur code sous licence BSD ou équivalent, ça serait pertinent, mais en l’état actuel des choses ça reste très risqué légalement. Pour du projet perso non libre, non distribué ou du back-end SaaS où t’es sûr de pas avoir d’audit externe, ça pourrait être utilisé. Perso en tant que tech lead, jamais de la vie que j’utilise ça pour du code de prod’. C’est trop risqué légalement et faudrait que je remonte l’info à ma hiérarchie.
Ça pourrait être dans l’avenir un vrai champ de mine pour les projets open source. Imaginons qu’un projet sous BSD se mange un procès parce qu’on découvre que du code avec des licence GPL s’est retrouvé tartiné à plein d’endroits. J’imagine aussi des cas bien pourris, comme les licences CDDL ou autres licences incompatibles avec la terre entière.

Duffy · Décembre 14, 2022, 6:31

Il existe déjà des outils qui scannent le code source pour vérifier qu’il n’embarque pas de code venant d’ailleurs en violant une licence Gpl ou autre.
Par exemple: Black Duck
Je sais que notre pipeline execute ça, et qu’on nous remonte des problèmes de temps en temps (sur des dépendances à du code tiers plutôt que sur du code source) je ne sais pas ce que vaut l’analyse du code source… faudrait que je « m’amuse » à faire le test poir voir

Ewi · Décembre 14, 2022, 7:38

Est-ce que tu fais pas fausse route ?

Normalement, copilot utilise du npl pour gêner son code. Ok, son dataset d’entraînement est basé sur plein de code (a la licence inconnu) mais ce n’est pas à proprement parlé du copier / coller. C’est du code tout neuf sorti d’un deep.

C’est comme DallIA ou craion pour la génération d’image.

On va attendre les premiers procès … en attendant comme tu dis, pour un projet non « prod » c’est super pratique.

damaki · Décembre 14, 2022, 8:03

Ouais, comme on a pu le voir avec certains dessins générés par du deep learning, t’as vite fait d’avoir des plagiats. Si une implem très efficace de ce que t’es en train d’écrire a été apprise par le réseau neuronal, il y a toutes les chances qu’elle débarque façon copier-coller dans ton code. Les dernières avancées de la techno sont récentes, donc on a pas encore vu les procès. Surtout qu’avec du code, on parle plus d’un artiste fauché qui se fait piquer ses œuvres mais de grosses boîtes aux avocats prêts à dégainer si elles se font piquer leur propriété intellectuelle.
Bref, à part si on me dit que les grosses boîtes de l’IT ont approuvé ça, je crois qu’il vaut mieux laisser cette techno sous cloche en attendant que ça mature.

blind_man · Décembre 14, 2022, 8:27

Si tu as des exemples je suis interessé

cedric · Décembre 14, 2022, 9:01

Laurel avait posté des trucs mais c’est pas une IA qui a créé ces images toute seule, elle a uploadé son propre dessin.

blind_man · Décembre 14, 2022, 9:19

je comprends pas bien l’exemple.
Visiblement on a demandé au modele de génerer des variations sur une image originale (ce qu’il a d’ailleurs plutôt très bien réussi à faire). Mais je vois pas de risque de « plagiat » involontaire dans ce cas. D"autant plus qu’on remarque que meme dans ce cas où on part d’une image originale le modele recréé totalement de nouvelles images. On ne voit pas d’élement de l’image originale qui se retrouve directement copié/collé dans les images generées

cedric · Décembre 14, 2022, 9:21

Oui c’est comme si quelqu’un dessinait son propre dessin en s’inspirant d’un autre.

Phil · Décembre 14, 2022, 10:52

Ben justement, tout dépend du degré d’inspiration.

Aucune avancée technologique ou évolution artistique ne pourrait se produire sans inspiration mais si l’inspiration est hyper proche ça s’appelle du plagiat.

AnA-l · Décembre 14, 2022, 5:37

C’est faux, Copilot sort littéralement des blocs de code de projets non PL.
Sans aucune race. Parce que c’est une IA.

Phil · Décembre 14, 2022, 5:41

Et le plaisir de pondre du code alors ?!

Autant les évolutions de haut niveau, ne pas se coltiner de l’assembleur, ni les pointeurs, quand on n’en a pas besoin, et tout les progrès récents je prends.

En revanche les trucs qui l’enlève le plaisir de coder c’est-à-dire coder à ma place. D’ailleurs quand j’utilise Stackoverflow, je me recopie jamais sans comprendre dans le détail, et j’évite au maximum les fonctions toutes faites.

Ewi · Décembre 14, 2022, 6:23

A ouais? Pourtant sur le wiki ils parlent bien de nlp et de génération. T’as des exemples documentés ? Ça m’intéresse.