Faire tourner une IA en local

SkullyFM · Mai 17, 2026, 9:29

J'ai découvert https://anythingllm.com récemment. Ca marche bien aussi et le RAG en local est puissant avec plein de connecteurs différents.

Sarbian · Mai 17, 2026, 9:58

Non, c'est la phase d'entrainement qui a besoin de données. Les modéles qu'on utilise en local sont déjà entrainés.

Emidee · Mai 18, 2026, 6:39

Oui, c'était ma question. Savoir si vous aviez accès à des modèles pré-entrainés

Ewi · Mai 18, 2026, 6:42

Tu peux regarder sur https://ollama.com/ Les modèles sont référencés et documentés.

cedric · Mai 18, 2026, 7:08

Et le plus impresionnant, comme dit dans la vidéo postée plus haut par RaHan, c'est qu'un modèle de 6 GB répond à toutes des questions de type Wikipédia, alors que Wikipédia c'est 16 GB de texte environ.

AnA-l · Mai 18, 2026, 7:13

Incroyable, on dirait vraiment que c'est un truc qui opérerait une sorte de compression et qui serait capable de réassembler, avec un peu de perte au passage, les données initiales.

cedric · Mai 18, 2026, 9:20

Je découvre ce projet de proxy qui permet de sélectionner le meilleur LLM local en fonction du prompt.

Cafeine · Mai 18, 2026, 10:37

ouais ça fait un peu chateau de cartes au bout d'un moment... Et puis c'est pas plus mal de savoir ce qu'on utilise et pourquoi ! (et ce qui existe)

RaHaN · Mai 18, 2026, 11:58

Huhuhu, @AnA-l
Pour celleux qui ne le savent pas, il y a toute une théorie très intéressante autour de l'hypothèse intelligence = compression. Pas une théorie de machine learning, hein, une théorie générale des sciences cognitives. Avec l'avènement des capacités du machine learning, beaucoup y voient une preuve potentielle que cette hypothèse est juste, puisqu'effectivement, la structuration d'un réseau de neurones artificiel lors de son entraînement est un mécanisme qui compresse de l'information entrante (les datasets d'entraînement) en une représentation beaucoup plus petite. C'est notamment très soutenu par certaines figures de l'IA, comme Ilya Sutskever (contributeur de Alexnet, ex-Google Brain, co-fondateur et ancien Chief Scientist d'OpenAI, qui était parmi les gens qui avaient viré ce sac à merde de Sam Altman, aujourd'hui à la tête de Safe Superintelligence Inc.).

Le papier séminal de ça, c'est "Compression Represents Intelligence Linearly", et un bouquin tout aussi cité de Eric B. Baum (physicien, computer scientist, et chercheur en machine learning), "What is Thought?", qui explique l'argument de manière convaincante.

Pour les gourmands d'apprentissage sur ce genre de questions, je ne saurais trop conseiller la lecture de cet article du New Yorker, "The case that AI is thinking" (option 4 sur removepaywall pour le lire sans abo). Pour de la vulgarisation de presse non-scientifique, c'est (comme souvent avec le New Yorker) ce qui se fait de mieux, même si c'est toujours pas à prendre pour argent comptant, vu que l'auteur penche clairement pour le camp des croyants. En tout cas, moi je m'inscris dans le camp des sceptiques (sans surprise pour ceux qui me connaissent), aux côtés des Yan LeCun, Ted Chiang, Emily Bender, et d'une manière générale, la plupart des académiques qui ont en plus ou à la base des cordes de psychologie, sociologie, et/ou autres sciences humaines à leur arc scientifique, plutôt que juste des maths, de l'informatique ou de la physique.

Mes critiques/remarques concernant l'article ci-dessus que j'avais écrites pour ma conjointe, pour les gens qui ont rien d'autre à foutre que de lire un wall of text de mes ramblings

Globalement bien écrit, intéressant, documenté et factuellement correct.
Intéressant de voir que le camp des "believers" est essentiellement constitué de neuroscientifiques (dans les cités de l'article, en tout cas), car les neuroscientifiques comprennent en fait bien moins sur leur domaine de recherche (le cerveau humain) que les ingénieurs IA ne comprennent sur le leur (les neural nets et autres techniques, méthodes, architectures d'apprentissage machine) - parce que le premier est infiniment plus compliqué et mystérieux que le second.
- Assimiler les réseaux neuronaux artificiels au néocortex des cerveaux (comme le fait Jonathan Cohen, neuroscientifique), dénote un raccourci dangereux à mon sens; certes les réseaux de neurones actuels sont inspirés par les naturels, rien de neuf ici, mais:
  - les plus gros réseaux de neurones artificiels utilisés pour les Foundational LLModels se comptent en centaines de millions de neurones artificiels. Un cerveau humain a approximativement 86 milliards de neurones.
  - En vérité, il est plus intéressant de comparer ce qu'on appelle les "paramètres" d'un LLM, qui se comptent en centaines de milliards pour les plus récents, max un 1000 milliards (10¹²). On pourrait poursuivre l'analogie en considérant que les paramètres d'un neural net artificiel sont en quelques sortes équivalents au nombre de connexions synaptiques d'un cerveau. Le cerveau humain est estimé avoir 0.15 quatrillions (1.5x10¹⁴) connexions synaptiques - soit deux ordres de grandeur de plus... Et c'est évidemment sans compter qu'un synapse biologique est infiniment plus complexe dans ses communications (éléctro-chimiques) qu'un neurone artificiel qui ne sait faire qu'une opération vectorielle.
  - Enfin, l'intelligence humaine n'est pas simplement mesurable uniquement en termes de neurones ou de connexions synaptiques, évidemment. Le cerveau humain (et par extension les cerveaux mammifères) sont architecturés autour de différentes structures (lobes, cortex, etc.) dont le fonctionnement, et la modernité (i.e. quand ils ont émergé à mesure d'évolution de l'espèce) diffèrent, mais dont on sait qu'ils se spécialisent plus ou moins dans certaines catégories de tâches cognitives. Côté IA, cela pourrait être mis en parallèle avec tout ce qui ne fait pas partie du neural net central (autres traitements pré ou post inférence, apprentissage additionel par renforcement, fine-tuning, etc.), ou aux mécanismes architecturaux de différents types de neural nets (circonvolutions, architecture des "transformers" dans les LLM, mécanismes d'attention dans les LLM, etc.). Une fois de plus, la complexité architecturale actuelle des neural nets, et des algorithmes qui les structurent lors de l'apprentissage, est ridicule comparée à celle des cerveaux biologiques. Plus intéressant encore, c'est un parallèle qu'on peut aussi dresser avec le mouvement vers l'agentique - l'utilisation d'autres agents dédiés à certaines tâches que les LLMs seuls ne peuvent produire, comme l'arithmétique ou la reconnaissance d'image.
- Les cerveaux biologiques absorbent et se structurent autour d'une masse de stimulis infiniment plus complexe et diverse, incluant les dizaines de sens dont un humain est muni via son appareillage sensoriel externe et interne, et ce, pendant des décennies (estimé en petabytes voire en exabytes). En comparaison, les IA actuelles apprennent à partir de quasiment rien (quelques terabytes), et ce n'est pas un tour de force, mais une limitation dure de leurs résultats.
- La structure cérébrale la plus unique dont disposent les humains est le cortex pré-fontal, une partie spécifique du neocortex; c'est la partie qui est directement derrière le front, et le néocortex est la partie la plus récente et la plus volumineuse du cortex cérébral chez les mammifères. En d'autres termes, c'est la dernière mise à jour biologique dont l'humain a été doté, et c'est en quelques sortes, entre autres, une machine à prédire et simuler - typiquement, ce que font également les IA, en particulier les LLMs. Mais les algorithmes qui tournent pour ce faire sont aussi beaucoup plus simples en IA, qu'ils ne le sont dans leurs équivalents biologiques. L'article mentionne les deux classiques: Gradient Descent et Linear Regression (deux piliers de l'IA).
- Nous savons presqu'intuitivement que la majeure partie des chemins vers la perfection d'une réplication (quel que soit le domaine), est "facile" à obtenir; les derniers 5-10% deviennent exponentiellement plus difficiles à obtenir. En d'autres termes, il est très probable qu'on puisse dans l'absolu répliquer jusqu'à 90% de l'intelligence humaine en IA, et ce, relativement rapidement (il n'y a qu'à voir pour s'en convaincre la vitesse à laquelle l'IA actuelle a progressé, depuis le début de son boom, mettons autour du début des années 2010). Si cette logique s'applique ici comme elle s'applique dans tant d'autres domaines, il serait illusoire de croire que la progression de l'avènement de l'intelligence artificielle pourra continuer à la même allure de manière linéaire. Les "believers", eux, argumentent la dynamique inverse: celle qui voudrait qu'on avance de plus en plus vite vers la fameuse "singularité" à partir de laquelle il y aura assez d'intelligence pour entrer dans une phase exponentielle de croissance dans laquelle l'IA sera suffisamment intelligente pour s'améliorer toute seule tant dans ses structures d'apprentissage que dans ses matériaux d'apprentissage, créant une dynamique de renforcement interne qui la mènera inéluctablement à dépasser l'intelligence humaine. Ce n'est pas impossible, mais c'est simpliste, à mon avis. D'un autre côté, on peut aussi argumenter que répliquer 90% de l'intelligence humaine serait suffisant pour ne plus pouvoir faire la distinction - d'autant que l'íntelligence humaine est en réalité particulièrment limitée (même si à ce stade de l'évolution biologique, elle figure incontestablement parmi les plus élevées), et que si tu as 90% de l'intelligence moyenne humaine, tu es déjà plus intelligent statistiquement que beaucoup d'humains qui sont en dessous de la moyenne. Mais bien entendu, il est abscons de vouloir mesurer l'intelligence humaine sur une seule dimension et une échelle de 1 à 100. Ou l'intelligence en général, d'ailleurs.
Tout aussi sinon plus intéressant de voir que dans le camp des "skeptics", on trouve: sociologue, linguiste (toujours dans les cités de l'article) - deux domaines beaucoup plus anciens que la neuroscience, mais aussi deux domaines qui étudient peut-être plus les lacunes de ces dynamiques (ce que le langage ou les structures sociales ne font pas bien, là où elles conduisent à des erreurs, quoi), alors que la neuroscience en est encore à étudier ce que fait un cerveau; ce sont généralement les psychologues qui étudient les lacunes de l'intelligence/la cognition humaine.
Définir l'intelligence comme idoine à la compression (Ted Chiang) est assez spot on... dans les deux domaines (artificielle et biologique). Par ailleurs, je note qu'on utilise aussi une analogie similaire dans certains domaines de la physique (vis à vis de l'information dans l'univers).
C'est à partir de cette mention dans l'article qu'on parle enfin de l'éléphant dans la pièce: la conscience, et en particulier la conscience de soi. Comme je le dis depuis des années, la conscience est encore plus difficile à définir que l'intelligence, mais elle est indubitablement étroitement liée à l'exercice de l'intelligence chez les biologiques - tandis qu'elle est indubitablement absente pour l'instant de l'IA, n'en déplaise à tous les articles racoleurs qui parlent d'IA qui tente de se préserver quand on lui dit qu'on va l'éteindre. L'illusion de conscience des systèmes de LLM, je le maintiens, est une illusion à 100%, dont l'existence émerge des propriétés sémantiques du langage (qui constitue son matériel d'apprentissage), simplement. Pour résumer, parce qu'une partie non congrue des textes créés par les humains s'affaire à parler de la préservation de nos vies, de notre civilisation, de notre existence, tant dans les récits de fiction que dans ceux de non-fiction. Le poids de ces idées de préservation de soi dans le matériel d'entraînement des LLM est la seule raison pour laquelle ces idées émergent quand on leur pose des questions sur leur disparition. La Préservation de Soi est sémantiquement proche de l'idée de la Mort; elle est donc la résponse la plus statistiquement probable quand on prédit des mots et des phrases qui devraient suivre l'assassinat ou le débranchage d'une IA dans un prompt utilisateur. De même, entreprendre des actions (échafauder un plan de chantage pour se sauver, par exemple) est courant dans le matériel d'entraînement, donc statistiquement logique dans le "comportement" d'un LLM confronté à cette situation. Ça n'en fait pas une intelligence comparable à celle des humains, et encore moins une conscience.
C'est important dans cette discussion parce qu'être conscient de soi est autant un paramètre qu'un mécanisme de l'intelligence humaine; c'est pour ça que l'évolution a doté la vie d'appareils sensoriels capables de definir les limites d'un corps, de la douleur, de l'équilibre, et de quantité d'autres mécanismes se rapportant directement à un individu vivant.
Je suis aussi de ceux qui n'ont aucun problème à dire qu'il y a de l'intelligence dans un tournesol; il se tourne vers le soleil, pour résoudre le problème de son mouvement dans le ciel afin d'optimiser sa propre illumination nourricière. Cependant, je ne peux pas dire qu'un tournesol soit conscient de son existence.
En ce sens, on peut tout à faire dire qu'une IA est intelligente - mais dire qu'elle pense, ce n'est pas la même chose. Une bonne partie de l'intelligence humaine n'est même pas assimilable au concept de pensée - souvent parce que c'est non-conscient et que nous avons une compréhension de la pensée comme étant un exercice qui ne peut pas exister sans conscience de soi. Une pensée non-consciente est un instinct.
De ce point de vue, l'IA est instinctive. Et seulement instinctive pour l'instant.
Rien de ce que je pense aujourd'hui, ou écris ici-même, n'exclut la possibilité qu'une intelligence et/ou une conscience artificielle n'atteigne ni ne dépasse les capacités humaines quelque part au cours du prochain siècle. Mais je demeure certain qu'on en est encore loin (en termes de distance, pas de temps). Je demeure tout aussi certain que toutes autres choses restant égales par ailleurs, il est inéluctable que cela arrive.
La question devient, peu ou prou, de savoir si c'est "good enough" ou "close enough" pour mettre fin au débat; pour moi, pas encore, pour d'autres, déjà. Et encore une fois, la distance qu'il y a entre le plus stupide des humains et le plus intelligent est telle, à notre échelle, que c'est tout à fait attendu que le niveau de l'IA actuelle soit "close enough" pour certains humains et pas pour d'autres.
"The moment demands a middle kind of skepticism: one that takes today’s A.I. models seriously without believing that there are no hard problems left." -> c'est exactement ma position.
Le petit passage sur la qualité des capacités d'apprentissage d'un enfant vs une IA est crucial dans la considération de cette discussion; je suis aussi ravi qu'il soit si juste en insistant sur le fait que "Children are always trying to do something just beyond their ability"; on sait que juste ça, c'est le meilleur moyen d'entrer dans un Flow state et de favoriser la rétention de l'apprentissage (former des mémoires plus solides). Le seul truc approchant cela dans les mécanismes d'apprentissage des LLMs, ce sont les circuits d'attention dans les architectures de transformers (dont le mandat est de déterminer l'importance de chaque composant dans une séquence, en l'occurrence, de mots) - mais ils ne se substituent pas au mécanisme inconscient des jeunes enfants à se challenger toujours à la limite - aucune IA ne fait ça pour l'instant, parce qu'elles n'ont aucune intention, aucun mécanisme endocrinologique ou système émotionnel pour y parvenir, et aucune connexion expérientielle ou sensorielle avec la réalité, ce qui, je crois, est indispensable à un appprentissage plus efficace et une pensée approfondie.
“I think the reason they work is that they’re piggybacking on language,” Tsao -> EXACTLY. L'illusion d'intelligence actuelle, ou plutôt de pensée, est un épiphénomène induit par la puissance sémantique de l'objet manipulé, à savoir les langages humains.
Ça c'est un argument contre ma propre paroisse des sceptiques, mais il reste valide à mon sens : il y a une dimension psychologique et philosophique au débat de l'intelligence. S'il s'avère qu'effectivement, dans son incarnation humaine, elle peut-être résumée à du compute appliqué à un espace vectoriel hyperdimentionnel, donc des maths, au lieu de juger l'intelligence artificielle comme équivalente à l'humaine, on peut surtout considérer l'inverse; l'intelligence humaine n'est plus si mystérieusement miraculeuse, c'est des maths pareil, et donc elle est comme l'IA, et nous perdons notre propre singularité, telle que des milliers d'années de pensée humaine a aimé l'échafauder envers et contre tout le reste de la création. On sait que nos modèles sont humanocentriques, et que digérer qu'ils sont faux à cause de ça est difficile. Ça joue peut-être insidieusement sur le débat (c'est, après tout, un biais cognitif).
Ah bah! Ça m'apprendra à commenter trop au fur et à mesure de la lecture: “I have the opposite worry of most people,” he said. “My worry is not that these models are similar to us. It’s that we are similar to these models.” If simple training techniques can enable a program to behave like a human, maybe humans aren’t as special as we thought. -> exactement

Cafeine · Mai 18, 2026, 12:47

Je vais rabaisser le débat tout de suite avec des FAITS. (lol)

RaHaN · Mai 18, 2026, 1:02

C'est pas faux, mais nous on sait faire des trucs. Pour les gens qui ont pas notre expérience, faut bien imaginer la surpuissance qu'ils ont l'impression d'accéder avec ce merdier

Ewi · Mai 18, 2026, 3:59

Y a qu’à voir le nombre de présentations de projets vibecodés sur Reddit. L’impression de pouvoir faire faire est grisante tant que tout va bien.