Ieml

Comme vous le savez probablement déjà, le fonctionnement des moteurs de recherche sur internet est basé sur l’indexation du contenu des pages internet. Dans la pratique, google, par exemple, fait tourner des programmes informatiques qui lisent les contenus de vos pages internet, essaient de déduire de ce contenu un certain nombre de mots-clés ou d’expressions qui, en quelque sorte, résument le contenu de la page.
Lorsqu’ensuite un internaute lance une recherche sur un des dits mot-clés, le moteur de recherche va chercher dans ses index les sites contenant ce mot-clé, puis afficher cette liste dans un ordre qu’il jugera le plus pertinent.

L’indexation telle qu’elle est ainsi présentée est la solution qui répond le mieux à ce qui est peut-être la spécificité en tant que média d’internet : la masse et l’extrème rapidité de la croisssance du volume d’informations qu’on y trouve. En effet, lorsque l’on pense à l’autre média le plus répandu; le livre, on s’aperçoit que le travail d’indexation du contenu est fait avant même disponibilité de celui qui cherche l’information : l’éditeur et le bibliothécaire définissent dès disposition son genre, les sujets qu’il traite et ses domaines de pertinence, voire sa crédibilité même.
Cette organisation est aussi garante de la crédibilité de l’indexation. Les deux professions, de par nature, ont intérêt à ce que la régulation qu’ils prononcent soit adéquate puisqu’il en va de leur activité.
L’avantage du livre est que chaque livre a un éditeur, et que, s’il est mis à disposition d’un acheteur, il a un vendeur; ce qui fait que le livre n’échappe jamais à une indexation pensée.
Les sites internet, eux, n’ont pas de median qui définisse leur contenu, ni même leur véracité.

C’est là qu’intervient le projet IEML.
IEML (Information Economy Meta Language) est un méta-langage, c’est à dire un langage au sujet du langage. Ce n’est pas un langage naturel comme le français ou le haoussa (t’as vu chérie je l’ai placé ?!) mais un système de notation créé pour le traitement rapide de l’information par l’informatique. Un peu comme le japonais peut-être, il s’agit d’une écriture idéographique où chaque symbole représente un concept.

L’idée est que chaque symbole (ce sont maintenant des lettres de l’alphabet latin, mais ce furent à l’origine des glyphes) représente donc un concept dans une phrase, mais aussi que son emplacement dans la phrase, et dans une syllabe, ont une signification propre.

Exemple : la phrase “BO SOKO”. Cette phrase symbolise une page traitant d’IELM.
Pour la comprendre, on va d’abord séparer les “mots” de la phrase. On obtient donc “BO” et “SOKO”. Ce premier niveau exprime les idées de la phrase. “BO” fait référence à l’idée d’articulation linguistique, et “SOKO” fait référence au concept d’intelligence collective. On sait donc déjà que notre phrase traite de ça. Descendons maintenant encore d’un niveau, et décomposons nos deux mots par phonème. “BO” est déjà phonème et ne change pas. “SOKO” devient “SO” et “KO”. Ce deuxième niveau de décomposition est celui de la relation entre les éléments de premier niveau. “SO” signifie “souci de la pensée” et “KO” “désir de lien social”.
Et hop on décompose encore. Cette fois par “lettre”. Nous voilà donc avec “B” “O” “S” “O” “K” “O”
“B” exprime le langage.
“O” exprime la volonté
"S" exprime la pensée
"K" exprime la société

(Il y a un dernier niveau mais je vous le passe, pour la bonne raison que je ne le comprends pas). Pour comprendre plus en détails, vous pouvez vous référer à ce lien : [post=“0”]http://www.ieml.org/IMG/pdf/IEML-texte-2.pdf[/post]
Donc pour résumer : en utilisant sept caractères alpha-numériques, je sais qu’on parle de l’interaction entre le langage et le concept d’intelligence collective. Je sais que ce sujet est susceptible d’intéresser les gens qui recherchent des informations concernant la notion de langage, de lien social, qu’elle aborde l’élaboration de la pensée, et que d’une manière générale on y traite de la corrolation entre langage, pensée et société.

Maintenant, on pourrait très bien dire : d’accord, ça fait 7 caractères mais on s’en fout après tout. A quoi sert finalement de “compresser” ainsi les thèmes d’une page ? En tant qu’utilisateur, je ne vais quand même pas apprendre ce langage à la con ?
Non ça serait un peu bête. L’intérêt est que mon moteur de recherches traduise ma demande en IEML, pour faire ensuite une recherche par rapport à ses indexations IEML.
Ainsi dans mon exemple, je tape “esperanto”.
Mon moteur de recherches va traduire ma recherche en “BO LEKO”. Mon moteur de recherches va alors estimer que ma page référencée en “BO SOKO” traite d’un sujet similaire, parce que l’orthographe des deux phrases est proche, et me proposer ma page sur l’IEML.
C’est là le but final : la page que je me vois présentée ne contiendra certes même pas le mot “esperanto”; mais le domaine concerné, les finalités du sujet, et leur champ d’application étant similaires, je me verrai proposer cette page.

IEML est un projet en gestation depuis une quinzaine d’années, dont le maître d’oeuvre est Pierre Levy, (hop copier-coller “PROFESSEUR DE COMMUNICATION, TITULAIRE D’UNE CHAIRE DE RECHERCHE EN INTELLIGENCE COLLECTIVE A L’UNIVERSITE D’OTTAWA (CANADA)”)
Il espère voir son projet pleinement accessible au grand public d’ici 2010

Souces et ressources :
Le Monde : [topic=“0”]http://www.lemonde.fr/web/article/0,1-0@2-651865,36-927305@51-837044@45-1,0.html[/topic]
Le site d’IEML : [topic=“0”]http://www.ieml.org/[/topic]
Présentation d’IEML par Pierre Levy: [topic=“0”]http://www.ieml.org/IMG/pdf/IEML-texte-2.pdf[/topic]
Le principe d’intelligence collective, duquel découle en quelque sorte IEML : [topic=“0”]http://www.comu.ucl.ac.be/reco/grems/jpweb/levyauth.htm[/topic]

Je suis un peu fatigué, j’espère que tout ceci est lisible et compréhensible, si ce n’est pas le cas j’éditerai (dans la limite de ma compréhension du sujet B) )

merci pour le sujet

Je mate tout ca.

bussiere

Les liens déconnent B)

edit: wolaaa 10 000 excuses, c’est le matin, les adresses sont bonnes elles ^^

Les adresses sont bonnes, pour ceux qui sont pressés, un copier-coller fonctionne. C’est les balises qui foirent…

bravo pour cette vulgarisation, par Arkhatope. Je ne connaissais pas. B)

Tu soulèves un point intéressant : l’indexation manuelle pour les livres, et l’indexation automatique pour les sites. Sauf que ici encore, comment va être déduit la “signature” d’un site (BOSOKO pour ton exemple) ? Je vois mal une entreprise payer des gulus pour classifier le web, on aura donc toujours le même principe avec des spider (google, …) pour parcourir le web et tout indexer. Après, ca reste de la clusterisation où pour chaque requête on va voir ce qu’il y a dans les classes adjacentes.
Pour moi, je ne vois pas ou est la nouveauté a part le fait d’utiliser un langage pour classifier les documents (et j’en vois pas trop l’utilité -du langage), mais je me trompe peut être hein.

Apparte :
surtout que dans les bib on ne traite les livres qui ont une vie commercaile (édité) ce qui élimine beaucoup par rapport à la masse produite par l’homme (très peu, en proportion, de littératures dites grises sont traités par les bibliothèques, si on se limite à ces acteurs). Or le web, c’est tout l’inverse, tous le monde édite ce qui multiplie par (exponentielle) la quantité de données à traiter. A cela s’ajoute, la mouvance des url et le versionning ultra instable.

En plus, en bib, vu toutes les règles de catalo adaptées, modifiées (même si c’est basé sur du AACR2 , oups pardon je saoule) font qu’on catalo des centaines, des milliers de fois le même bouquin à travers le monde. Y a pas mal de moyens d’échange de données (de notices bibliographiques pour les amateurs^^) parfois très anciens - protocole Z39.50 (1970)- mais en pratique, y a beaucoup de recatalo refait dans chaque institution (rien que sur la langue de description, les mots-clés…). Donc beaucoup de moyens humains engagés (gaspillés?).

On progresse beaucoup, XML est mis à toutes les sauces (MarcXML, DublinCore, METS, MODS…), certains tentent des révolutions (nouvelles règles de catalo RDA) mais y a beaucoup de résistances et de latence parfois très justifiées.

Fin d’apparte.