[web]que peut-on vraiment tracer?

Je vous soumets une petite question : sur un site qui nécessite de se logger, sur lequel on doit effectuer différentes tâches (comme lire des textes et visionner des animations vidéos ou flash), quels sont les vrais moyens de trackage d’un utilisateur?
Je sais qu’on doit pouvoir voir quand il est connecté, j’imagine (mais je ne suis pas certain) la durée de sa connexion. Mais peut-on extraire de manière complète le parcours individuel de chaque connecté sur le site (il est resté tant de temps sur telle page, il a visionné la vidéo en entier, etc…)

C’est pas pour moi, c’est pour un ami :stuck_out_tongue:

[quote=“Ghadzoeux, post:1, topic: 56047”][/quote]

Si tu as la main sur le code et sur serveur web, tu peux pratiquement tout tracer. Ca dépends de ce qui a été codé, et jusqu’où ils veulent aller.

Ça dépend de qui trace.

Le propriétaire sait potentiellement tout ce qu’il se passe sur son site.
Si le site utilise des boutons facebook/g+/twitter/google analytics, ces sites sont également au courant.
Si l’utilisateur se trouve sur un réseau privé (entreprise) et accède au web via une passerelle, le propriétaire du réseau peut aussi tout savoir.
Si l’utilisateur a sur sa machine un malware qui trace sa navigation, le propriétaire du malware voit aussi tout.
On peut aussi considérer que quelles que soient les circonstances, la NSA voit tout :stuck_out_tongue:

J’ajouterais que côté site, on peut utiliser des outils comme Google analytics, Xiti ou autre qui permettent de remonter et d’analyser/quantifier/whatever les parcours utilisateurs (parcours des pages, actions effectuées, temps resté sur chaque page, etc…)

OK, merci de vos réponses. Je ne pensais pas qu’on pouvait aller aussi précisément dans le traçage.
Cette question est issue d’une discussion que nous avons eu mes collègues et moi ce matin concernant notre formation continue qui est passée depuis 1 an à 75% virtuelle sur sites avec moult vidéos à regarder.
Du coup on se demandait dans quelle mesure notre hiérarchie pouvait vraiment (ou voulait, ça c’est autre chose je pense) suivre nos parcours individuels.

(oui je sais, c’est moche comme question et ce que ça peut sous-entendre)

[quote=« Ghadzoeux, post:5, topic: 56047 »][/quote]

C’est bizard mais quand tu as parlé de vidéo dans ton premier post, j’avais en tete un tout autre explication sur la raison de ce sujet ? :smiley:

Après il faut savoir que même si un traçage est toujours possible techniquement, en pratique il est peu probable.

[quote=“Ghadzoeux, post:5, topic: 56047”][/quote]
Hum tu parles de quoi?
_Des statistiques de consultation d’un site web?
_De l’activité http d’un utilisateur donné dans une entreprise?

LoneWolf
Soyons précis et régulier.

En fait une très grosse partie de la formation continue des enseignants du premier degré est en train de basculer sur de la formation à distance, chez soi, devant son PC à regarder des animations flash pourries et des petites vidéos, conclues par des quizz.
Donc là on parle d’une utilisation à la maison, de sites hébergés dans les locaux de l’EN, et des moyens qu’ils ont de tracer de façon précise, par utilisateur, le parcours sur le site en question.
Sachant qu’il n’existe aujourd’hui aucun moyen pour les utilisateurs que nous sommes de retrouver là où on s’est arrêté sur le parcours de formation, autrement qu’en imprimant un document Word et en cochant nous-mêmes là où on en est (ce qui donne une petite idée de l’ampleur du désastre annoncé).
C’est notamment ce point-là qui me laisse supposer que les moyens de nous tracer derrière sont soit inexistants (dans le sens pas développés), soit inconnus, soit un subtil mélange des deux…
D’où ma question.

tu peux tester https://mixpanel.com/c’est interessant comme outil

Au hasard, dans ton cas je parierais que rien n’est tracé.

Ok alors je ne connais pas la plateforme utilisé mais juste pour info, concernant apache:
Voici une ligne de log apache:
192.168.0.92 - lonewolf [03/Feb/2015:11:58:05 +0100] “GET /index.php?errcode=2 HTTP/1.1” 200 610 “-” “Mozilla/5.0 (Windows NT 6.1; WOW64; rv:35.0) Gecko/20100101 Firefox/35.0”

Voici les differents items de la ligne:
192.168.0.92: IP qui a contacté le serveur
-: Identification reseau (plus utilisé)
lonewolf: login apache utilisé pour l’accès. Les logins PHP ne sont pas présent ici (sauf bidouille)
[03/Feb/2015:11:58:05 +0100]: Heure d’accès de la page
"GET /index.php?errcode=2 HTTP/1.1": commande HTTP réalisé par le navigateur.
200: Code d’erreur. 200, tout va bien, 404, not found (par exemple)
610: taille en octet de la page fournie au navigateur
"-": Referer: Ici, j’ai tapé directeur l’url du serveur. Sinon on a la page précédente. Information fournie par le navigateur donc non fiable a priori (mais souvent fiable quand même)
“Mozilla/5.0 (Windows NT 6.1; WOW64; rv:35.0) Gecko/20100101 Firefox/35.0”: Navigateur utilisé.

De la, tu peux déjà obtenir pas mal de stats pour un utilisateur donné, si le site web utilise l’identification apache (ce qui est quasiment jamais le cas). Sans rien faire de particulier vu que c’est les logs de base.
Tu as des tas d’outils d’analyse de log apache qui te donne plein d’infos, mais c’est peut être pas aussi look&feel que google analytics. J’avais jamais trop compris l’engouement pour GA jusqu’à ce post: http://pozniak.pl/wp/?p=3195
Il explique que GA utilise massivement des cookies pour mieux identifier les visiteurs, et est donc théoriquement plus précis que les logs apache.

LoneWolf
Big Google is watching us.

tu peux chopper l’historique et tu as differents exploits pour chopper plus mais c’est crade …

https://www.eff.org/privacybadger#what_is_privacy_badger

http://www.forbes.com/sites/kashmirhill/2014/10/28/find-out-whether-this-privacy-killing-super-cookie-is-on-your-phone/

https://www.eff.org/deeplinks/2009/09/online-trackers-and-social-networks

https://github.com/samyk/evercookie

et je ne retrouve plus mais tu avais un truc pour faire un hash unique par user avec une sorte de calcul de css pour le tracer …

voila : http://cseweb.ucsd.edu/~hovav/papers/ms12.html

Non mais tout ce que vous me montrez est carrément hors de propos amha. Pour avoir tâté un peu de ce que font nos animateurs informatique dans l’EN, ils n’ont ni le temps, ni les outils, ni parfois les compétences pour faire tout ça si ce n’est pas implémenté avec une UI simple et fonctionnelle.
Je rejoins assez Rabban.

Déjà il faut voir si les modules de formation sont hébergés sur une plateforme LMS, ou à l’arrache sur un serveur lambda.
Dans le premier cas on peut suivre la progression de l’apprentissage si on s’en donne les moyens, dans le deuxième non.
Et ce que tu décris me fais pencher pour le deuxième.
Ce qui est dommage car quand on demande à un salarié de suivre une formation (même e-) le but c’est de suivre et d’accompagner sa progression.

En l’occurrence, là c’est plutôt répondre à une injonction ministérielle en réduisant les frais au maximum (plus d’intervenant à payer, plus de salle à louer, etc…)
On pond un truc qui correspond plus ou moins au nombre d’heures exigées et démerdez-vous. Mais bref je m’égare…

Comme dit plus haut, il est techniquement possible de tracer l’utilisateur à la moindre action près. La vrai question est: est ce qu’ils le font? Vu ce que tu me décris, j’en doute.

Pour ma part, au boulot, j’ai aussi un outil de formation à distance; celui ci s’assure que j’ai bien suivi les formations requises (alertes mails, etc…) tout est automatisé.

Maintenant l’implémentation de ce genre de choses n’est pas très compliquée, pour peu que les développeurs fassent appel a des outils externes. Google Analytics permet, par exemple (en plus des fonctions de statistiques de consultation de site anonymes), d’ajouter des variables personnalisées, coté serveur pour tracer le comportement d’un utilisateur.

[quote=“Ghadzoeux, post:14, topic: 56047”][/quote]

De toute maniere c’est un gros probleme de l’IT, les gens qui ont ces competences sont souvent trop hors normes pour etre dans des structures figées.

Oui, quand tu regardes les sites de stats, ne serait-ce qu’alexa où je ne sais plus quel nom de pornstar, tu vois des stats comme:  le temps moyen passé sur une page, quelle est la page la plus lue, d’où les gens viennent et j’en passe.