Tweet (transformation date)

Bonjour à tous,

Je sais que je vais un peu vite en besogne vu que je viens d’etre parachuté ici, mais je me lance quand meme ( en esperant  de ne pas s’etre gourré de section aussi…).

J’ai un petit probleme concernant les tweets que quelquin a extrait , dont voici un echantillon :

"  from:@FT,1231927874,ft,http://twitter.com/FT/status/1117956941,"Davies quits StanChart for government : Mervyn Davies, chairman of Standard Chartered, is leaving the emerging m… http://tinyurl.com/9lcl9x  "

(Les tweets ne sont pas tous extraits du Financial Times il y a aussi, Bloomberg,TheEconomist,Forbes,Wll Street Journal et FortuneMagazine).

Pourquoi ai-je besoin de ce truc? Je fais un memoire en finance dans lequel il me fallait une quantité monstrueuse de tweets afin d’en extraire avec un logiciel des mots ayant attrait a du sentiment negatif/positif (pour en deduire des comportements de marchés financiers). J’ai donc recuperé un fichier de tweets (en.csv)  de quelquin comportant environ 240000 lignes du genre que j’ai mis au-dessus, le probleme est que pour pouvoir mettre tout ce beau monde dans le moulinage à mots , il faut que je les catalogue par periode (par mois et années, exemple janvier 2008), or ceci s’avera difficile vu qu’il n’y a pas de date explicite.

J’avais pensé que le premier chiffre commençant par 123 representait la date d’une certaine manière, et ai essayé de betement convertir ça sur excell , ce qui evidemment n’a pas marché (cela aurait été trop simple :p).

Je me suis adressé à un ami informaticien qui m’a bien confirmé que c’etait une date mais dans un language particulier en lien avec une date de reference , il m’a envoyé ce code-ci :

14 Jan 2009

Mais il m’a dit qu’il ne peut malheureusement m’aider plus loin.

Est-ce que quelquin aurait une idée svp de comment convertir ces chiffres en date voir meme d’instaurer une macro (la ce serait merveilleux!) sur excell pour que je puisse cataloguer mes tweets en mois et années.

Un grand merci d’avance,

Sarg

[quote=“FullMetalSargent, post:1, topic: 55752”][/quote]

je pense que ce sont des timestamp unix :

en gros le nombre de secondes depuis 1970 :

http://fr.wikipedia.org/wiki/Heure_Unix

un site pour convertir :
http://www.timestamp.fr/

Et tu peux faire des script meme une macro excel pour convertir tout cela.

Sinon je bosse sur du machine learning financier a partir de tweets :

voila ma doc dessus :
https://delicious.com/bussiere/picsou

if needed mon email bussiere CHEZ gmail.com

Alors le data-time-ms=“1231927874000” représente le nombre de millisecondes écoulées depuis la date de référence. La plupart du temps, la date de référence c’est le 1er Janvier 1970.

Je viens de tester en java et effectivement, avec la valeur 1231927874000 on retombe bien sur le 14 Janvier 2009 à 11h11 et 14 secondes CET.
J’ai aussi essayé la date qui correspond à 0 millisecondes et c’est bien le 1er Janvier 1970, à 01h00 CET.

Exemple de code en Java :

Calendar cal = Calendar.getInstance();
 
cal.setTimeInMillis(1231927874000L);
System.out.println(cal.getTime());
 
cal.setTimeInMillis(0L);
 
System.out.println(cal.getTime());

Et la sortie obtenue :

Wed Jan 14 11:11:14 CET 2009
Thu Jan 01 01:00:00 CET 1970

Pour du excel voila une recherhe google avec pleins de docs et de macros :
https://www.google.fr/search?client=ubuntu&channel=fs&q=excel+macro+timestamp&ie=utf-8&oe=utf-8&gfe_rd=cr&ei=xSG9U_iNNeuH8Qf6hYDYBg

Pour ceux qui se demandent, le pote en question c’est moi :wink: Bon, je savais que c’était un foutu timestamp, seulement je me rappellais pas depuis quand c’était compté.

Merci beaucoup pour vos reponses (rapides en plus !).

J’ai suivi vos pistes, et j’ai finalement pu convertir les dates en utilisant la formule suivante sur excell : =1MID(B1;MATCH(TRUE;ISNUMBER(1MID(B1;ROW($1:$37);1));0);COUNT(1*MID(B1;ROW($1:$37);1)))/86400+25569-9/24

Ce qui m’a permis de mettre les dates à coté des tweets , au moins si je devrai me taper ça manuellement, ça ira 10 x plus vite.

Je vais maintenant essayer de trouver une macro pour trier les lignes par dates et je vous dis quoi !

[quote=“FullMetalSargent, post:6, topic: 55752”][/quote]

pas besoin de macro la. Si tu as les dates dans une cellule sur la ligne, tu rajoutes un filtre en entete, et tu laisses excel le trier par le filtre

Juste, j’ai trop vite tendance à vouloir tout cataloguer d’un coup !

[quote=« FullMetalSargent, post:6, topic: 55752 »][/quote]
Belge Spotted :stuck_out_tongue:

[quote=« Bussiere, post:9, topic: 55752 »][/quote]
:innocent:

[quote=“FullMetalSargent, post:6, topic: 55752”][/quote]

Bonjour,

Tu deviens d’être catalogué “pote à mordo” en moins de 5 posts. C’est un achievement.

[quote=“FullMetalSargent, post:6, topic: 55752”][/quote]
Putain mes yeux. Non quoi.