Génération de nombre pseudo aléatoire : Idée à la con

je vousdrais juste signaler que les spams que je reçois sont très souvent identiques ou fortemant semblables.

ce matin j’en ai 2 dans ma boite a spam gmail:

Titre:
sfrjt SAVE 82%: VIAGR*, AMBIE*, CIALI*, XANA*, RIVOTRI*, LEVITR*, CIPRO, MERIDI*, CELEBRE*, VALIU* obliged

contenu:
Super H0T Se11ing Quality Meds At Cheeap
We dont keep ur record (not even your name)
You are safe with us, You Pay & we ship

hearing C11ck Here To 0rdeer fascinate

titre:
hbwup SAVE 82%: VIAGR*, AMBIE*, CIALI*, XANA*, RIVOTRI*, LEVITR*, CIPRO, MERIDI*, CELEBRE*, VALIU* opposite

contenu:
Super H0T Se11ing Quality Meds At Cheeap
We dont keep ur record (not even your name)
You are safe with us, You Pay & we ship

hearing C11ck Here To 0rdeer fascinate

[quote=“Rabban, post:21, topic: 30116”]je vousdrais juste signaler que les spams que je reçois sont très souvent identiques ou fortemant semblables.

ce matin j’en ai 2 dans ma boite a spam gmail:

Titre:
sfrjt SAVE 82%: VIAGR*, AMBIE*, CIALI*, XANA*, RIVOTRI*, LEVITR*, CIPRO, MERIDI*, CELEBRE*, VALIU* obliged

contenu:
Super H0T Se11ing Quality Meds At Cheeap
We dont keep ur record (not even your name)
You are safe with us, You Pay & we ship

hearing C11ck Here To 0rdeer fascinate

titre:
hbwup SAVE 82%: VIAGR*, AMBIE*, CIALI*, XANA*, RIVOTRI*, LEVITR*, CIPRO, MERIDI*, CELEBRE*, VALIU* opposite

contenu:
Super H0T Se11ing Quality Meds At Cheeap
We dont keep ur record (not even your name)
You are safe with us, You Pay & we ship

hearing C11ck Here To 0rdeer fascinate[/quote]
ouais mais la les regles sont en train de changer petit a petit

au depart il y a eu les spams ecris “normalement”

ou encore des spams en html :

puis ensuite les spam ecris a la mode v34gr4

puis des spams contenants des extraits de bouquins et le message pour contrer l’heuristique avec parfois une image

là on en est au spam avec un texte banal et des images en pieces jointes contenant le message du spam.

et une des dernieres tendances qui passe tout les filtres en ce moment le spam qui dit "bonjour je t’ai croisé là ecris moi ":

Et cela fait plusieurs années que je predis du spam en flash.

De plus parfois ces differentes regles sont mélangés
Donc c’est quand même plus varié que tu ne le penses, et le gros intéret c’est que les "regles de génération de spam changent souvent.
Par exmple pour la génération d’aléatoire a partir de la cascade les conditions de base sont toujours les memes (meme lieux, meme rocher, meme “eau”) tandis que dans le cas du spam les regles génératrices du spam évolue dans le temps.

Bussiere

pour generer de l’aleatoire , la theorie est simple

il faut un systeme fermée avec une montée entropique . Quand cette derniere est suffisante , un arret sur image (A) du systeme que l’on compare à ses conditions initiales (O) doit mener à la constatation suivante :

  • le systeme (A) dans sa partie ou globalité ne peut pas etre deduit de (O) du fait de sa condition de systeme fermée .

donc l’intersection de A avec O donne un sous ensemble modifie uniquement par entropie et qui represente l’action du hasard sur le systeme.

mais attention tu ne possedes que le resultat de l’action aleatoire et pas l’aleatoire en lui même .

Ensuite c’est une histoire de choix :

  • veut tu une relation directe qui conservera au maximum les propriete entropique ? dans ce cas une simpel relation de transposition te permet de recuperer l’essentiel du signal aleatoire du sous systeme . mais attention en fonction de la nature du systeme fermée tu peux recuperer des “agregats” qui vont en quelques sorte nuire à ton “range” de valeur .

  • tu veux recuperer une variable aleatoire sur R en entier , dans ce cas tu dois lutter contre les agregats mais cela est peine perdu dans la mesure ou par definition tu ne peux pas les prevoir . Dans ce cas tu deforme le signal entropique ( ou aleatoire ) par l’intermediaire d’une fonction à definir en fonction de ton 'range " de depart et du “range” que tu souhaite . cette fonction doit operer une transformation qui etale la variable sur tout R mais au prix du sacrifice d’une partie du signal entropique .
    Ce qui nuira à ta qualité aleatoire .

les systemes physiques pour definir l’aleatoire font en general l’inverse :

il considerent un systeme fermée avec un etat entropique connu , puis ouvre les vannes en rendant le systeme ouvert . Grace à cela ils essaient de forcer l’importation d’entropie de l’exterieur . mais le probleme c’est qu’il est difficile de voir si tu recupere de l’entropie pure ou une action exterieure soumises à des lois formel que tu ignores avec une constante de temps inconnu que tu confonds avec de l’entropie . l’idée c’est de multiplier ses apport entropiques ( avec un nombre d’entree vers le systeme de plus en plus nombreux , en esperant que tu recuperera plus d’entropie qu’autres choses . mais ca n’est qu’un voeux pieux à mon avis , et il existera toujours un range de variable où la cyclicité apparaitra . Et c’est encore pire que des agregats . en gros c’est un “faux” aleatoire . qui peut suffire pour la majorité des applis je pense ( chai pas je suis pas informaticien ) . ?

En ce qui me concerne ton systeme s’apparante à la deuxieme methode ( pas evident de faire autrement d’un autre coté ) . Et le spam tournant toujours autour de preocuppations que l’on peut denombrer de facons certaines ( à l’exception de rares occurences etranges ) . si tu recupere un signal aleatoire , tu auras un range assez faible , ou bien tu l’etendra par fonction et tu sacrifiera le peu d’entropique que ton signal aura recuperer .

Mais l’idée de trouver une utilité à ce truc super chiant qu’est le spam est super elegant .

23518946516875431i
Y’a qu’à demander. Et je t’en sort un pour chaque Spam de ma boîte, si tu veux B)

Bussière, t’es 'achement zarb sur cette idée là…

[quote=“Patryn, post:23, topic: 30116”]En ce qui me concerne ton systeme s’apparante à la deuxieme methode ( pas evident de faire autrement d’un autre coté ) . Et le spam tournant toujours autour de preocuppations que l’on peut denombrer de facons certaines ( à l’exception de rares occurences etranges ) . si tu recupere un signal aleatoire , tu auras un range assez faible , ou bien tu l’etendra par fonction et tu sacrifiera le peu d’entropique que ton signal aura recuperer .
Mais l’idée de trouver une utilité à ce truc super chiant qu’est le spam est super elegant .[/quote]
je ne suis pas a l’origine de l’idée de base (voir les oeuvres généres par l’artiste)
Mais je comptais compenser les preoccupations “previsibles” (bien que parfois cela change selon les starlettes a la mode) par les differents types de spam (en gros la taille du mail a chaque fois et la taille exactes des pieces jointes genre les images) et le fait que les lois que je ne connais pas changent tout le temps et ne sont pas immuables non ?
en gros la chaque spam peut etre généré par 6^6 regles et les nombres de regles augmente avec le temps.
En gros j’ai deux facteurs aléatoire pour le prix d’un seul :
Les regles de création du spam et ensuite les spams crées par ces regles, sachant que les regles s’additionnent parfois.
Voir les differents exemples que j’ai posté.
Ton avis la dessus m’interesse enormement.

Bussiere

[quote=“piaz, post:24, topic: 30116”]23518946516875431i
Bussière, t’es 'achement zarb sur cette idée là…[/quote]
J’ai 3h de transport par jour …
Et j’adore reflechir sur des concepts a la con TM
j’avais prevenus B)

[quote=“Bussiere, post:25, topic: 30116”]je ne suis pas a l’origine de l’idée de base (voir les oeuvres généres par l’artiste)
Mais je comptais compenser les preoccupations “previsibles” (bien que parfois cela change selon les starlettes a la mode) par les differents types de spam (en gros la taille du mail a chaque fois et la taille exactes des pieces jointes genre les images) et le fait que les lois que je ne connais pas changent tout le temps et ne sont pas immuables non ?
Voir les differents exemples que j’ai posté

Bussiere[/quote]

oui bien sur . tout ce que je dit moi c’est la choses suivante :

ce ne sera pas un vrai aleatoire mais un simili et ton systeme connaitra une cyclicité avec un constante de temps inconnu . on peut raisonnablement penser que ce sera long mais on en a aucune certitude .
contrairement à un vrai signal aleatoire qui t’epargne ce genre d’angoisses .

c’est tout ce que je dit B)

[quote=« Patryn, post:26, topic: 30116 »]oui bien sur . tout ce que je dit moi c’est la choses suivante :

ce ne sera pas un vrai aleatoire mais un simili et ton systeme connaitra une cyclicité avec un constante de temps inconnu . on peut raisonnablement penser que ce sera long mais on en a aucune certitude .
contrairement à un vrai signal aleatoire qui t’epargne ce genre d’angoisses .

c’est tout ce que je dit B)[/quote]
vala c’est exactement ça, d’où ma joke du dé de 20…

On crée pas des générateurs pseudo-aléatoires comme ça, tout comme on ne crée pas un chiffrement qui déchire tout comme ça, au jugé. Je fais bref et un peu péremptoire pour le coup (oui j’ai du TAF :P) mais y’a une vraie théorie derrière… :smiley:

[quote=« Patryn, post:26, topic: 30116 »]oui bien sur . tout ce que je dit moi c’est la choses suivante :

ce ne sera pas un vrai aleatoire mais un simili et ton systeme connaitra une cyclicité avec un constante de temps inconnu . on peut raisonnablement penser que ce sera long mais on en a aucune certitude .
contrairement à un vrai signal aleatoire qui t’epargne ce genre d’angoisses .

c’est tout ce que je dit smile.gif[/quote]
Justement est ce que la ciclycité n’est pas brisée et changeante par l’evolution des regles ?

Mais est ce que justement le changement des regles de générations du spam (voir les differents types de spam), qui ne sont pas fixes et augmentent dans le temps ne rendent justement pas ce principe attrayant ?
Par exemple dans le cas d’un algo qui utilise la chaleur, le temps d’acces disque etc …
Ce sera toujours les memes regles aléatoires de génération et elles seront en nombre fixes, tandis que la les regles evoluent.
C’est justement cette evolution des regles de génération qui moi me parassait attrayante (ou pas :P)
Pour moi il y avait trois grands axes aléatoires, les regles de générations changeantes et croissantes exponentiellements, la langue (avec des modes de construction differents spam coréens/chinois/japonais vs spam anglais/francais vs allemand langue a declinaison, de droite a gauche, gauche a droite tout ca …) et enfin le spam généré.
Justement ce que j’aimerai c’est pouvoir comparer ce systeme a d’autres déja existant.
Parce que je me doute qu’il ne dechire pas tout, mais c’est justement la comparaison avec d’autres systemes que j’aimerai étudier.
Parce que le principe etait la facilité de mise en place et le cout de mise en place ainsi que la facilité de génération par rapport a d’autres systemes ainsi que le fait qu’il evolue dans le temps c’etait surtout ca le principal attrait.
Par exemple le spam image pure n’a rien a voir en terme de resultat avec le spam Vi4gr4.
Bussiere

[quote=“Bussiere, post:25, topic: 30116”]je ne suis pas a l’origine de l’idée de base (voir les oeuvres généres par l’artiste)
Mais je comptais compenser les preoccupations “previsibles” (bien que parfois cela change selon les starlettes a la mode) par les differents types de spam (en gros la taille du mail a chaque fois et la taille exactes des pieces jointes genre les images) et le fait que les lois que je ne connais pas changent tout le temps et ne sont pas immuables non ?[/quote]

en fait tu propose d’ouvrir les vannes à entropies de ton systeme , mais comme je le dit dans mon precedent post , tu ne recupere pas que l’entropie , parfois meme le contraire …
mais tu n’en sais rien , ce qui donne l’illusion du caractere aleatoire sur une echelle de temps plus ou moins longue. apres a toi de voir si la constante de temps te parais suffisante .
mais attention un vrai signal aleatoire ne peut etre unqiement etre considere comme un signal cyclique avec une periode infini . C’est elegant mais dans ce cas un signal genre y=x est aleatoire selon cette definition . Ce qui n’est bien sur pas le cas ( enfin si dans certains cas , du fait de la causalité des elements observant mais là on rentre dans du maouss costaud et de sodomite d’hymenoptere )

Bussiere B)
J’aime toujours tes idées, je suis fan.

[quote=“DaRp!cH, post:30, topic: 30116”]Bussiere flowers.gif
J’aime toujours tes idées, je suis fan.[/quote]
Merchi^_^

[quote=“Patryn, post:29, topic: 30116”]en fait tu propose d’ouvrir les vannes à entropies de ton systeme , mais comme je le dit dans mon precedent post , tu ne recupere pas que l’entropie , parfois meme le contraire …
mais tu n’en sais rien , ce qui donne l’illusion du caractere aleatoire sur une echelle de temps plus ou moins longue. apres a toi de voir si la constante de temps te parais suffisante .
mais attention un vrai signal aleatoire ne peut etre unqiement etre considere comme un signal cyclique avec une periode infini . C’est elegant mais dans ce cas un signal genre y=x est aleatoire selon cette definition . Ce qui n’est bien sur pas le cas ( enfin si dans certains cas , du fait de la causalité des elements observant mais là on rentre dans du maouss costaud et de sodomite d’hymenoptere )[/quote]
ouais je commence a comprendre, en gros si ca se “répete” basiquement dans le temps (j’ai un peu mal a expliquer) c’est previsible.
Bon maintenant faut que je trouve des outils de comparaisons B)
Et j’aimerais aussi des avis sur cette methode vis a vis des autres existantes.
J’aime assez l’idée de se baser sur la créativité humaine pour générer de l’aléatoire.
Merci
bussiere

[quote=“Bussiere, post:10, topic: 30116”]non justement tu as tendance a inconsciemment taper la meme chose quand tu tappes dessus ou aux memes endroits.
Tape comme un ouf dessus et regarde le nombre de W par rapport aux autres lettres. Puis tu te limites aux caracteres les plus courants (par exemple faudrait taper mettre les majs retaper … et encore tu oublierais souvent le @ par exemple)
Je parle de cette methode comme le moyen de générer le plus d’entropie possible.

Bussiere[/quote]

Ben de tout manière même si tu cumules les algorythmes à partir d’un moment tu auras forcément des nombres qui vont revenir et à partir de ces nombres tu pourras calculer la fréquence d’itération.

Toute façon selon moi rien n’est vraiment aléatoire…

[quote=“Kudoz, post:32, topic: 30116”]Ben de tout manière même si tu cumules les algorythmes à partir d’un moment tu auras forcément des nombres qui vont revenir et à partir de ces nombres tu pourras calculer la fréquence d’itération.
Toute façon selon moi rien n’est vraiment aléatoire…[/quote]
Pareil, mais je cherche juste a diminuer le pseudo dans pseudo aléatoire. Je sais que le supprimer est impossible.
Bussiere

Je pense qu’aléatoire signifie crédiblement hasardeux et puisque que tu ne peux ni vérifier la crédibilité en elle même ni la crédibilité du hasard le mieux est de trouver un code qui te fasse croire que ces 2 facteurs sont aléatoires (du type jouer dans R mais en éliminant le plus possible la fréquence d’itération de chaque nombre et en la renouvelant qu’une fois ceux-ci tous utiliser encore une fois dans un intervalle définit puis ensuite tu changes d’intervalles et tu joues entre chacuns).

Dans ce cas le pseudo ne disparait pas si tu sais comment a été élaborer le code mais si tu ne voit que les faits et tu les compares là alors les résultats deviennent crédibles et c’est souvent le principal puisque à mon avis entre le “pseudo-aléatoire” comme tu dis et l’aléatoire il y a peu de différence.

ps: aléatoire c’est aussi instable et instable c’est qui ne répond pas aux indications et qui doit surprendre et là encore celà tiens à la perception de l’humain et à son jugement et comme tout jugement n’est que relatif…

Enfin voilà quoi

[quote=“Kudoz, post:34, topic: 30116”]Je pense qu’aléatoire signifie crédiblement hasardeux et puisque que tu ne peux ni vérifier la crédibilité en elle même ni la crédibilité du hasard le mieux est de trouver un code qui te fasse croire que ces 2 facteurs sont aléatoires (du type jouer dans R mais en éliminant le plus possible la fréquence d’itération de chaque nombre et en la renouvelant qu’une fois ceux-ci tous utiliser encore une fois dans un intervalle définit puis ensuite tu changes d’intervalles et tu joues entre chacuns).
Dans ce cas le pseudo ne disparait pas si tu sais comment a été élaborer le code mais si tu ne voit que les faits et tu les compares là alors les résultats deviennent crédibles et c’est souvent le principal puisque à mon avis entre le “pseudo-aléatoire” comme tu dis et l’aléatoire il y a peu de différence.[/quote]
Pour moi justement il y a une erreur de sémantique aléatoire viens de aléa qui signifie observation du hasard.
Ce qui je pense signifie que pseudo aléatoire veut dire qui observe grossierement les regles du hasard.
Apres regles du hasard c’est un peu un oxymore mais bon.
Bussiere
evitons de diverger parce que sinon on risque de tomber dans les pommes.

Non mais y a du bon aleatoire et du mauvais aleatoire B) Y a des aleatoires plus previsibles que d’autre. Avec des outils statistiques on peut etonnament rapidement faire des deductions tres precises de beaucoup de choses. Le spam comme “seed” d’un truc aleatoire, c’est pas une entropie suffisament bonne du tout je pense. Y a deja plein de solution hardware pour obtenir des “vrais” (de vrais) nombre aleatoires. T’en as un super exemple de tres haute qualitee basee sur plein de choses pas “informatiques/predictibles meme statistiquement”, pas plus loin que la Xbox360 la plus proche et/ou tout bon systeme de cryptographie qui est assez malin pour generer des clefs “random”.

Ou sur l’histoire du roquefort B)

Je propose l’idée de xentyr: un micro-dé de 20 dans la machine, lancé à chaque fois que c’est nécessaire, et la machine lit le résultat.

Bah quoi?

J’dois dire que comme patryn, je trouve l’idée très élégante.

Maintenant j’achoppe un poil sur la méthode comparative, là j’suis très curieux de savoir si expérimentalement on peut les comparer.
Cependant je pense comme toi qu’à changer sans arrêt les rêgles du jeu du côté spammeur, la répétabilité du truc doit s’tenir sur une période vachement longue, si on considère que le spam est quelque chose de durable (i.e. on n’arrête pas demain), que de nouvelles idées émergent constamment et p’tre aussi qu’il n’existe pas de failles quelconques dans le filtre anti-spam.

M’enfin je ne suis pas mathématicien donc je leur laisse les conclusions et autres dissertations B).

@GloP : Prédictible statistiquement c’est pas aléatoire anyway :stuck_out_tongue: (un peu comme les mecs qui te filent les solutions du loto, basées sur les occurences d’apparition de certains nombres & co :smiley: ). Enfin là c’était pour raconter n’imp, par contre j’suis curieux de savoir comment s’opère la génération de nombres aléatoires dans une 360 là, si t’as des infos.

Tu peux preciser ou c’est secret ?
Bussiere