Hubic, le cloud à la française qu’il faut fuir

Je ne dis pas que le secret est une protection efficace (crypto 101), juste que la meilleure garantie c’est de chiffrer tes données toi même avant de les confier à qui que ce soit.

Du coup je vais peut-être juger un fournisseur d’abord sur la solidité de son infra (au sens données récupérables) et ensuite seulement sur sa sécurité. Même si les deux sont importants bien sûr.

Je disais surtout çà par rapport à des algo automatiques de DMCA, il y a eu des affaires comme çà chez Dropbox de gens qui ont mis leur ebook (acheté ou tippiak) en ligne pour lire avec Calibre, et qui ont eu des soucis. En tout cas c’est le genre d’histoires qui circulent sur les forums. Il ne faut pas céder à la paranoïa, je suis d’accord, et il s’agissait surement de fichier partagé. Mais, même dans un gros volume de données, c’est tellement facile de chercher les fichiers qui ont des hash similaires, et d’envoyer par la suite des requêtes de retrait des fichiers (si c’est pas un ban du compte), que je me méfie …

Tu as ce genre de problème que si tu distribue tes fichiers de manière publique. Ca fait 30 ans que c’est pareil pour les tippiaks: si tu (re)distribues tu finis par avoir des emmerdes… Y a trop de fichier pour calculer des hash de tout et n’importe quoi quand t’as des peta et des peta de fichiers, rien qu’en cout CPU, c’est mort a part des algos simple genre CRC/MD5 a la limite mais ca sert pas a grand chose pour garantir l’unicité globale dans ce cas. Dropbox c’est/c’etait qu’une petite partie du cloud qu’ils utilisent. Sans compter que l’énorme majorité des fichiers stockés sur les plate forme de cloud sont prives.

Yes, mais je crois savoir que pour gagner pas mal d’espace ils utilisent quand même un système de type déduplication (http://blog.fosketts.net/2011/07/11/dropbox-data-format-deduplication/ apparemment du SHA256 et probablement autre chose) pour éviter d’avoir trente fois la même donnée (ça parait logique). Mais je suis tout à fait d’accord avec toi, ils passent pas leur temps à crawler, et ils doivent juste avoir un système qui check au niveau de la création de lien public, vis à vis d’une liste de hash qui correspondent à des fichiers souvent tippiak. De toute façon, comment faire la différence entre de la musique tippiak et de la musique non tippiak une fois dl sur le cloud ? Bon n’empeche que j’aime pas l’idée d’avoir mes fichiers pro en clair, même si çà risque rien :slight_smile:

Après Gmail fouille bien les mails il me semble pour « faire de meilleures propositions/déductions/… », je vois pas ce qui empêche Amazon de faire quelques stats sur les données qu’ils possèdent non ? Tout çà ne tient qu’au condition d’utilisation donc, et comme elles ne sont ni claires, et sujette à changement régulier… Utilisateur moi même de grille de calcul, Amazon étant fournisseur de ce type de service, je ne vois pas ce qui les empêche de faire ce genre de choses sur des échantillonnages plus ou moins gros d’utilisateurs ? Bref, j’arrête le HS.

gmail c’est un vague scan de mot clé pour cibler de la pub, sur des fichiers textes simple donc ils sont les éditeurs, c’est totalement différent
amazon a part faire des stats : tel % de photo, de video, de doc, de zik, il faudrait un scan pour les tag des photos, un scan pour les id3 des mp3, un scan texte pour le contenu etc
bref ca coute un tel pognon pour … rien (je vois pas l’interet sauf dans le cas d’une plainte / enquête) qu’ils ne doivent pas le faire
Amazon s’en bourre le mou de des photos de Cuba, ils vendent pas de pub sur le drive pour du rhum etc
Google c’est différent

Je pense que le scan de mail est un poil plus complexe que ce que tu décris quand même … POur avoir un collègue qui travaille chez priceminister et voir les algo qu’ils utilisent, je pense qu’Amazon a un moteur de recherche et de proposition bien plus évolué (le but c’est quand même de te proposer des trucs à acheter). Le pognon ils en ont. Et ils en ont grâce à leur moteur de recherche et de propositions d’achats. Désolé, mais je ne pense absolument pas qu’ils s’en battent le mou.

le stockage payant chez eux et le surf sur la boutique sont 2 choses différentes.
D’un cote tu payes un service et tu envois plusieurs centaines de type de fichiers differents, de l’autre tu surfs pour y faire des achats
Qu’ils scannent tes préférences de clique sur tels sites pour ensuite te proposer l’album d’un groupe ressemblant a ce que tu as tapé c’est la base de l’e-commerce

C’est ce que je dit, le fait que çà soit deux choses différentes ne tient qu’au condition d’utilisations qu’ils mettent en oeuvre. Et les conditions d’utilisations … google centralise de plus en plus les informations qu’ils collectent pour les redistribuer dans leur différents services, je ne vois pas pourquoi amazon se priverait de le faire un jour …

Sauf qu’en pratique tout est fait pour faire exactement le contraire de ce que tu dis, a savoir implementer une ligne très claire entre Amaozn le marchand de chaussure/livres/tout et Amazon le fournisseur d’infra cloud. Il y a aucun désir ou ambition d’aller voir dans des données privées pour n’importe quelle raison que ce soit. C’est un element de rupture de confiance et une énorme partie du business de cloud repose sur cette confiance. Amazon le site web a beaucoup d’infos (limite a plus savoir qu’en faire) sur le comportement de ses utilisateurs au niveau achats et shopping etc :slight_smile: ils ont pas besoin de données sur des utilisateurs pros qui ont rien a voir et qui balancent des teras de données qui peuvent être tout et n’importe quoi, d’une sequence de genome (c’est gros…), des giga de fichiers de logs ou une collection de MP3. C’est des profils comportements différents et essayer de les réconcilier est quasi impossible et pas rentable. Le contenu est pas intéressant a ce niveau la. Apres les services qui sont construit par dessus si ils sont spécifiques a une industrie ou une utilisation particulières peuvent faire des trucs, mais c’est indépendant du provideur d’infra tout en bas.

1 « J'aime »

Ok, ça me va mieux comme argument pour Amazon :slight_smile: Mais je ne suis pas convaincu d’une façon générale sur l’inintérêt pour une grande boite de ce genre de croisement. J’ai quand même l’impression que cette politique existe, ne serait ce que chez notre ami google, qui met tout en place pour croiser l’information à tout les niveaux, quelque soit sa provenance ou sa nature (y compris ce qu’il y a sur drive …) J’arrive pas à le retrouver, mais l’article sur l’autocorrection des cartes sur google map par le croisement de différentes sources d’informations en mode auto était impressionnante. Mais comme tu dit, on n’est pas sur du label pro ou la confiance compte avant tout (même si dans les faits, la limite est beaucoup plus flou, car beaucoup de monde utilisent ces services pour faire du pro … moi le premier)

mais google tu payes pas et amazon c’est une offre pro, ou tu as un contrat de confiance et un engagement de la part de la boite.
Dans l’autre c’est bien écrit dans la CLUF que des bots jettent un oeil pour te filer des pubs car tu as 15go de cloud pour rien et que ca se paye un peu tout de même.

Dans les 2 cas c’est assez clair, après evidement tu peux avoir une dérive pour une raison X ou Y, mais je vois pas et Glop le confirme, le simple interet pour amazon de claquer du blé dans un scan “fourbe” pour x milliers de clients alors qu’ils ont des datas “légales et offertes” via les cookies et autres astuces sur des centaines de millions.

Euh, je paye pour avoir plus d’espace sur Drive, et c’est les mêmes conditions ils me semblent … Ok pour Amazon (l’argument de glop de la confiance pour les pro m’a convaincu), mais ce qui est valide pour le business d’Amazon ne l’ai pas forcément pour les autres, comme google, qui brassent des intérêts et des produits à long terme beaucoup plus large.

Ps : je cherche pas le mal partout, je reste juste sur la défensive sur ce type de service. Je veux dire, si on m’avait dit qu’il y aurait des panneaux publicitaires vidéos synchronisés partout à 1 mètre d’intervalle dans la gare de Saint Lazare y a 10 ans je me serais bien marré. Si maintenant on me dit que dans 5 ans les panneaux pourront adapter le type de pub aux personnes qui passent devant, je rigole beaucoup moins, et je me dit que c’est tout à fait possible. Qui sait donc ce que seront les CLUF de ces grosses boites dans 5 à 10 ans et de l’utilisations des données personnelles qu’on leur filent, j’en sais foutrement rien ?

C’est pas impossible, ça existe déjà ou c’est en phase d’être mis en place #beacon

Y a pas de secret: si tu payes pas, le produit c’est toi.

Je me permets malgré tout de signaler ce passage des CLUF. Histoire de.

« 3.3 Notre utilisation de Vos Fichiers aux fins de la fourniture du Service. Nous pouvons utiliser et conserver Vos Fichiers et avoir accès à ceux-ci afin de vous fournir le Service et de faire respecter les conditions du présent Contrat et vous nous donnez expressément toutes les autorisations requises à ce titre. Ces autorisations incluent notamment les droits de copier Vos Fichiers à des fins de sauvegarde, de modifier Vos Fichiers pour en permettre l’accès sous différents formats et d’avoir accès à Vos Fichiers pour vous apporter une assistance technique. Amazon respecte votre confidentialité et Vos fichiers sont soumis à la politique de protection de vos informations personnelles d’Amazon.fr »

Le respect des conditions du contrat en question c’est notamment:

« Vous ne pouvez pas partager de fichiers (a) qui contiennent un contenu diffamatoire, menaçant, abusif, pornographique ou autrement répréhensible, (b) qui préconise le sectarisme, la haine ou la discrimination illégale, ou © si partager ces fichiers viole la règlementation en vigueur, un quelconque droit de propriété intellectuelle, la réglementation en matière de publicité, de données personnelles, ou tout autre droit des tiers, ou toute licence ou autre contrat auquel vous êtes lié. »

Et l’article renvoie donc directement aux conditions générales d’utilisation des services amazones pour les questions de vie privée qui assume complétement la collecte. Je ne suis donc pas certain qu’il y ait deux poids deux mesures.
Voilà voilà…
Disclaimer: I :heart: Amazon hein…

je pense que c’est la dans le cadre de requisitions judiciaires
S’il n’y avait pas ca et qu’ils donnaient l’accès à X ou Y le demandant légalement, ca pourrait poser des problèmes

C’est la base hein, même sur GZ on est obligé de mettre des trucs débiles. :wink:

3 « J'aime »

Raah, on a atteint un nouveau niveau ce matin, avec impossibilité de se connecter au service…

1 « J'aime »

Ah c’est pour ça que GZ était down ? :ninja:

4 « J'aime »

Ohoh Clubic linke cet article dans leur news sur OVH :slight_smile: !!!