:: TechCrunchShop ::


7 août 2006

AOL vient de mettre en ligne des données privées en quantité…

Rédigé par Michael Arrington (adaptation: Ouriel Ohayon)

mise à jour: Le lien vient d’être désactivé par AOL mais c’est un peu tard. Il semble cependant qu’il soit toujours disponible sur un site miroir.

AOL vient de mettre en ligne les données de recherche de 650 000 utilisateurs d’AOL. Ces données incluent l’historique de recherche d’une période de 3 mois ainsi que les liens cliqués pour chacune des requêtes. Il s’agit d’un fichier compressé de 439 MB qui une fois décompressé pèse 2GB : ce fichier est disponible ici (lien direct vers le fichier) et il s’agit de 10 fichiers textes concassés.

Cela est totalement ahurissant. AOL vient de dévoiler des données très personnelles sur ses utilisateurs et cela sans leur permission. Bien que l’identifiant AOL d’origine ait été substitué par un identifiant virtuel et aléatoire, il est possible d’analyser chacune des requêtes de chaque utilisateur et recomposer ainsi son identité ainsi que son comportement. Les données incluent le nom, l’adresse, le numéro de sécurité sociale et tout ce que quelqu’un peut saisir dans le cadre d’une requête.

Le problème le plus grave est que souvent les gens recherchent leur propre nom ou celui de leurs amis ou celui de leur famille pour trouver des informations disponibles à leur sujet. Et ceux qui auront effectué des requêtes délicates (genre adulte, ou « acheter ecstasy ») pourraient se retrouver sérieusement embarrassés. Imaginez le nombre de combinaisons possibles.

Certains pro du marketing déclarent que les possibilités sont infinies et appelent à un boycott d’AOL sans parler des utilisateurs furieux.

Nous supposons qu’AOL supprimera bientôt cette page mais à l’heure ou ce billet est rédigé le fichier est déjà téléchargé 809 fois. Et nous avons discuté avec certaines personnes qui en réalisent déjà une page web. Si vous êtes un utilisateur d’AOL, désolé.

Notons que Microsoft avait proposé de distribuer des données équivalentes pour la recherche avec une importante différence – les données ne sont pas associées à un utilisateur. Excite avait mis en ligne des données similaires à la manière d’AOL, avec la possibilité d’y associer des utilisateurs, c’était en 1999.

Cette histoire ne vient pas arranger l’image d’AOL secouée dernièrement par une affaire relative à son service client ou cette histoire sur cette pauvre femme qui ne parvient pas à faire résilier l’abonnement AOL de son mari décédé depuis 9 mois. Sans parler du plan récent de licenciement de 5000 personnes.

  • AddThis Social Bookmark Widget

41 Commentaires

Flux RSS des commentaires de cet article.

  1. Commentaire de Loic — 7 août 2006 @ 11:38

    effrayant.

  2. Commentaire de Anthony — 7 août 2006 @ 11:59

    Ce sont des données saisies dans le moteur de recherche AOL ?

  3. Commentaire de olivier — 7 août 2006 @ 12:32

    Le fichier n’est plus en ligne.

  4. Commentaire de Ouriel Ohayon — 7 août 2006 @ 12:41

    comme nous l’avons précisé le fichier est toujours disponible sur ce site

    miroir http://www.gregsadetsky.com/aol-data/

  5. Commentaire de olivier — 7 août 2006 @ 12:50

    Oups, je n’avais pas vu la mise à jour.

  6. Commentaire de Stéphane — 7 août 2006 @ 1:05

    Pourquoi indiquez-vous le lien pour télécharger le fichier alors qu’il contient des données confidentielles ?

  7. Commentaire de geoffrey — 7 août 2006 @ 1:13

    +1 pour Stéphane, c’est complètement stupide de décrier une mise en ligne intempestive de données confidentielles et par après de faire un lien direct vers ces sus-mentionnées données…

  8. Commentaire de Ouriel Ohayon — 7 août 2006 @ 1:19

    Bien avant TechCrunch ce fichier etait déjà pointé par de nombreux sites. Il est déjà en téléchargement sur la plupart des réseaux P2P depuis un moment.

    http://www.techmeme.com/060806/p28#a060806p28

    Au lieu de pointez ver le reflet, pointez vers la source du reflet….

  9. Commentaire de david — 7 août 2006 @ 1:38

    “Bien avant TechCrunch ce fichier etait déjà pointé par de nombreux sites.”

    Est-ce une raison pour le publier?

  10. Commentaire de ouioui — 7 août 2006 @ 1:43

    +2. relater l’information concernant AOL est une chose. Etre le relai de la diffusion de données personnelles en est une autre. Si j’étais dans cette liste, vous m’entendriez hurlé de là où je suis !

  11. Commentaire de sebclick — 7 août 2006 @ 1:48

    +1
    Pourquoi publiez le lien ?
    Cela ne rend pas le billet plus pertinent. (au contraire).
    Je trouve dommage que TechCrunch en arrive la sous pretexte que d’autres sites l’on fait avant…

  12. Commentaire de Ouriel Ohayon — 7 août 2006 @ 1:54

    Certains lecteurs semblent se méprendre sur ce billet. Le lien est très aisément à la disposition de tout internaute en effectuant la recherche sur internet.

    TechCrunch avait pour objectif d’en faire prendre conscience pour éviter que de tels épisodes puissent arriver à nouveau.

    Le fait d’en parler ou de pointer ne change en rien l’ampleur que cette histoire a déjà pris.

    Lisez les réponses de Michael Arrington à ce sujet et plaçons les choses à leur juste proportion.

    http://www.techcrunch.com/2006/08/06/aol-proudly-releases-massive-amounts-of-user-search-data/#comment-125437

    http://www.techcrunch.com/2006/08/06/aol-proudly-releases-massive-amounts-of-user-search-data/#comment-126040

  13. Rétrolien de Relation Blog — 7 août 2006 @ 2:24

    AOL divulgue des données privées de ses clients…

    AOL divulgue des données privées de ses clients
    via techcrunch…

  14. Commentaire de Flo — 7 août 2006 @ 3:01

    “Le fait d’en parler ou de pointer ne change en rien l’ampleur que cette histoire a déjà pris.”

    Sauf que vous participer également à l’ampleur de cette histoire et surtout des la diffusion de ces données. Votre résonnement est complètement nul et le contenu de ce billet aussi…

  15. Commentaire de Vincent R — 7 août 2006 @ 3:07

    Après avoir vu la structure du fichier, les utilisateurs sont différentiés par le champ “AnonID” qui est un identifiant anonyme. Par conséquent je vois beaucoup moins où ce situe la divulgation de données privées. Ce fichier va je pense être décortiqué par pas mal de monde avec des ambition plus ou moins louables.

  16. Commentaire de Eiffel — 7 août 2006 @ 3:21

    avant de taper sur techcrunch, n’oubliez pas le VRAI coupable: AOL !

    reproche-t-on aux infos de donner le nombre de morts dans le camp israelien ou libanais ou palestinien, sous le pretexte que cela attise le conflit ?

    allez-vous télécharger ce fichier parce que vous avez l’url ? non
    auriez-vous trouvé l’url si vous vouliez téléchargé le fichier ? oui

    internet est comme ça: on n’y arrete pas une info. Et parfois, cela a du bon, et parfois, non.

    par contre, il faut fermement condamner AOL, qui récolte et divulgue des infos privées.

    c’est vrai, quoi, cela tue le business: donner de l’info alors qu’il faudrait la vendre… ;-)

  17. Commentaire de Robert — 7 août 2006 @ 4:06

    Hé merde maintenant on sait que j’achète du viagra, que je vais sur des sites porno et que je vote à gauche ! Ah non je suis pas dans la liste au temps pour moi :|

  18. Commentaire de Fpardew — 7 août 2006 @ 4:16

    N’oublions pas en effet qu’AOL à fait une grosse bourde.
    N’oublions pas non plus que Techcrunch n’est pas le premier site a proposer un lien vers ces données et que n’importe quoi avec un minimum de connaissance pourra récuppérer ce fichier.

    Cependant, il est également vrai que ce n’est pas parce que tout le monde le fait, qu’il faut s’autoriser à le faire. Cela n’a rien à voir avec du journalisme et cela n’apporte rien à la crédibilité de l’article.

    Techcrunch aurait dû montrer l’exemple.

    Dommage. :-(

  19. Commentaire de Fpardew — 7 août 2006 @ 4:20

    @robert : +1

  20. Commentaire de Guillaume Jeannic — 7 août 2006 @ 5:16

    “Certains lecteurs semblent se méprendre sur ce billet. Le lien est très aisément à la disposition de tout internaute en effectuant la recherche sur internet.

    TechCrunch avait pour objectif d’en faire prendre conscience pour éviter que de tels épisodes puissent arriver à nouveau.

    Le fait d’en parler ou de pointer ne change en rien l’ampleur que cette histoire a déjà pris.”

    C’est se rendre complice d’AOL que de fournir directement un lien vers ces données sensibles. Votre raisonnement ne tient pas la route car si il est si facile de les trouver en effectuant une recherche sur internet, cela ne sert donc à rien d’en fournir un lien. C’est peut-être parce que beaucoup de sites comme vous se vanter d’aller pointer sur de telles données qu’elles sont si facilement accessibles même après qu’AOL les a retirées de son site.

  21. Ping de Easy-IT - Facilitateur Informatique » AOL diffuse les données privées de ses utilisateurs — 7 août 2006 @ 5:50

    [...] Source : TechCrunch [...]

  22. Commentaire de Soler Stéphane — 7 août 2006 @ 6:08

    Je suis d’accord avec toi Eiffel, n’oublions pas le VRAI coupable: AOL !
    Alors arretez de vous en prendre à Techcrunch.

    Pour ma part, j’ai trouvé ce billet tout à fait intéressant. Le lien était là et cela m’a juste permis de valider l’information et de me rendre compte de l’importance de la faute d’Aol.

    Bonne continuation Techcrunch.

  23. Commentaire de fabien — 7 août 2006 @ 8:38

    Eiffel > On ne reproche pas aux infos de donner le nombre de morts mais de montrer des images sanglantes pour faire dans le sensationnel et faire plus d’audience. La c’est sensiblement la meme chose, avant meme d’avoir les explications on a droit au lien vers le miroir.

    En publiant ce lien techcrunch est probablement, lui aussi, en train de diffuser des infos confidencielles sur certains de ces fidèles lecteurs…

  24. Commentaire de Ben — 7 août 2006 @ 11:39

    Peu importe que ces infos soient trouvables, ce ne peut être une justification à votre choix. Le simple fait de mentionner que ce fichier était toujours téléchargeable sur des sites miroir (sans donner le lien direct) était suffisant pour donner du crédit à votre article.
    Par ce geste vous devenez complice de cette diffusion.
    Pour ma part, l’info simple aurait suffit, mais par curiosité j’ai été voir moi aussi…. chose que je n’aurai jamais faite sans votre lien ;)

  25. Ping de TechCrunch en français » AOL: “Nous avons commis une grosse erreur” — 8 août 2006 @ 7:37

    [...] AOL s’excuse aujourd’hui après avoir volontairement diffusé les données des recherches de 650 000 de leurs utilisateurs [...]

  26. Ping de Dzey’s » Blog Archive » links for 2006-08-08 — 8 août 2006 @ 8:26

    [...] TechCrunch en français » AOL vient de mettre en ligne des données privées en quantité… (tags: web vieprivée) [...]

  27. Commentaire de Eiffel — 8 août 2006 @ 10:46

    ben > et qu’as-tu fait une fois que tu as vu le fichier ? tu l’as effacé, parce que cela ne t’interesse pas.

    fabien > si la vérité est sensationnelle et fait monter l’audience, doit-elle être cachée ?

    Je parie que si techcrunch n’avait pas mis le lien vers le fichier, nous aurions des commentaires de sceptiques qui aurait contesté l’information, en reprochant à techcrunch de faire du sensationnalisme !!!

    encore une histoire à “pile, je gagne, face, tu perds”…

  28. Ping de TechCrunch en français » Saga AOL suite: un 1er site web en place — 8 août 2006 @ 12:24

    [...] Ce n’est pas étonnant et cela devait arriver. Un internaute a mis en place une interface web des 20 millions de requêtes de recherche diffusées par AOL la semaine dernière (nos billets sont ici et là pour ceux qui n’ont pas suivi l’affaire). Un commentateur de TechCrunch qui avait trouvé le fichier de requêtes sur le web avait annoncé son intention de bâtir cette interface. [...]

  29. Ping de Jeremie Berrebi - Internet 2.1 » Parcourez les requêtes des utilisateurs d’AOL ! — 8 août 2006 @ 1:56

    [...] Les lecteurs de Techcrunch France doivent savoir qu’AOL a divulgué hier une base de données téléchargeable comprenant toutes les requêtes de 650 000 utilisateurs du moteur d’AOL US en mai dernier ! [...]

  30. Commentaire de Guillaume — 8 août 2006 @ 6:28

    Techcrunch participe à cela, tenez vous en aux faits les gars, seulement les faits…pas la peine de mettre “ce fichier est disponible ici” avec le lien direct, dommage.

  31. Rétrolien de Biologeek : Ubuntu, bio-informatique et geekeries libres d'un bio-informaticien au quotidien. — 9 août 2006 @ 1:52

    Les 100 premiers mots-clés recherchés par les utilisateurs d’AOL…

    Voici une analyse des données concernant les mots-clés et les liens suivis. C’est sommaire mais c’est un début ;-)….

  32. Commentaire de David, biologeek — 9 août 2006 @ 1:55

    Les trackbacks n’ont pas l’air de fonctionner… voici une analyse rapide que j’ai fait des données concernant les mots-clés et les liens suivis :

    http://www.biologeek.com/journal/index.php/les-100-premiers-mots-cles-recherches-par-les-utilisateurs-d-aol

    Bonne lecture :-).

  33. Ping de TechCrunch en français » Saga AOL: une première personne identifiée — 9 août 2006 @ 2:02

    [...] Suite à la mise en ligne par AOL de 20 millions de requêtes de recherche partiellement anonyme et suites aux excuses d’AOL, une première interface web a été mise en place pour consulter les données. [...]

  34. Commentaire de Moi — 10 août 2006 @ 10:24

    Ben moi je suis chez AOL, peut être que tout le monde a accès à mes recherches, mais franchement, je vois mal ce que vous pouvez en déduire… je recherche “Le Pen”, est-ce que ça veut dire que je vote FN ou que je cherche un site anti Le Pen ? Je recherche “Comment fabriquer une bombe atomique” Est-ce que ça veut vraiment dire que je veux en fabriquer une ? Qui n’a jamais fait de recherche stupide, juste pour voir le résultat qu’on avait…

    Le fait que des entreprises enregistrent nos infos n’est pas nouveaux, on ne l’empêcherra jamais, et je doute vraiment du genre d’info qu’on peut en retirer…

  35. Ping de Dzey’s » Blog Archive » Ce ne sont que des mots… mais ça en fait beaucoup ! — 10 août 2006 @ 2:11

    [...] Alors que Google s’apprête à sortir, pour le bien de la recherche en linguistique, plus de 1000 milliards de mots extraits de son index (6 DVD de full-text, tout de même), AOL vient de diffuser les données de recherche de 650 000 de ses utilisateurs (2 Go), pour le grand bonheur des défenseurs de la vie privée. [...]

  36. Ping de TechCrunch en français » Des têtes tombent chez AOL — 21 août 2006 @ 11:48

    [...] Les têtes tombent chez AOL suite à la récente saga sur les données de recherche (voir ici là là et là). [...]

  37. Ping de wide on magazine » The Google price — 1 mars 2007 @ 5:32

    [...] Those services have one huge weakness, they are storing your private and confidential information on their server. The AOL case already showed us that the amount of information is largely beyond what a normal user can easily imagine. Against that their are currently nothing stating any rules or laws and information is generally conserved during a long period of time. [...]

  38. Ping de Knowledge-me — 7 juin 2007 @ 12:20

    [...] dernier qui avais “malencontreusement” mis en ligne ce données (piqure de rappel ici). C’est sans doute plus dans ce domaine que réside le danger : la protection de ces données [...]

  39. Rétrolien de Référencement, Design et Cie — 15 juin 2007 @ 3:00

    Devenez Search Profiler !…

    La recherche sur le web n’a plus de secrets pour vous ? Vous vous sentez l’âme d’un Gil Grissom ? Devenez Search Profiler !

    Lancé par l’agence de Search Marketing CVFM, le concours “Search Profiling” vous propose de dresser le profil……

  40. Ping de AOL divulgue des données privées de ses clients at RelationBlog — 27 août 2007 @ 12:30

    [...] AOL vient de mettre en ligne les données de recherche de 650 000 utilisateurs d’AOL. Ces données incluent l’historique de recherche d’une période de 3 mois ainsi que les liens cliqués pour chacune des requêtes. Il s’agit d’un fichier compressé de 439 MB qui une fois décompressé pèse 2GB : ce fichier est disponible ici (lien direct vers le fichier supprimé par AOL) et il s’agit de 10 fichiers textes concassés. Depuis le lien a d’être désactivé par AOL mais c’est un peu tard. Un article complet est disponible sur Techcrunch. [...]

  41. Commentaire de Histoire — 27 décembre 2007 @ 10:37

    C’est vraiment intéressant, si l’on oublie la dimension “voyeurisme”, de surfer à travers ces recherches.
    1°) On comprend tout l’argent qu’ils se font avec le porno
    2°) On ne manque pas de s’étonner sur la nature des gens et ce à quoi doivent donner réponse les moteurs

Fil RSS pour les commentaires sur ce post. TrackBack URI

Laisser un commentaire

« Back to text comment