Attributor traque les splogs et les infractions aux copyrights sur Internet
par Ouriel Ohayon 12 novembre 2007

attributor-logo.pngIl n’est pas un éditeur de contenus au monde dont les articles, les chansons, les vidéos et les photos ne soient pas copiées et publiées sans vergogne sur Internet. Et il n’est pas un éditeur de contenus au monde qui sache comment réagir à cet état de fait. En fait, ces entreprises ne savent même pas quoi faire face à la quantité de leurs contenus qui se retrouve déjà sur YouTube – doivent-ils attendre que Google fasse le ménage ou faut-il qu’ils créent de vagues codes d’éthique en formant le vœu pieu que tout le monde s’y pliera ?

Attributor une start’up de Redwood City prétend avoir non seulement trouvé le moyen de traquer les contenus copiés, où qu’ils puissent se trouver sur le réseau, mais aussi de pouvoir aider les auteurs et les éditeurs de contenus à décider de ce qu’il convient de faire face aux infractions sur les copyrights.

Attributor a été créée en 2005 autour d’une levée de fonds de $10 millions conclue auprès de Sigma Partners, Selby Ventures, Draper Richards, First Round Capital et Amicus. La version corporate du service a été lancée le 4 novembre dernier après six mois de tests chez Reuteurs et AP. Le prix de la licence corporate oscille entre quelques dizaines de milliers et quelques centaines de milliers de dollars, et une version édulcorée destinée aux blogueurs sera lancée en 2008 pour $6 ou $7 par mois. .

Le CEO de l’entreprise, Jeff Brock a présenté son produit au début du mois et le logiciel qui indexe environ 100 millions de pages par jour a déjà référencé 15 milliards de pages. Mais attention, Attributor n’est pas un index de mots clés, mais un moteur qui recherche des sections assez conséquentes de texte – de texte seulement car pour le moment la recherche d’image en version bêta et les vidéos devraient suivre dans le courant de l’année prochaine. Attributor fonctionne par analyse des correspondances et sépare le monde en deux univers, ceux qui pratiquent la copie intensive (plus de la moitié d’un article, par exemple) et ceux qui copient des contenus de manière plus sporadique. L’application identifie ceux des sites qui ont inclus une référence à la source originale et ceux qui ne l’ont pas fait. « Un lien… souvent, mes clients ne réclament rien de plus qu’un lien » déclare Jeff Brock.

Le tableau ci-dessous présente ce que voit un client d’Attributor. Dans cet exemple, le contenu de People.com génère 265,000 correspondances dont 103,000 occurrences ne contiennent pas de lien vers People.com

attributordashboard.png

Attributor montre également quels sites génèrent le trafic le plus important, lesquels sont financés par de la publicité, et quels réseaux publicitaires s’enrichissent le plus grâce aux contenus de ses clients. Dans l’exemple précédent, 55,000 sites qui copient les contenus de People.com sont financés par de la publicité. « A un certain niveau, Attributor peut devenir un outil de facturation » sourit Jeff Brock, mais plus sérieusement, plutôt que de se battre contre chaque site qui exploite indûment les contenus disponibles sur Internet, le CEO d’Attributor pense que son service est de nature à permettre aux éditeurs de contenus de mieux se défendre contre Google et consorts. « Si je suis un important éditeur de contenu, et que je peux identifier toutes les pages financées par AdSense qui exploitent mon contenu, alors c’est avec Google que dois discuter » résume Jeff Brock. Les clients d’Attributor pourraient demander à Google de bannir les indélicats du programme AdSense, ou, plus subtilement, de partager les revenus qui découlent de leurs contenus.

attributor-lyrics.png

A la fin des fins, c’est de liens dont il est question. Les liens sont devenus la monnaie d’échange universelle sur Internet et c’est d’eux dont dépendent la popularité des sites, et par conséquent, leur capacité à générer des revenus. Dans la plupart des cas, les éditeurs de contenus pourraient auraient bien raison de préférer une politique efficace de création de liens à une traque juridique des contrevenants ou à la mise en place de contrats de licence pour l’exploitation des contenus. Ajoutez à cela que le fait de demander un lien n’a rien de polémique et … qu’en placer un sur une page ne coûte rien !

Et tous ces liens qui s’ajoutent les uns aux autres contribuent directement à la croissance du trafic et à l’amélioration du positionnement dans les moteurs de recherche. C’est d’ailleurs ce qui est en train de se passer avec les paroles des chansons diffusées sur Internet. ‘Songs lyrics’ (paroles & musique) est un des termes les plus populairess et dans une recherche récente menée sur les 14 morceaux les plus vendus en ce moment, Attributor a trouvé 1,524 copies de leurs paroles sur des blogs et dans les réseaux sociaux.

Le seul site qui ait pris la peine de signer des accords d’exploitation de ces textes est Yahoo ! Music et pourtant, dans toutes les recherches menées sur Google pour retrouver les paroles de ces 14 chansons (et dans 81% de celles menées sur Yahoo !) Yahoo Music est dépassée largement par des sites qui utilisent ces textes hors copyright et qui mènent une politique active de création de liens. 57% de ces sites sont soutenus par de la publicité (et en particulier par AdSense) pour des sonneries de téléphone, des billets de concerts, etc. Et ce constat n’est pas réservé qu’aux paroles des chansons : lors une autre recherche consacrée à 215 recettes de cuisine publiées sur Epicurious, Attributor a trouvé 3,959 copies dont 56% étaient soutenues par de la publicité… et la plupart des sites copieurs étaient mieux placés dans les recherches… qu’Epicurious lui-même.

Et il en va ainsi de posts publiés sur Techcrunch. L’article consacré au projet OpenSocial de Google (Maka-Maka) est le 15ème post le plus copié sur TechCrunch depuis Juin dernier, loin derrière le post sur Hulu qui a été copié pour sa part 572 fois. Attributor a trouvé 243 copies du post Google Maka-Maka dont 200 recopiaient plus de 80% du texte d’origine. Moins de 40% d’entre eux contenaient un lien vers TechCrunch et 79% de ces sites hébergeaient de la publicité. Et il ne s’agit là que d’un post… une des captures d’écran ci-dessous trahit un site qui reprend l’intégralité des flux de TechCrunch, les publie dans des pages sponsorisées, oublie de mentionner les auteurs des textes et ne propose aucun lien vers le site d’origine…

Ci-dessous d’autres captures


Note d’Ouriel:
ce service sera très utilie aussi en France. Je ne compte pas le nombre de blogs qui copient intégralement les billets de TechCrunch France, ne mentionnent pas la source et en plus se permettent d’ajouter un trackback pour figurer dans les commentaires. Ces blogs fantomes n’ont aucun point de contact et polluent google et la blogosphère. Si j’ai bien compris la manière dont fonctionne attributor il n’y a pas de raison que ce service ne puisse pas être immédiatement utilisé en France

Billet traduit par Nicolas Clair et édité par Ouriel Ohayon

just-a-random-blog-maka-maka.pnghuman-capital-maka-maka.pngwebuy-maka-maka.png

Commentaires rss icon

  • Si les philosophes grecs ne s’étaient pas copiés, plagiés, nous n’en serions pas là aujourd’hui…

  • Si une start-up est capable de faire ça, j’espère que Google sera capable de reconnaître des sites dont 90% du contenu est.. des liens sponsorisés et les mettre hors circuit… et des sites comme dicodunet (70% d’adsense seulement !) et compagnie qui sont des fléaux sur Internet puisqu’il ne font que récupérer des contenus en masse via RSS et créer du contenu rapidement indexé vu la notoriété de l’annuaire de ce site (merci WRI).

  • J’adore le passage sur le copyright sur la reproduction des paroles de chansons… au bout d’un moment on frise le ridicule quand même.

    Comme ça juste en passant, je rappelle que vous avez choisi une licence creative commons qui permet de citer intégralement vos articles sans en retirer de profit certes, et en reprenant les termes de la licence.

    D’ailleurs, vous êtes tellement prompt à défendre les intérêts du full copyright que je me demande ce que fais la mention CC là en-bas !

  • Note de moi:

    Déjà que tu fais que copier les articles de techcrunch US… en plus tu fais la morale… de plus indiquant que ton blog est sous licence créative commons “Les contenus de ce site web sont publiés sous licence Creative Commons.”

    par conséquent, je vois pas l’intérêt de
    copier le contenu de ton blog qui est déjà la copie/traduction d’un autre blog.

  • T as fume quoi l ami? Depuis quand je copie?

  • j’ai arrêté la clope depuis 3 ans… mais ça m’arrive de dire encore des bétises..
    je voulais dire que techcrunch , c’est que la copie Française de techcrunch US? .. mais, c’est vrai, c’est la même chose, même société?

  • hé les gars qui “défendent” la copie libre de techcrunch par d’autre site sous couvert du fait qu’il y ai “Creative Commons” en bas de ce site…

    Faut se renseigner sur la license, “creative common” tout comme GPL ou autre licenses de ce type t’autorise pas à faire tout et n’importe quoi.

    Exemple quand tu clique justement sur le lien “CC” tu y apprend que tu est libre de partager, voir de “remixer” le contenu sous CERTAINES CONDITIONS, et notamment celle la moins respectée au monde : “Attribution”.
    Celle qui te demande de dire/citer le véritable auteur source (et non pas de t’attribuer le travail d’un autre)

  • allez Ouriel ca merite un peu plus de reponse, explique à cet idiot le principe de techcrunch Fr par rapport au techcrunch US…

    j’allucine à voir les commentaires… hey shyboy t’as vu TF1 à copier ABC: ils ont diffusé lost en francais!

    @yza: c’est bien connu le pricipe de la licence CC c’est “publier et laisser les autres monetiser votre travail sans aucune contre partie”.

    @Rom’s: j’espere qu’ils t’entendrons, ca serait merveilleux s’ils pouvaient nettoyer le net!!

    JuLiEn

  • Julien, comme disais je sais plus qui: la vie est trop courte…

Laisser un commentaire

Commenting Options

Enter your personal information to the left, or sign in with your Facebook account by clicking the button below.

Alternatively, you can create an avatar that will appear whenever you leave a comment on a Gravatar-enabled blog.

Rétrolien
  • MediaTemple Logo
  • QuickSprout Logo
  • OpenX Logo
  • Cotendo Logo