reCAPTCHA: se servir des captchas pour la numérisation de livres
  • 12 Commentaires
par Michael Arrington (adaptation: Ouriel Ohayon) 19 septembre 2007

recaptcha.pngCaptchas est connu pour lutter contre les spams et authentifier les humains. Toutefois, ReCaptcha est plus malin encore, puisqu’il vous permet d’aider à numériser des livres scannés sur Internet. C’est un projet de l’école en science informatique de Carnegie Mellon.

Les archives Internet contiennent près de 200 000 copies scannées de livres. Certains sont visuellement tres réussis comme ce livre pour enfants, cependant une trop grande sophistication visuelle peut rendre la conversion numérique difficile pour des ordinateurs. Un peu comme l’ application Mechanical Turk, reCaptcha utilise les humains afin de traduire les images de mots scannés que la machine ne peut comprendre. Le “Mechanical Turk” avait été utilisé pour les recherches de Jim Gray et Steve Fosset.

Les mots scannés sont placés aux cotés du widget classique de Captcha de manière à ce que les utilisateurs puissent traduire les deux en même temps. Le mot peut-être revu plusieurs fois par différentes personnes afin de limiter les erreurs. Captchas offre la possibilité de convertir beaucoup de mots. Les fondateurs de ReCaptcha, Luis von Ahn et Ben Maurer estiment à 60 millions le nombre de captchas résolus chaque jour; S’il faut 10 secondes pour répondre à un captcha, cela équivaut donc à 160 000 heures “humaines” par jour (soit 19 ans).


recaptchawidget.png

Pour une meilleure gestion du temps et de l’effort, reCaptcha propose son service via des widgets captcha et une API. Ils ont aussi un service qui protégera les adresses email publiées en ligne. Vous pouvez protéger votre adresse ici et l’enregistrer. ReCaptcha vous fournit alors un code à coller sur votre adresse protégée comme ceci: n@techcrunch.com. Pour obtenir l’adresse, cliquez sur les points et répondez au Captcha. C’est excellent de voir des projets comme celui-ci, mobiliser juste un peu de notre temps pour résoudre des problèmes complexes et importants.

Billet traduit par Alain Eskenazi.

Commentaires rss icon

  • Les projets de Luis von Ahn sont passionnants. Dans la même lignée, il a fait beaucoup de recherche sur le jeu utile notamment avec l’ESPgame servant à tagguer une banque d’image. La Google Tech Talk qu’il a donnée est vraiment passionnante et je conseille les intéressés de la visionner.

    P.S. : je pense qu’il y a une petite coquille “60 millions le nombre de captchas vendus chaque jour”, ne serait-ce pas “vus” et non pas “vendus” ?

  • Le projet me plaisait beaucoup et je l’ai donc essayé: Au bilan, je suis plutot mitigé sur la mise en oeuvre. Beaucoup de textes sont trop durs à lire pour l’internaute moyen (en particulier à cause du trait qui passe souvent au “mauvais endroit”) et le bouton reload ne suffit pas , à mon avis, à lever cette barriere. En tout cas, c’est une excellente idée et je suis sur qu’avec un peu de retour sur expérience ils vont réeussir à ameliorer l’expérience utilisateur.

  • Bonjour

    Exact Raphaël, c’est vu et non vendu.

  • Super !
    Merci d’en avoir parlé sur techcrunch, ça peut marcher que si il y a beaucoup de monde dessus !

  • C’est astucieux.
    J’ai mis du temps à comprendre.

    Voici ce que j’ai compris. Il y a deux mots.
    Le premier est un vrai “captcha”, dont la machine est sûre du contenu. C’est ce mot qui permttre de vérifier que la saisie d’un humain.
    Le second, la machine n’en est pas s

  • Le seul problème avec ce système c’est que niveau accessibilité c’est zéro pointé.
    Toutes les personnes malvoyantes qui utilisent des navigateurs à synthèse vocale ne peuvent utiliser les formulaires protégés par ce système.

  • loadphoenix : c’est sur que c’est dommage pour les mal-voyants qui ne peuvent pas poster un commentaire à cause d’un captcha.
    Mais comme ce système de captcha permet de numériser des livres, je pense qu’au final, les mal-voyants y sont gagnants. Car qui dit livre numérisé, dit livre potentiellement accessible (en grossissant la police, en utilisant des lecteurs de braille, ou synthèse vocale)

Laisser un commentaire

Commenting Options

Enter your personal information to the left, or sign in with your Facebook account by clicking the button below.

Alternatively, you can create an avatar that will appear whenever you leave a comment on a Gravatar-enabled blog.

Rétrolien
  • Actively Discussed Posts
  • Il n'y a pas de billets à afficher
  • MediaTemple Logo
  • QuickSprout Logo
  • OpenX Logo
  • Cotendo Logo