Cette histoire de reCAPTCHA me rappelle un Google Tech Talks vidéo (2006) dans lequel Louis Von Ahn explique ses tentatives de déjouer les tactiques des spammers. On y voit bien le cheminement qui l’a poussé à inventer reCAPTCHA, qui est une idée ingénieuse, il faut le dire.
Dès l’année 2000, Von Ahn, au sein d’une équipe à Carnegie Mellon University, avait inventé le système de CAPTCHA, pour empêcher les spammers d’ouvrir des milliers de comptes e-mail chez Yahoo, et ainsi élargir leur fillets de pêche aux $$$. Réponse des spammers ? CAPTCHA sweat shops ! Outsourcing à $2.50 de l’heure, au moyen de 720 CAPTCHA l’heure, donc 33 cents le CAPTCHA. Drôle de monde quand même…non ? (comme ces histoires des chinois qui travaillent sur des avatars de jeux en ligne, pendant que leurs proprios dorment, de façon à leur rendre plus forts avec plus de points ou pouvoir ou j’en sais moi…)
Von Ahn soulignait déjà le paradoxe du CAPTCHA : un programme qui produisait des tests qu’aucun programme peut résoudre. Et se reconnais coupable d’être l’homme qui a gaspillé beaucoup de temps aux internautes -
“En inventant les CAPTURE, je suis devenu le mec qui fait perdre du temps à tout le monde (Plus de 60 millions de CAPTCHA sont résolus chaque jour, au total, plus de 150 000 heures d’analyse humaine sont ainsi consommées quotidiennement). Donc l’idée, c’était de trouver un moyen de rendre utile ces 10 secondes” #interview chez Wired.
Il a trouvé une solution originale : la numérisation des livres !
ReCAPTCHA propose deux mots à déchiffrer. Le premier est un mot aléatoire de function anti-spam normal. Le deuxième est un mot rejeté par un logiciel d’OCR, déformé comme pour un CAPTCHA classique. Quand celui-ci est validé, il peut alors être utilisé dans le processus de numérisation du livre. Solution simple et élégante. ‘Crowdsourcing’ dans tout sa splendeur.
Pour l’instant reCAPTCHA aide l’Internet Archive, une association à but non lucratif, dans son travail de numérisation des livres du domaine public.
Parlant de crowdsourcing, on est toujours sans nouvelles de Steve Fossett ? Des dizaines des milliers de gens ont répondu présent tout de même, via Mechanical Turk, pour scruter les images de Google Earth, cherchant des traces de son avion. Je lis que Digitalglobe va lancé un nouveau satellite aujourd’hui qui va augmenter la résolution de Google Earth - entre 3 et 7.5 metres ! On baise plus dans les jardins, c’est fini les amoureux… sauf si vous voulez voir vos fesses sur Youtube ?
1 response so far ↓
1 Camille Roux // Apr 17, 2008 at 9:02 pm
Bonjour,
Article très intéressant. Il s’agit d’un sujet qui me tient particulièrement à coeur. J’ai d’ailleurs présenté une conférence sur le sujet il y a quelques jours aux Intellicore Tech Talks :
http://www.camilleroux.com/2008/04/16/humanite-calcul-human-computation/
Leave a Comment