dimanche 28 novembre 2010

reCaptcha, pas seulement un captcha

Vous êtes très certainement déjà tombé sur un captcha. Un captcha c'est quoi ? et du coup, c'est quoi ce reCaptcha ?



Un captcha, est un moyen de savoir si nous avons à faire à un humain ou à un ordinateur.

Cela vous reviens ? Vous avez vu un captcha un jour ou l'autre sur la toile. Il se présente très souvent comme une question dans un formulaire, qui vous montre une image contenant un texte difficilement lisible, et vous devez identifier ce texte pour pouvoir valider votre formulaire.

Le captcha étant défini, passons à reCaptcha.

Le reCatpcha n'est donc pas seulement un captcha, il est aussi un projet d'aide aux OCRs. En effet, les OCRs (logiciel à reconnaissance de caractère) ne sont pas aussi efficace que nous humains. L'idée est donc que quand nous identifions le texte de notre captcha, nous trouvions la réponse à une reconnaissance de caractère impossible pour l'ordinateur. Une bonne idée non ?

Si vous avez bien suivi depuis le début, vous me direz, comment l'ordinateur fait pour savoir si on as écris le bon mot si il n'arrive pas à le lire et qu'il ne connait pas sa signification ? En fait, c'est très simple, reCaptcha ne vous demandes pas de reconnaitre 1 mot, mais 2 mots. Un des mots est inconnu, et l'autre est connu. Si vous avez reconnu le mot connu par l'ordinateur, c'est que vous êtes très certainement un humain, et cela veut donc dire que vous avez surement identifier le mot inconnu. Sans attendre l'ordinateur stocke donc votre réponse pour le mot qu'il ne connaissait pas. Il fait tout de même le test avec plusieurs humains, pour être plus sure.

Et voila, vous avez aider un OCR à reconnaitre un mot !!!

Aucun commentaire: