La verdadera utilidad del ReCaptcha

 El captcha, es definitivamente una pérdida de tiempo que resulta inevitable para el buen funcionamiento de tantas webs (protege a unas 100.000 páginas web del fraude y el spam). Pero entre tanto fastidio, la misión de la charla parece encaminarse a convencer a quienes pasamos por la prueba captcha y lo odiamos, que hay algo productivo cuando interpretamos y tecleamos los extraños caracteres: estamos colaborando para digitalizar libros.





 Von Ahn creó el sistema captcha, y se lo vendió a Google en su evolución reCaptcha. Y Google, hoy utiliza el sistema para completar su proyecto de digitalización de libros, un proyecto en el que sin saberlo, participamos millones de personas a diario. Se estima que 200 millones de odiosos captcha son completados en un día, lo que suma (a un promedio de 10 segundos por captcha) unas 500 mil horas diarias. Von Ahn necesitaba convencer a los 1.600 usuarios fastidiados de su invento, que aunque es antipático, el captcha sirve para algo productivo. La idea de completar la digitalización de libros a través del captcha, es en definitiva, un consuelo para su conciencia.




 Resulta que los sistemas que escanean libros antiguos de forma automática para digitalizarlo, no son perfectos: en el reconocimiento óptico de caracteres (OCR) pueden tener dificultades para “interpretar” ciertas palabras impresas con tinta borrosa, o gastadas, una dificultad que suele alcanzar el 30% de lo escrito.
 La idea genial es mostrar esas palabras distorsionadas que las computadoras no saben interpretar a través de las pruebas captcha. Una palabra no reconocida en la parte automática de la digitalización, pasa a la base de datos de Recaptcha, que se las muestra a algún usuario que “inocentemente” la interpreta, la teclea, y la envía. Cuando varios usuarios coinciden al interpretar el mismo captcha, la palabra queda confirmada y digitalizada completando algún fragmento de un libro.
 Ésto también explica la razón por la que el sistema recaptcha nos muestra dos palabras a la hora de determinar si no somos un robot: una es para hacer el control “antirobots” tradicional, y la otra una palabra para digitalizar en algún libro. El problema es que no sabremos cual es cual.
 Von Ahn explica que con éste mecanismo se están digitalizando alrededor de 100 millones de palabras diarias, o lo que se traduce, suma dos millones de libros al año. Para más cifras, 900 millones de personas estamos a diario ayudando a digitalizar libros mientras respondemos a un reCaptcha.

Fuente: matiascallone

Comentarios

Unknown ha dicho que…
O sea que además de molestar nos hacen trabajar gratis, a ese tipo hay que pegarle un tiro en el hígado y que se muera lentamente mientras resuelve captchas
Unknown ha dicho que…
Review of the best casino games - FilmfileEurope
What's 365 벳 the biggest thing to know about casinos? A review of the best casinos 아이 벳 that 유니벳 have been founded 토토 웹 by an independent group of independent 메이저 사이트 목록 and