El blog de Manolo Rodríguez

¿Qué es un recaptcha o cómo pedirle una parte de sus beneficios a Google?

Una fuente de generar dinero de Google –otra más– es la digitalización de publicaciones antiguas con los Recaptcha. Acaba de terminar la del New York Times
7.01K
¿Qué es un recaptcha o cómo pedirle una parte de sus beneficios a Google?
Puntúa este post

Última actualización: 09/07/2017

 

Todos los que navegamos por internet nos encontramos a menudo con esas imágenes que contienen palabras y números aleatorios y, en ocasiones, deformados, y que debemos colocar de forma correcta en una caja de texto.

Sirven para verificar que somos humanos y no robots y validarnos la entrada a esa página o servicio.

Esta herramienta es una forma de protegernos contra el spam y se llama CAPTCHA (Completely Automated Public Turing test to Tell Computers and Humans Apart o lo que es lo mismo Prueba de Turing pública y automática para diferenciar a máquinas y humanos).

Hay una evolución de los captcha y se denomina Recaptcha. Es gratis y fue comprada por Google –qué raro que el señor Google ande por aquí– hace unos años. Tiene dos fines.

que son los recaptcha

El primero es el del capcha tradicional y el segundo es el de digitalizar publicaciones antiguas. Pero lo más curioso es que el trabajo más difícil lo hacemos nosotros cada vez que escribimos las palabras correctas en la caja de texto.

Una fuente de generar dinero de Google –otra más– es la digitalización de publicaciones antiguas con los Recaptcha. Acaba de terminar la del New York Times.

La mayor parte de ese trabajo lo realizan máquinas que hacen todo el proceso sin que el ser humano mueva un dedo. Bueno, sí. El de encender y apagarlas.

Tras escanear las hojas –se hace de forma automática–, se pasa al reconocimiento óptico de caracteres (OCR) que lee las palabras y las convierte en texto.

Sin embargo, esas máquinas no son perfectas y hay muchas palabras que, ya sea por la calidad de la publicación, la tinta o la conservación del papel, están borrosas y no las pueden leer. Y aquí es donde entramos nosotros, las personas.

recapcha

Cada vez que los programas digitalizadores de texto no reconocen una palabra la pasan a una base de datos de Recaptcha.

Al utilizar este servicio siempre encontramos dos palabras deformadas e incluso tachadas.

Una es de control como la del capcha tradicional y es la que reconoce la máquina. La otra es la que no reconoce el OCR y la que nos está pidiendo que digamos ‘qué pone ahí’.

Si varias personas coinciden en escribir la misma palabra, la herramienta la da por válida y así vamos, entre todos, completando la digitalización.

Así que ya sabéis: cada vez que os encontréis con un Recaptcha pedidle una parte de sus beneficios a Google.

 

 

¿Te gustan mis artículos? Te los mando al mail

Tu nombre

ebooks-cuadrado

2 Comments

Responder

Your email address will not be published.

Responsable: Manolo Rodríguez
Finalidad: gestión de comentarios.
Legitimación: consentimiento del interesado.
Derechos: tienes derecho a acceder, rectificar y suprimir los datos, así como otros derechos, como se explica en la información adicional.
Información adicional: puedes consultar la información adicional y detallada sobre la Política de Privacidad y Protección de datos en el siguiente enlace.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.