El blog de Manolo Rodríguez

Recaptcha o cómo pedirle una parte de sus beneficios a Google

COMPARTIR
, / 1541 4
Recaptcha o cómo pedirle una parte de sus beneficios a Google

 

Todos los que navegamos por internet nos encontramos a menudo con esas imágenes que contienen palabras y números aleatorios y, en ocasiones, deformados, y que debemos colocar de forma correcta en una caja de texto.

Sirven para verificar que somos humanos y no robots y validarnos la entrada a esa página o servicio. Esta herramienta es una forma de protegernos contra el spam y se llama CAPTCHA (Completely Automated Public Turing test to Tell Computers and Humans Apart o lo que es lo mismo Prueba de Turing pública y automática para diferenciar a máquinas y humanos).

Hay una evolución de los captcha y se denomina Recaptcha. Es gratis y fue comprada por Google –qué raro que el señor Google ande por aquí– hace dos años. Tiene dos fines. El primero es el del capcha tradicional y el segundo es el de digitalizar publicaciones antiguas. Pero lo más curioso es que el trabajo más difícil lo hacemos nosotros cada vez que escribimos las palabras correctas en la caja de texto.

Una fuente de generar dinero de Google –otra más– es la digitalización de publicaciones antiguas con los Recaptcha. Acaba de terminar la del New York Times. La mayor parte de ese trabajo lo realizan máquinas que hacen todo el proceso sin que el ser humano mueva un dedo. Bueno, sí. El de encender y apagarlas. Tras escanear las hojas –se hace de forma automática–, se pasa al reconocimiento óptico de caracteres (OCR) que lee las palabras y las convierte en texto.

Sin embargo, esas máquinas no son perfectas y hay muchas palabras que, ya sea por la calidad de la publicación, la tinta o la conservación del papel, están borrosas y no las pueden leer. Y aquí es donde entramos nosotros, las personas.

recapcha

Cada vez que los programas digitalizadores de texto no reconocen una palabra la pasan a una base de datos de Recaptcha. Al utilizar este servicio siempre encontramos dos palabras deformadas e incluso tachadas. Una es de control como la del capcha tradicional y es la que reconoce la máquina. La otra es la que no reconoce el OCR y la que nos está pidiendo que digamos ‘qué pone ahí’. Si varias personas coinciden en escribir la misma palabra, la herramienta la da por válida y así vamos, entre todos, completando la digitalización.

Así que ya sabéis: cada vez que os encontréis con un Recaptcha pedidle una parte de sus beneficios a Google.


4 Comentarios

Responder

Tu dirección de mail no será publicada


*