miércoles, 4 de enero de 2012

reCAPTCHA, la forma indirecta en que todos ayudamos al mundo


Todos conocemos reCAPTCHA esa serie de palabras que nos obligan a escribir antes de registrarnos en un sitio web o algo por el estilo. 

reCAPTCHA es un servicio de seguridad adquirido por +Google el cual permite que los sistemas comprueben que tu eres un ser humano. 

¿Porque?
Antiguamente los hackers diseñaban programas que permitían registrar millones de usuarios falsos en diferentes sitios web de forma automática e invasiva, incluso en algunos casos llegaban a saturar los servidores de este. Gracias a reCAPTCHA fue posible evitar este tipo de inconvenientes.

reCAPTCHA en la digitalizacion de libros
En la actualidad existen varios proyectos que digitalizan libros a gran escala con el propósito de facilitar el acceso a la información a cualquiera que lo necesite, proyectos como Google Books e Internet Archive han digitalizado millones de libros y los a puesto a disposición de cualquiera en internet.

Para llevar acabo esas digitalizaciones utilizan softwares que son capaces de identificar caracteres en una imagen, estos sistemas son conocidos como OCR o Reconocimiento óptico de caracteres. Pero en que parte entra reCAPTCHA, muchos de los libros desde hace 50 años o mas están tan deteriorados que es casi imposible para estos softwares OCR reconocer ante que tipo de caracteres se encuentran. reCAPTCHA toma este grupo de caracteres que el OCR no pudo reconocer y lo envía a un usuario al azar que este solicitando el servicio de reCAPTCHA en algún sitio web que lo tenga integrado, el usuario ingresa los caracteres y logra comprobar al sistema que se trata de un humano y a la vez envía la versión digital de esa palabra que el OCR no pudo reconocer. Si esta palabra es igual a la de otros usuarios que recibieron la misma imagen pasa a formar parte del libro que se esta digitalizando.

Así que la próxima vez que tengan que utilizar reCAPTCHA no se frustren, solo piensen que con con esa pequeña acción están ayudando al desarrollo de esta inmensa red global que llamamos internet.



No hay comentarios:

Publicar un comentario