19 junio, 2010

Las máquinas que leían los libros que escribimos (OCR)



El otro día os hablaba de "What's the font?", la aplicación online de Myfonts.com que reconoce fuentes tipográficas a partir de una foto. Hoy os explicaré algo similar, una tecnología bastante antigua a ido evolucionando y es tan o más útil que la otra. Su nombre es OCR y significa "Reconocimiento optico de caracteres".

A decir verdad el proceso que realiza es el mismo que el de  "What's the font?" pero con distinto resultado. Cuando el software OCR obtiene la foto de un texto cualquiera realiza un análisis formal de todo el contenido de la foto en busca de palabras. En lugar de identificar a qué el tipo de letra pertenece, interpreta
las letras, símbolos, números y espacios que aparecen en la imagen. De este modo podremos conseguir que nuestro ordenador sea capaz de leer un documento en papel y que lo convierta en caracteres de texto editables en cualquier programa.

Casi con todos los escáners del mercado siempre se adjunta una aplicación de reconocimiento de texto y la verdad funcionan muy bien. Sin embargo es una técnica que no se utiliza muy a menudo y por eso resulta engorroso tenerla instalada la aplicación correpondiente. Y ya que estamos inmersos en la era digital, de la web y del "todo en la nube" tambien existe la oportuna aplicación online para el reconocimiento óptico de caracteres. Os dejo algunos de los enlaces que os llevarán a páginas con servicio OCR on-line.




No he probado ninguna de estás páginas web así que no voy a hacer un tutorial paso a paso como el del otro día. Sin embargo, como el funcionamiento siempre es calcado sí puedo dar unas pautas y recomendaciones para obtener los mejores resultados.

El primer paso siempre consiste en subir una imagen con el texto a interpretar. Mi consejo siempre es el mismo: sube la imagen tal como a ti te gustaría leerla. Piensa que la máquina que procesará tu foto en la "nube" es una caja tonta con una serie de órdenes, parámetros y diccionarios a los que consultar. El resultado seguramente será muy bueno, pero nunca llegará a compararse con la capacidad de lectura de una persona. Por eso procura que la imagen sea lo más nítida y clara posible. Para ello mantén limpia la zona de escaneado para evitar que restos de polvo y pelillos transformen una "l" en una "t".

Si puedes tratar la imagen antes de subirla te recomiendo contrastar los claros y oscuros al máximo (sin llegar a ver dientes en los bordes) hasta llegar a un fondo blanco y letras negras. Con un escáner no suele ocurrir, pero al hacer una fotografía a un libro la distorsión puede ser un problema, por tanto corrígela todo lo que puedas.
Por último ten en cuenta la resolución y formato de la imagen ya que eso determina la nitidez de las letras y el tamaño del archivo. Y ya que vamos a subirla a la red por una conexión a internet no se nos puede ir la cabeza. Un A4 a unos 600 ppp en CMYK y TIFF dará un excelente resultado pero quizás es demasiado pesado para nuestras conexiones ADSL. Con 450 ppp y en escala de grises ya irás sobrado, y si lo grabas en JPG con un índice de compresión más bien bajo, el tamaño final difícilmente superará las 2 Mbs.

Finalmente cuando hayas subido la imagen y te haya devuelto un archivo de texto ¿NO OLVIDES REVISARLO TU MISMO!

No hay comentarios: