Convertir imagenes escaneadas y PDFs en texto con Google Docs

image

Google Docs acaba de implementar una nueva función, que nos permite convertir el texto que encuentra en imágenes escaneadas o PDFs.

Basta con dirigirnos a Google Docs, tratar de subir un archivo, y activar la opción “Convertir el texto de archivos de imagen o PDF a documentos de Google Docs”.

Esto hará que, la próxima vez que subamos una imagen, o un PDF, ésta pasará por el sistema de reconocimiento de texto (OCR) de Google, y nos devolverá un documento totalmente editable. OCR, u Optical Character Recognition, no es más que el acto de coger esta imagen (que, por supuesto, tiene que tener un buen nivel de detalle), y tratar de reconocer los caracteres como letras. Por eso, es importante siempre que el software (o en este caso, la aplicación web) esté configurada en nuestro idioma, ya que siempre hay un margen de error.

 

 Screen shot 2010-06-22 at 10.13.41 AM

 

Hace poco vimos OCR Online otra alternativa en la Web, sólo que, en lugar de utilizar Google Docs, nos devolvía el archivo en RTF, Doc, o texto plano. En las pruebas realizadas, ambos Google Docs como OCR Online funcionaron muy bien en español, cometiendo errores (como los de la foto) sólo cuando el documento estaba mal escaneado, o tenía una resolución pobre.

Como siempre, no llegarán al nivel de calidad de ABBYY FineReader, el mejor programa para OCR, pero para sacarnos del apuro, tanto OCR Online como Google Docs, funcionan a la perfección. Y sí, otra muy buena razón para empezar a utilizar más y más Google Docs.