OCR para Ubuntu, rápido y eficaz

Hace un días tuve que echar una mano a escanear unos documentos y convertirlos a texto para después ser retocados. Después de una dura búsqueda, al final recurrí al modo comando, que aunque parezca más complicado, siempre nos saca de los apuros.

En esta ocasión, la mayor parte del documento a escanear era texto, con muy pocas imágenes, por lo que funcionó con muy buen resultado.

El comando a ejecutar es:

djpeg -pnm -gray “Imagen_001 000.jpg” | gocr – > texto_001.txt

Lo primero es convertir la imagen a escala de grises, para después pasarle el ocr sin que tarde demasiado y con una imagen con menor peso, para finalmente redireccionar la salida estándar a un fichero de texto para tener el resultado guardado.

gocr funciona bastante bien, aunque se nota que no está adaptado al Castellano y algunos caracteres “nuestros” no los detecta como es debido, por lo que tendrás que repasar un poco el documento final para corregirle los fallos.

[ad#ad-1]

Comments are closed.