Implementación de Java OCR

Esto es principalmente solo curiosidad, pero ¿hay implementaciones de OCR en Java puro? Tengo curiosidad de cómo esto funcionaría puramente en Java, y OCR en general me interesa, así que me encantaría ver cómo se implementa en un lenguaje que entiendo completamente. Naturalmente, esto requeriría que la implementación sea de código abierto, pero todavía estoy interesado en soluciones exclusivas, ya que al menos podría verificar el rendimiento en ese caso.

He visto un par que se puede usar en Java (como Asprise ) pero no parece que sean implementaciones de Java puro … ¿hay alguno?

Recomiendo probar el proyecto Java OCR en sourceforge.net. Originalmente lo desarrollé, y tengo un blog publicado en él .

Desde que lo puse en sourceforge, su funcionalidad se ha ampliado y mejorado bastante gracias al gran trabajo de un investigador / desarrollador voluntario.

Pruébalo, y si no te gusta, ¡siempre puedes mejorarlo!

Hemos probado algunos motores de OCR con Java como Tesseract, Asprise, Abbyy, etc. En nuestro análisis, Abbyy dio los mejores resultados.

Si está buscando una opción muy extensible o tiene un dominio de problema específico, podría considerar hacer su propio uso del Motor Neural Orientado a Objetos de Java . Otra referencia JOONE .

Lo utilicé con éxito en un proyecto personal para identificar la letra de una imagen como esta , aquí puede encontrar toda la fuente del componente OCR de mi aplicación en github.

Hay una variedad de bibliotecas de OCR por ahí. Sin embargo, mi experiencia es que las principales implementaciones comerciales, ABBYY, Omnipage y ReadIris, superan con creces las implementaciones de código abierto u otras implementaciones menores. Estas bibliotecas comerciales no están diseñadas principalmente para trabajar con Java, aunque, por supuesto, es posible.

Por supuesto, si su interés es aprender el código, las implementaciones de código abierto harán el truco.

Acabo de encontrar este (no lo sé, no probado, mírate)

Ron Cemer Java OCR


Como solo necesita esto por curiosidad, puede buscar en la fuente de este applet.

Hace OCR de caracteres escritos a mano con una neural network

OCR de Java: Reconocimiento de escritura a mano