Herramientas J4L OCR

Java OCR components Toolkit
Descargar ahora

Herramientas J4L OCR Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • Shareware
  • Nombre del editor:
  • J4L Components
  • Sistemas operativos:
  • Windows All
  • Tamaño del archivo:
  • 15 MB

Herramientas J4L OCR Etiquetas


Herramientas J4L OCR Descripción

J4L OCR Herramientas es un conjunto potente de componentes diseñados para incluir capacidades de OCR en aplicaciones Java. Eso significa que puede recibir faxes o escanear documentos y extraer información comercial de las imágenes. Los 2 componentes principales son: · Una envoltura Java para el motor OCR de Tesseract. El propio motor de OCR Tesseract se entrega bajo la licencia Apache 2.0 y admitimos una versión compilada solo para Windows. · Un analizador de documentos de texto. Por lo tanto, el proceso de reconocimiento de imágenes se puede dividir en 2 pasos: · El componente toma un archivo de imagen (TIF, PNG, JPG, etc.) y devuelve el texto contenido en él. El envoltorio Java realizará esta operación utilizando Tesseract. Alternativamente, puede usar cualquier otro motor OCR. · En el segundo paso, su solicitud de Java debe comprender el texto devuelto por el motor OCR. Esto es hecho por el analizador de documentos. El analizador de documentos utiliza como entrada como cadena de texto (los datos) y un archivo XML que describe la estructura del documento y el OUPUT es un documento de negocios, ya sea como un objeto Java o como un archivo XML


Herramientas J4L OCR Software relacionado

Ljparser

Una plataforma en desarrollo para la búsqueda web y la minería. ...

161 17.5 MB

Descargar