Gamera

Un marco de programación de reconocimiento de documentos.
Descargar ahora

Gamera Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • GPL
  • Precio:
  • FREE
  • Nombre del editor:
  • Michael Droettboom
  • Sitio web del editor:
  • http://ldp.library.jhu.edu/projects/gamera/

Gamera Etiquetas


Gamera Descripción

Un marco de programación de reconocimiento de documentos. Gamera Project es un marco para la creación de aplicaciones estructuradas de análisis de documentos por expertos en dominios. Los expertos en dominio son individuos que tienen un conocimiento sólido de los documentos en una colección, pero pueden no tener un fondo técnico formal. El objetivo es crear una herramienta que aproveche su conocimiento de los documentos de destino para crear aplicaciones personalizadas en lugar de intentar satisfacer diversos. Requisitos con una aplicación monolítica. Este documento proporciona una visión general de los principios de arquitectura y diseño de Gamera. Los sistemas de reconocimiento desarrollados para los documentos históricos difíciles requieren experimentación, ya que la solución a menudo no es obvia. Por lo tanto, el objetivo principal de Gamera es respaldar un ciclo de desarrollo eficiente de pruebas y refinar. Virtualmente, cada detalle de implementación sea impulsado por este objetivo. Por ejemplo, Python fue elegido como lenguaje central debido a sus capacidades de introspección, tipificación dinámica y facilidad de uso. Se ha utilizado como un primer lenguaje de programación con éxito considerable .C ++ para escribir complementos donde el rendimiento de tiempo de ejecución es una prioridad, pero incluso en ese caso, el sistema Gamera Plugin está diseñado para hacer que las extensiones de escritura sea lo más fácil posible. Gamera incluye una interfaz gráfica de usuario completa que proporciona una serie de accesos directos para la capacitación, así como la inspección de los resultados de los algoritmos en cada paso. Por la mejora de la facilidad de experimentación, esperamos poner el poder de desarrollar sistemas de reconocimiento con aquellos que entienden mejor los documentos. Esperamos que al menos dos tipos de desarrolladores trabajen con el sistema: aquellos con antecedentes técnicos que agregan algoritmos al sistema, y ​​aquellos que trabajan en la agregación de nivel superior de esas piezas. Es importante tener en cuenta esta distinción, ya que esos grupos representan diferentes conjuntos de habilidades y requisitos. Además de su apoyo al desarrollo de pruebas y refinamiento, Gamera también tiene varias otras ventajas que son importantes para los proyectos de digitalización a gran escala en general. Estos son: · Código de código abierto y cumplimiento de estándares para que el software pueda interactuar bien con otras partes de un marco de digitalización · independencia de la plataforma, que se ejecuta en una variedad de sistemas operativos, incluidos Linux, Microsoft Windows y Mac OS-X · un sistema de flujo de trabajo Para combinar tareas de alto nivel · Procesamiento por lotes · Un marco de prueba de unidades para garantizar la corrección y evitar la regresión · Componentes de la interfaz de usuario para el desarrollo y la capacitación del clasificador · Reconocimiento de la producción de confianza para que los gerentes de recolección puedan apuntar fácilmente los documentos que necesiten una corrección o diferentes estrategias de reconocimiento. Gamera tiene una arquitectura de plugin modular. Estos módulos típicamente realizan una de las cinco tareas de reconocimiento de documentos: 1. Pre-procesamiento2. Segmentación y análisis de documentos3. Segmentación de símbolos y clasificación4. Análisis sintáctico o estructural5. VentureOnce de estas tareas puede ser arbitrariamente complejo, involucra múltiples estrategias o módulos, o eliminarse por completo dependiendo del problema de reconocimiento específico en cuestión. Los pasos reales que conforman un sistema de reconocimiento completo están completamente controlados por el usuario.Pre-procesamiento implica operaciones estándar de procesamiento de imágenes, como la eliminación de ruido, el desenfoque, el des-sesgo, el ajuste de contraste, el afilado, la binarización y la morfología. La atención de estrecha y el refinamiento de estos pasos es particularmente importante cuando se trabaja con documentos históricos degradados. ¿Qué hay de nuevo en este lanzamiento: · Los complementos to_numpy y from_numpy agregaron para su apoyo a NOMPY; Los módulos numéricos en desuso y numerry han sido reemplazados por adormecidos. · Resaltar también funciona con imágenes de escala Greyscale y Onebit · Función de cambio corregida en Vigra. · El clasificador KNN ahora puede devolver diferentes medidas de confianza para la identificación principal que son seleccionables por el usuario. Consulte la documentación del Clasificador API para más detalles. · El clasificador KNN ahora funciona como se esperaba cuando K> 1; Hasta ahora, ID_NAME se ordenó por confianza, lo que significaba que siempre se devolvió los vecinos más lejanos entre los K más lejanos. · Ahora se compila con Python 2.6 (gracias a Prapat Suriyaphol)


Gamera Software relacionado

Siox

SiOX es un SDK de Java que proporciona un motor de segmentación genérico. ...

246

Descargar