Clear

Un kit de herramientas para desarrollar componentes estadísticos de procesamiento de lenguaje natural en Java
Descargar ahora

Clear Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • BSD
  • Precio:
  • FREE
  • Nombre del editor:
  • ClearTK Team
  • Sitio web del editor:
  • http://code.google.com/p/cleartk/
  • Sistemas operativos:
  • Mac OS X
  • Tamaño del archivo:
  • 435 KB

Clear Etiquetas


Clear Descripción

Un kit de herramientas para desarrollar componentes de procesamiento de lenguaje natural estadístico en Java El kit de herramientas ClearTK se basa en el Marco de APACHE UIMA para el análisis de texto.Cleartk es un proyecto desarrollado en el Centro de Investigación de Idioma computacional y Educación (clara) en la Universidad de Colorado en Boulder. En pocas palabras, ClearTK proporciona un marco para desarrollar componentes de procesamiento de lenguaje natural estadístico (NLP) en Java y proporciona dos bibliotecas: CleeTK-Framework y CleeTK-Toolkit que se resumen brevemente a continuación.Cleartk Framework: The CleeTK Framework proporciona infraestructura para desarrollar UIMA Los motores de análisis que utilizan el aprendizaje estadístico como base para la creación de toma de decisiones y anotación. El marco ClearTK proporciona lo siguiente: · Una rica biblioteca de extracción de características · Una interfaz común y envoltorios para las bibliotecas populares de aprendizaje de máquinas según los modelos, como la entropía máxima, las máquinas de soporte vectorial y los campos aleatorios condicionales. Actualmente es compatible con Libsvm, OpenNLP Maxent, Mallet Clasifiers, Mallet Conditional Random Fields, Svmlight. El enfoque de los desarrolladores permite que se utilice un enfoque de mejor de la raza al permitir que uno intercambie una biblioteca de aprendizaje de la máquina para otra de tal manera que el código que implemente la lógica central del motor de análisis no tiene que cambiar. · La aplicación proporciona un enfoque agnóstico del sistema de tipo. El marco CleeTK no depende ni proporciona ningún sistema de tipo específico. El código proporcionado por el marco está destinado a ser utilizado como base para crear nuevos motores de análisis en su entorno, de manera que pueda crear componentes específicos de sus necesidades y sistemas de tipo. · El marco se puede descargar de la página de descargas, apareció en el repositorio de Subversion como un proyecto de Eclipse, o agregado como una dependencia de Maven si usa Maven para construir su proyecto (ver más abajo) .ClearTK Toolkit: El kit de herramientas ClearTK proporciona componentes de UIMA y / o infraestructura para abordar tareas específicas. El kit de herramientas proporciona lo siguiente: · Lectores de recolección para corporaciones de uso común (por ejemplo, CONLL, ACE, PENNTREEBANK, GENIA, TIMEMP) · Infraestructura para crear componentes de PNL para tareas específicas, como etiquetado de habla, trozos de estilo biológico, entidad nombrada Reconocimiento, analizante sintáctico, etiquetado de roles semánticos, resolución temporal, etc. · Envoltorios para componentes comunes de NLP, como los componentes del Snowball STEMMER y OpenNLP. · El kit de herramientas ClearTK proporciona un sistema de tipo y muchos de los componentes (y las pruebas de unidad) dependen de este sistema tipo. Sin embargo, hemos trabajado arduamente para hacer mucho del código en el sistema de tipos de tipo de herramientas Agnóstico mediante componentes parametristas por tipos o haciendo que los componentes sean extensibles a través de la escritura genérica. · El kit de herramientas está actualmente disponible como un proyecto ECLISPE que se puede verificar desde los requisitos del repositorio de Subversion: · Java


Clear Software relacionado

Pivote de apachado

Plataforma de construcción de RIA basada en Java que combina las características mejoradas de un kit de herramientas de RIA moderno con la robustez de la plataforma Java ...

234 16.7 MB

Descargar