Ellogon

Ellogon es un entorno de ingeniería de idiomas general multilingüe, multilingüe
Descargar ahora

Ellogon Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • GPL
  • Nombre del editor:
  • Georgios Petasis
  • Sistemas operativos:
  • Windows All
  • Tamaño del archivo:
  • 10.6 MB

Ellogon Etiquetas


Ellogon Descripción

Ellogon es un entorno de ingeniería de idiomas general multilingüe, multilingüe, desarrollado para ayudar a ambos investigadores que están investigando en la lingüística computacional, así como a las empresas que producen y ofrecen ingeniería de idiomas Ellogon como una plataforma de ingeniería de idiomas ofrece un amplio conjunto de instalaciones, que incluyen herramientas para procesar y visualizar datos textuales / html / xml y información lingüística asociada, soporte para recursos léxicos (como crear e incrustar lexicos), herramientas para crear corbatas anotadas, accediendo a las bases de datos. , comparando los datos anotados, o transformando información lingüística en vectores de uso con varios algoritmos de aprendizaje de la máquina. Durante la última década, se han presentado una gran cantidad de infraestructuras de software que apuntan a facilitar la Facilitación de RD en el campo del procesamiento de lenguaje natural. Algunas de estas infraestructuras, como las herramientas o la puerta de LT-NSL / LT-XML, se han vuelto extremadamente populares a medida que se han aplicado a una amplia gama de tareas de muchas instituciones de todo el mundo. Ellogon pertenece a la categoría de plataformas referenciales o basadas en anotaciones, donde la información lingüística se almacena por separado de los datos textuales, que tiene referencias al texto original. Basado en el modelo de datos de Tipster, Ellogon proporciona infraestructura para: · Administración, almacenamiento e intercambio de datos textuales, así como la información lingüística asociada. · Crear, incrustar y administrar componentes de procesamiento lingüístico. · Facilitar la comunicación entre diferentes componentes lingüísticos definiendo una interfaz de programación adecuada (API). · Visualizar datos textuales y información lingüística asociada. Ellogon comparte el mismo modelo de datos que la arquitectura de Tipster. Debido a esto, comparte algunas características básicas con otras infraestructuras basadas en tipster, como la puerta. Sin embargo, también ofrece una gran cantidad de características que lo diferencian de tales infraestructuras. El elemento central para almacenar datos en Ellogon es la colección. Una colección es un conjunto finito de documentos. Un documento de Ellogon consta de datos textuales, así como información lingüística sobre los datos textuales. Esta información lingüística se almacena en forma de atributos y anotaciones. Un atributo asocia un tipo específico de información con un valor escrito. Una anotación asocia información arbitraria (en forma de atributos) con porciones de datos textuales. Cada una parte de este tipo, en nombre SPAN, consiste en dos compensaciones de caracteres que denotan el inicio y los caracteres finales de la parte, medidos desde el primer carácter de algunos datos textuales. Las anotaciones generalmente consisten en cuatro elementos: · Un identificador numérico. Este identificador es único para cada anotación dentro de un documento y se puede usar para identificar de manera inequívoca la anotación. · Un tipo. Los tipos de anotación son valores textuales que se utilizan para clasificar las anotaciones en categorías. · Un conjunto de spans que denotan el rango de los datos textuales anotados. · Un conjunto de atributos. Estos atributos generalmente codifican la información lingüística necesaria. Ellogon en su forma actual satisface todos estos requisitos. Cuando Ellogon se basa en la arquitectura de Tipster, comparte muchas propiedades básicas con otras infraestructuras basadas en Tipster como Puerta. Sin embargo, Ellogon ofrece varias características importantes que lo diferencian de infraestructuras similares: · Fácil desarrollo de componentes Es bastante fácil entender el proceso de desarrollar nuevos componentes y desarrollarlos utilizando las funcionalidades proporcionadas por Ellogon. Además, se admiten una amplia gama de lenguajes de programación para el desarrollo de componentes, incluyendo C, C ++, Java, TCL, Perl y Python. · Entorno de desarrollo integrado ElLogon opera como un entorno de desarrollo integrado, ya que proporciona un apoyo completo al ciclo de desarrollo de un componente. Los componentes pueden ser creados, editados, compilados y vinculados (ya sea aplicables) desde el interior de Ellogon. Además, los componentes C / C ++ / Java pueden descargarse, modificados, compilados y recargados en Ellogon sin tener que renunciar a Ellogon. La capacidad de descargar o volver a cargar todos los componentes es esencial, ya que puede reducir significativamente el ciclo de desarrollo, ya que las modificaciones de los componentes se pueden evaluar de inmediato. · un componente listo para usar "caja de herramientas" Ellogon está equipado con una gran cantidad de herramientas listas para usar para realizar tareas, como la creación anotada de cuerpos, la generación de vectores o la comparación de datos. Además, se proporcionan varios componentes de muestra que se pueden adaptar a varios dominios e idiomas, que realizan algunas tareas básicas, como la tokenización, el etiquetado de la parte de voz o la búsqueda de la lista de diccionario geográfico. Finalmente, Ellogon ofrece varias herramientas de visualización de datos, que van desde viejos simples para la base de datos de anotación a los espectadores capaces de mostrar información jerárquica, como los árboles de sintaxis. · Despliegue fácil Cuando Ellogon implementa una arquitectura descomposición, es extremadamente fácil crear un producto fácil de usar de un conjunto de componentes que realizan una tarea específica. Todos los componentes junto con las piezas de Ellogon necesarias se pueden empaquetar en un solo ejecutable (que no necesita instalación) o como una aplicación (que se puede pasar sin modificar en sistemas de múltiples operaciones). Estas aplicaciones especializadas se pueden distribuir y utilizar en cualquier sistema, incluso si Ellogon no se ha instalado en el sistema. Requisitos: · TCL / TK 8.4 (o más nuevo), · Java JDK / JRE 1.4.1 (Opcional), · Perl 5.8.1 (Opcional), · Python 2.2 (opcional).


Ellogon Software relacionado

Palmero alemán inglés especial

Diccionario Inglés / Alemán y Alemán / Inglés (más de 600,000 entradas). Thesaurus Español (280,000 entradas) y Tesauro Alemán (280,000 entradas). Conjugación de inglés (500,000 formas conjugadas) y conjug. ...

148 11.6 MB

Descargar

Palmero español inglés especial

TrueTerm especial inglés-español -Palmos. Diccionario inglés-español-inglés, tesauro y conjugación inglés y español. Diccionario editable con diccionario de usuario. Cada combinación de idioma contiene tw ...

281 9567K

Descargar

Thesaen-PC TrueTerm

Diccionario editable, monolingüístico de los sinónimos: Demoversion Alemán, Inglés (GB / US), Español, Italiano, Francés, Portugués (incl. Brasileño), Holandés y Sueco. Demoversion incluye un extracto de 300 ...

167 5177K

Descargar

Alterarn

Programa educativo que utiliza el método único para aprender idiomas extranjeros. Este método le permite aprender palabras extranjeras y estudiar la ortografía sin interrumpir su trabajo. ...

193 1,530K

Descargar