| Levantado UpLUG es una colección de herramientas para el procesamiento lingüístico del cuerpo, la alineación de la palabra y la extracción a plazo de las cuerpas paralelas. |
Descargar ahora |
Levantado Clasificación y resumen
- Nombre del editor:
- Joerg Tiedemann
Levantado Etiquetas
Levantado Descripción
Uplug es una colección de herramientas para el procesamiento lingüístico del corpus, la alineación de las palabras y la extracción a plazo de las cuerpas paralelas. Uplug es una colección de herramientas para el procesamiento lingüístico del corpus, la alineación de las palabras y la extracción a plazo de las cuerpas paralelas. Varias herramientas se han integrado en las herramientas UPLUG.PRE, incluyen un divisor de oraciones, tokenizador y un tagger parcial de habla externo y analizadores poco profundos. Se utilizan las siguientes herramientas externas: el sistema GROK para el inglés (etiquetado y la fragmentación) y el analizador morfológico persiguen los japoneses. Otras herramientas como el Treetagger se puede agregar fácilmente. Los documentos traducidos pueden alinearse con la oración utilizando el enfoque basado en la longitud por Gale e Iglesia. Las palabras y frases se pueden alinear utilizando el enfoque de alineación de la pista y la caja de herramientas para capacitar modelos de alineación estadística Giza ++. Novedades en esta versión: · Conversión robusta de codificaciones en tag.pl/toktag.pl/chunk.pl· Scripts de inicio de Treetagber agregados para ES y NL, reemplace "nbsp" a "" · conversión robusta entre codificaciones en bitext-indexter.pl_opus-indexer.pl· Scripts de inicio agregados para modelos españoles y de tagger de árbol holandés · Scripts de inicio actualizados para otros modelos de Treetager de acuerdo con la última distribución de Treetager · Hunalign fijo (ERROR en la salida de alineación conversión a XML) · Se agregó falta ';' en la linea 40 en uplug.pm
Levantado Software relacionado