Poliqarp

Poliqarp es una utilidad para buscar grandes cuerpos.
Descargar ahora

Poliqarp Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • GPL
  • Precio:
  • FREE
  • Nombre del editor:
  • Daniel Janus
  • Sitio web del editor:

Poliqarp Etiquetas


Poliqarp Descripción

Poliqarp es una utilidad para buscar grandes cuerpos. Poliqarp es una utilidad para buscar grandes cuerpos. Aquí hay algunas características clave de "Poliqarp": Soporte para Tagged CORPORA: · La colección buscada no puede contener no solo texto crudo, sino también información sobre las palabras y textos que lo constituyen (formas gramaticales de palabras; estructura de los textos; varias metaduras sobre los textos como la autoría y la fecha de escritura). Idioma de consulta expresiva: El idioma de la consulta de Poliqarp se basa en expresiones regulares y le permite buscar no solo una palabra o secuencias de palabras dadas, sino también, por ejemplo, para: · Un adjetivo seguido de un sustantivo. · Cinco sustantivos seguidos · Cinco, seis, o siete sustantivos seguidos. · Una palabra dada que ocurre cerca, pero no necesariamente a continuación, a otra palabra dada · Palabras que comienzan con 'z' que ocurren en textos publicados en el siglo XIX. · Oraciones de más de 100 palabras. · ...y muchos más Soporte para tagsets posicionales: · Las etiquetas asignadas a las palabras pueden tener una estructura interna, y esta estructura puede incorporarse en las consultas. Por ejemplo, los sustantivos pueden tener género, número o caso, los verbos pueden tener un aspecto, y así sucesivamente. · Esto es especialmente útil con los idiomas que son ricos en la inflexión, como el polaco (de hecho, Poliqarp se desarrolló originalmente y se utiliza dentro de un proyecto polaco Corpus: el IPI PAN Corpus). · No depende de un tagset particular · Soporte para Unicode · Puede crear cuerpos de textos escritos en casi cualquier idioma en su script nativo: sea inglés, polaco, japonés o tailandés, siempre que estén codificados en el formato UTF-8. Soporte para ambigüedades: · Las etiquetas de una palabra no son necesariamente únicas: puede ocurrir situaciones en las que una palabra se puede interpretar de varias maneras (y, por lo tanto, tener varias etiquetas asignadas a ella). Poliqarp puede manejar tales situaciones y le permite decir si su consulta debe coincidir con cualquiera de las posibles interpretaciones o todas. Pocos, si los hay, otros concordencientes tienen esta habilidad. Multiplataforma: · Poliqarp está escrito en Java y C y, por lo tanto, está disponible para Windows y la mayoría de los sistemas similares a Unix, incluidos Linux, * BSD y Solaris. Actualmente, es compatible con solo arquitecturas pequeñas, pero se está trabajando para hacerlo endian-neutral. Eficiente: · Es difícil estimar el tiempo promedio de búsqueda de un corpus, ya que depende en gran medida de la estructura de la consulta. Sin embargo, las consultas simples (para una palabra o frase) tardan unos segundos incluso en las cuerpas que contienen más de cien millones de palabras (en términos de textos crudos, ¡eso es varios gigabytes, incluidas las etiquetas y los metadatos!) La consulta más compleja tarda más en ejecutar, pero Incluso entonces, obtienes los resultados tan pronto como se encuentran, para que no tenga que esperar mucho tiempo. Gratis: · Poliqarp es un software gratuito / de código abierto, disponible bajo los términos de la Licencia Pública General de GNU. Requisitos: · Java 2 Edición estándar Medio de ejecución ¿Qué hay de nuevo en este lanzamiento: · Se solucionó una mayor regresión en BPUGPRADE, que podría provocar la pérdida de datos.


Poliqarp Software relacionado

De Openphyra

Openphyra es un marco modular y extensible para la respuesta de la pregunta de dominio abierto (QA). ...

483

Descargar

metaf2xml

Metaf2xml analiza y decodifica los mensajes MEAR y TAF y los almacena como XML. ...

122

Descargar