Terrier

Terrier: motor de búsqueda altamente flexible, eficiente y robusto, se implementa fácilmente en colecciones de documentos a gran escala
Descargar ahora

Terrier Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • Freeware
  • Precio:
  • FREE
  • Nombre del editor:
  • University of Glasgow
  • Sitio web del editor:
  • http://ir.dcs.gla.ac.uk/terrier/index.html
  • Sistemas operativos:
  • Mac OS X
  • Tamaño del archivo:
  • 5.8 MB

Terrier Etiquetas


Terrier Descripción

Terrier: motor de búsqueda altamente flexible, eficiente y robusto, fácilmente implementable en colecciones de documentos a gran escala Terrier es un motor de búsqueda altamente flexible, eficiente, efectivo y robusto, fácilmente implementable en colecciones de documentos a gran escala. Terrier implementa las funcionalidades de indexación y recuperación de última generación. Terrier proporciona una plataforma ideal para el rápido desarrollo de aplicaciones de recuperación a gran escala. La versión de código abierto de Terrier proporciona una plataforma flexible, completa, transparente y robusta para la investigación y la experimentación en la recuperación de texto. La investigación puesta en Terrier se expande constantemente hacia los nuevos. Ramas del campo de recuperación de información más amplio, haciendo que Terrier sea una plataforma ideal, fuerte, modular y de última generación para desarrollar, evaluar y evaluar nuevos conceptos e ideas. Se escribe en Java, y se usó para web y Búsqueda empresarial, escritorio, intranet y motores de búsqueda verticales, así como el desarrollo y la evaluación de nuevas técnicas de recuperación de información de texto a gran escala y aplicaciones. Se está desarrollando en el Departamento de Ciencias de la Computación, en la Universidad de Glasgow. Aquí hay algunas características clave. de "Terrier": General: · Soporte de indexación para formatos de archivo de escritorio comunes, y para colecciones de investigación de TREC de uso común (por ejemplo, TREC CDS 1-5, WT2G, WT10G, GOV, GOV2, Blogs06). · Muchos modelos de ponderación de documentos, como muchas divergencias sin parámetros de modelos de ponderación aleatorias, OKAPI BM25 y modelado de idiomas. · Lenguaje de consulta convencional compatible, incluidas las frases, y los términos que ocurren en las etiquetas. · Manejo indexación de texto completo de colecciones de documentos a gran escala, en una arquitectura centralizada a al menos 25 millones de documentos. · API modulares y abiertas de indexación y consulta, para permitir una extensión fácil para sus propias aplicaciones e investigaciones. · Investigación de recuperación de información activa en el Plataforma de código abierto. · Fuente abierta (licencia pública de Mozilla). · Escrito en la plataforma Java - Funciona en Windows, Mac OS X, Linux y UNIX. · Base de usuario grande durante 3 años de lanzamiento público.: Últimamente: de la indexación de la caja de las colecciones de documentos etiquetadas, como las colecciones de pruebas TREC. · Indexación fuera de la caja para documentos de varios formatos, como HTML, PDF o archivos de Microsoft Word, Excel y PowerPoint. · Indexación de campo información, tal Como título, H1, HTML Etiquete información · indexación de información de posición en una palabra, o un bloque (por ejemplo. Una ventana de términos dentro de una distancia) Nivel. · Soporte para varias codificaciones de documentos (UTF), para facilitar la recuperación multilingüe. · Estructuras de datos de disco de índice altamente comprimido. · Archivo directo altamente comprimido para una expansión de consulta eficiente. · Alternativa más rápido soltero Índice de pipas. · Varias técnicas de tallo compatibles, incluido el surge de la bola de nieve para las lenguas europeas.Retrieval: · Proporciona instalaciones de consulta estándar, así como una expansión de consulta (retroalimentación de pseudo-relevancia) · se pueden aplicar en aplicaciones interactivas, como el escritorio incluido. Búsqueda, o en un ajuste por lotes para la investigación y la experimentación. · Proporciona muchos modelos de ponderación de documentos estándar, incluidas hasta 126 modelos de ranking de documentos de Divergente de la aleatoriedad (DFR), y otros modelos, como Okapi BM25, modelado de idiomas y TF-IDF. El nuevo modelo de ponderación DFREE DFRE también se incluye, lo que proporciona un rendimiento robusto en una gama de colecciones de pruebas sin la necesidad de ninguna afinación de parámetros o capacitación. · Lenguaje de consulta avanzado que admite operadores booleanos, +/- operadores, frase y búsqueda de operadores, y búsqueda de proximidad y campos. · Proporciona un número de modelos de ponderación de términos de DFR libre de parámetros para la expansión de la consulta automática, además de la expansión de la consulta de Rocchio. · Procesamiento flexible de los términos a través de una tubería de componentes, como removedores de parada y stemmers.experimentation: · asas Todas las colecciones de pruebas TREC disponibles actualmente: consulte Ejemplos de experimentación de TREC para ejemplos y configuraciones conocidas. · Fácilmente scriptable para evaluar muchas configuraciones de parámetros, o muchos modelos de ponderación en forma de lote. · Herramientas de evaluación incorporadas para usar con TREC ad-hoc y conocidas Resultados de la recuperación de la búsqueda de artículos, para producir varias medidas de precisión y recuerdo. Nota: Terrier se libera bajo la licencia pública de Mozilla.


Terrier Software relacionado

Perlpad

Perlpad ofrece la ejecución del código Perl como servicio de sistema MACOS X ...

149 509 KB

Descargar

Importal

Importal: fácil y rápido desarrollo de aplicaciones que proporcionan acceso vivo y ubicuo al contenido utilizando XMPP ...

166 10 KB

Descargar