El kit de herramientas lemur

Modelador de lenguaje gratis para Mac OS X
Descargar ahora

El kit de herramientas lemur Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • Freeware
  • Precio:
  • FREE
  • Nombre del editor:
  • The Lemur Team
  • Sitio web del editor:
  • http://www.lemurproject.org/
  • Sistemas operativos:
  • Mac OS X
  • Tamaño del archivo:
  • 63.2 MB

El kit de herramientas lemur Etiquetas


El kit de herramientas lemur Descripción

Modelo de lenguaje gratis para Mac OS X El kit de herramientas LEMUR está diseñado para facilitar la investigación en el modelado de idiomas y la recuperación de la información, incluidas las tecnologías como ad hoc y la recuperación distribuida, la resumen, el IR, el filtrado y la clasificación de lenguaje cruzado. ¿Qué hay de nuevo en este lanzamiento: · 4.9 Corrige varios temas en el paquete de distribución 4.8, proporciona un nuevo · FileclassEnvironment para la entrada de archivos de Warc, varias velocidades de indexación · Optimizaciones para Indri; y más. · Las aplicaciones compiladas con el kit de herramientas Lemur requieren lo siguiente · Bibliotecas: Z, Iberty, Pthread y M en Linux, y además zócalo · Y NSL en Solaris. Las solicitudes construidas en Visual Studio requieren el · Biblioteca adicional wsock32.lib. Los archivos JAVA JAR fueron construidos con · Java 5 (JDK 1.5.0). Los UIS Java requieren Java 5. Hemos probado que usamos GCC · 3.2 (Solaris), 3.2.2 (Linux), 3.4 (Linux), 3.4.3 (Linux X86_64), 4.0.2 (Linux), · 4.3.1 (OS / X), VC ++ .NET 7.1 (Windows XP) y Visual Studio 2005 (Windows · XP). Mejoras: · Las restricciones de LayoutManager se han modificado para mejorar el tamaño del tamaño. · Comportamiento de los componentes. · La barra de herramientas de registro de consulta y el servidor admiten la carga automática de registro · Archivos de forma programada. Esta preferencia puede ser establecida por el usuario de la · Barra de herramientas a completamente automática, automática con confirmación requerida · Antes de subir, o solo carga manual. · Se ha agregado un nuevo FileclassEnvumbon, Warc, a Indri. Este ambiente · Habilita la indexación del CLUEWEB09 Corpus, · Http: //boston.lti.cs.cmu.edudata/clueweb09/ · Optimizaciones de velocidad de indexación INDRI, proporcionando un 5-15% de aceleración para GOV2 (25 Millones de documentos) Colecciones de tamaño: · 1) Reducir el número de asignaciones / desasignaciones de memoria en · IndexWriter :: _ Lookuptermid. · 2) Use la opción Tablas completas, -CF, de Flex. · 3) No haga la normalización de la caja ASCII en · UTF8CASENORMALIPALIZATRAENFORMACIÓN, ya que es redundante. · 4) Use Hash_Set en el STL en lugar de STRING_SET para StopWords. · 5) Si el recuento eliminado es 0 en DeletedDocumentList, no adquiera la lectura · Bloqueo antes de volver falso. · 6) Use recorte, en lugar de fusionarse, en el repositorioMaintenanceTead, a · Reducir los tiempos de número Los índices temporales se copian. Dejar de recoger el recorte · Candidatos cuando un índice el doble del tamaño del índice anterior es · Encontrado. · 7) Tomar en cuenta el tamaño de los diskindexes al estimar la memoria · Uso. · 8) Limite la cantidad total de memoria utilizada para cachear las longitudes de documentos a 20 MB · (5,000,000 de documentos).


El kit de herramientas lemur Software relacionado

UDT

Aplicación gratuita para distribuir protocolos de solicitud a través de una red ...

331 109 KB

Descargar

reloj en

Informe de tiempo de línea de comandos para el calendario de Google ...

161 14 KB

Descargar

Bakker

Herramienta basada en Ruby fácil de usar para cambiar el nombre y la copia de archivos para la copia de seguridad ...

164 25 KB

Descargar

WFYD

Programa de seguimiento de tiempo libre y simple para su Mac ...

210 206 KB

Descargar