El kit de herramientas lemurModelador de lenguaje gratis para Mac OS X | |
Descargar ahora |
El kit de herramientas lemur Clasificación y resumen
Anuncio publicitario
- Licencia:
- Freeware
- Precio:
- FREE
- Nombre del editor:
- The Lemur Team
- Sitio web del editor:
- http://www.lemurproject.org/
- Sistemas operativos:
- Mac OS X
- Tamaño del archivo:
- 63.2 MB
El kit de herramientas lemur Etiquetas
El kit de herramientas lemur Descripción
Modelo de lenguaje gratis para Mac OS X El kit de herramientas LEMUR está diseñado para facilitar la investigación en el modelado de idiomas y la recuperación de la información, incluidas las tecnologías como ad hoc y la recuperación distribuida, la resumen, el IR, el filtrado y la clasificación de lenguaje cruzado. ¿Qué hay de nuevo en este lanzamiento: · 4.9 Corrige varios temas en el paquete de distribución 4.8, proporciona un nuevo · FileclassEnvironment para la entrada de archivos de Warc, varias velocidades de indexación · Optimizaciones para Indri; y más. · Las aplicaciones compiladas con el kit de herramientas Lemur requieren lo siguiente · Bibliotecas: Z, Iberty, Pthread y M en Linux, y además zócalo · Y NSL en Solaris. Las solicitudes construidas en Visual Studio requieren el · Biblioteca adicional wsock32.lib. Los archivos JAVA JAR fueron construidos con · Java 5 (JDK 1.5.0). Los UIS Java requieren Java 5. Hemos probado que usamos GCC · 3.2 (Solaris), 3.2.2 (Linux), 3.4 (Linux), 3.4.3 (Linux X86_64), 4.0.2 (Linux), · 4.3.1 (OS / X), VC ++ .NET 7.1 (Windows XP) y Visual Studio 2005 (Windows · XP). Mejoras: · Las restricciones de LayoutManager se han modificado para mejorar el tamaño del tamaño. · Comportamiento de los componentes. · La barra de herramientas de registro de consulta y el servidor admiten la carga automática de registro · Archivos de forma programada. Esta preferencia puede ser establecida por el usuario de la · Barra de herramientas a completamente automática, automática con confirmación requerida · Antes de subir, o solo carga manual. · Se ha agregado un nuevo FileclassEnvumbon, Warc, a Indri. Este ambiente · Habilita la indexación del CLUEWEB09 Corpus, · Http: //boston.lti.cs.cmu.edudata/clueweb09/ · Optimizaciones de velocidad de indexación INDRI, proporcionando un 5-15% de aceleración para GOV2 (25 Millones de documentos) Colecciones de tamaño: · 1) Reducir el número de asignaciones / desasignaciones de memoria en · IndexWriter :: _ Lookuptermid. · 2) Use la opción Tablas completas, -CF, de Flex. · 3) No haga la normalización de la caja ASCII en · UTF8CASENORMALIPALIZATRAENFORMACIÓN, ya que es redundante. · 4) Use Hash_Set en el STL en lugar de STRING_SET para StopWords. · 5) Si el recuento eliminado es 0 en DeletedDocumentList, no adquiera la lectura · Bloqueo antes de volver falso. · 6) Use recorte, en lugar de fusionarse, en el repositorioMaintenanceTead, a · Reducir los tiempos de número Los índices temporales se copian. Dejar de recoger el recorte · Candidatos cuando un índice el doble del tamaño del índice anterior es · Encontrado. · 7) Tomar en cuenta el tamaño de los diskindexes al estimar la memoria · Uso. · 8) Limite la cantidad total de memoria utilizada para cachear las longitudes de documentos a 20 MB · (5,000,000 de documentos).
El kit de herramientas lemur Software relacionado
Bakker
Herramienta basada en Ruby fácil de usar para cambiar el nombre y la copia de archivos para la copia de seguridad ...
164 25 KB