| Vectores semánticos para crear y buscar índices de vector semántico envolviendo Apache Lucene |
Descargar ahora |
Vectores semánticos Clasificación y resumen
- Nombre del editor:
- Dominic Widdows
- Sitio web del editor:
- http://code.google.com/p/semanticvectors/wiki/InstallationInstructions
- Sistemas operativos:
- Mac OS X
- Tamaño del archivo:
- 46 KB
Vectores semánticos Etiquetas
Vectores semánticos Descripción
Paquete para crear y buscar índices vectoriales semánticos envolviendo Apache Lucene Los índices vectoriales semánticos se crearon aplicando un algoritmo de proyección aleatorio a las matrices de documentos de término. El paquete fue creado como parte de un proyecto de la Oficina de Gestión de Tecnología de la Universidad de Pittsburgh, para explorar el potencial de coincidir automáticamente los conceptos relacionados en el dominio de la gestión de tecnología, por ejemplo, el mapeo de nuevas tecnologías a los licenciantores interesados potentáticamente. El proyecto Vectores semánticos se puede encontrar en http: //real.hsl.pitt.edu.El paquete crea un modelo de espacio de palabras, del tipo desarrollado por el Proyecto de Infomap de la Universidad de Stanford y otros investigadores durante la década de 1990 y principios de 2000. Dichos modelos están diseñados para representar palabras y documentos en términos de conceptos subyacentes, y, como tal, se pueden usar para muchas tareas de coincidencia semántica (conceptual, conozca), como la generación de tesauro automático, la representación del conocimiento y la coincidencia de conceptos. El paquete de vectores semánticos utiliza un paquete de vectores semánticos. Algoritmo de proyección aleatoria, una forma de análisis semántico automático, similar al análisis semántico latente (LSA) y sus variantes como análisis semántico probabilístico latente (PLSA). Sin embargo, a diferencia de otros métodos, la proyección aleatoria no se basa en el uso de algoritmos de descomposición de matriz intensiva computacionalmente como la descomposición del valor singular (SVD). Esto hace que la proyección aleatoria sea una técnica mucho más escalable en la práctica. Nuestra aplicación de proyección aleatoria para el procesamiento de lenguaje natural (NLP) desciende del trabajo de Penti Kanerva en la memoria distribuida escasa, que en el análisis semántico y la minería de texto, este método también se ha denominado indexación aleatoria. Un número creciente de investigadores ha aplicado proyección aleatoria a las tareas de PNL, demostrando: · Rendimiento semántico comparable con otras formas de análisis semántico latente. · Ventajas de rendimiento computacional significativas para crear y mantener modelos. Requisitos: · Java
Vectores semánticos Software relacionado