Buscar :: ContextGraph

Buscar :: contextGraph es un módulo PERL para difundir el motor de búsqueda de activación.
Descargar ahora

Buscar :: ContextGraph Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • GPL
  • Precio:
  • FREE
  • Nombre del editor:
  • Maciej Ceglowski
  • Sitio web del editor:
  • http://search.cpan.org/~mceglows/Search-VectorSpace-0.02/VectorSpace.pm

Buscar :: ContextGraph Etiquetas


Buscar :: ContextGraph Descripción

Búsqueda :: ContextGraph es un módulo PERL para difundir el motor de búsqueda de activación. Buscar :: contextGraph es un módulo PERL para difundir el motor de búsqueda de activación.Synopsis Usar Búsqueda :: Context Fogh; MY $ CG = Buscar :: ContextGraph-> Nuevo (); # Primero, agregas algunos documentos, tal vez todos a la vez ... My% Docs = ('Primero' => , 'Segundo' => , ' Tercer '=> {' Snake '=> 2,' constrictor '=> 1},); $ cg-> bulk_add (% docs); # o en un bucle ... foreach My $ Título (Teclas% Docs) {$ CG-> Agregar ($ título, $ docs {$ Título}); } # o de un archivo ... My $ CG = Buscar :: ContextGraph-> Load_from_dir ("./myfiles"); # Puede almacenar un objeto gráfico para su uso posterior $ cg-> tienda ("almacenado.cng"); # y recuperarlo más tarde ... My $ CG = ContextGraph-> recuperar ("almacenado.cng"); # Buscando # la forma más fácil My @Ranked_Docs = $ CG-> Simple_Search ('cacahuetes'); # Recupere los términos y documentos relacionados con más poder My ($ docs, $ palabras) = ​​$ cg-> búsqueda ('serpiente'); # Puede usar un documento como su consulta Mis ($ docs, $ palabras) = ​​$ cg-> find_similar ('Primer documento'); # O puede consultar en una combinación de cosas mis ($ docs, $ palabras) = ​​$ cg-> mixed_search ({docs => , términos => ); # Conjunto de resultados de impresión de documentos devueltos Foreach My $ K (Ordenar {$ docs -> {$ b} $ docs -> {$ a}} Teclas% {$ docs}) {impresión "Documento $ K tuvo relevancia", $ docs -> {$ k}, "n"; } # Recargarlo My $ New = Buscar :: ContextGraph-> Recuperar ("nombre de archivo"); La activación de la propagación es una técnica ordenada para crear motores de búsqueda que devuelven resultados precisos para una consulta incluso cuando no hay una coincidencia de palabras clave exacta. El motor funciona mediante la construcción de una estructura de datos llamada un gráfico de contexto, que es una red gigante de nodos de documentos y términos. Todos los nodos de documentos están conectados a los términos que se producen en ese documento; De manera similar, cada nodo término está conectado a todos los nodos de documentos en ese término. Buscamos en el gráfico comenzando en un nodo de consulta y distribuyendo una cantidad establecida de energía a sus nodos vecinos. Luego, recitamos, disminuyendo la energía en cada etapa, hasta que esta energía difundida cae por debajo de un umbral dado. Cada nodo realiza un seguimiento de la energía acumulada, y esto sirve como nuestra medida de relevancia. Esto significa que los documentos que tienen muchas palabras en común aparecerán similares al motor de búsqueda. Del mismo modo, las palabras que ocurren juntas en muchos documentos serán percibidos como semánticamente relacionados. Especialmente con colecciones de documentos más grandes y coherentes, el motor de búsqueda puede ser bastante efectivo en reconocer los sinónimos y encontrar relaciones útiles entre los documentos. Puede leer una descripción completa del algoritmo en http://www.nitle.org/papers/contextual_network_graphs.pdf.El buscador ofrece un retiro ampliado (resultados relevantes incluso cuando no hay una coincidencia de palabras clave) sin incurrir en el tipo de computacional y Temas de patentes planteados por la indexación semántica latente (LSI). La técnica utilizada aquí se describió originalmente en una disertación de 1981 por Scott Preece. Requisitos: · Perl


Buscar :: ContextGraph Software relacionado