microsardeo

Una biblioteca de búsqueda pequeña
Descargar ahora

microsardeo Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • BSD License
  • Precio:
  • FREE
  • Nombre del editor:
  • Daniel Lindsley
  • Sitio web del editor:
  • http://toastdriven com

microsardeo Etiquetas


microsardeo Descripción

MicroSarch es una pequeña biblioteca de búsqueda de Python. Pretende ser una herramienta de aprendizaje para enseñar los fundamentos de la búsqueda. Si no desea incrustar en las aplicaciones de Python, donde no quiere / necesita algo tan complejo como Lucene.Part de mi (próximo) PYCON 2012 Talk - https://us.pycon.org/2012/schedule/presentation/66/usageexample:Meport Microsarch # Crear una instancia, apuntándola a donde se deben almacenar los datos.ms = MicroSearch.MicRosearch ('/ TMP / MicroSearch ') # Índice algunos datos.ms.index (' Email_1 ', {' Text ': "Peter, \ N \ Ni'm ¡Va a necesitar esos informes de TPS en mi escritorio a primera hora de mañana! ¡Y limpie su escritorio! \ N \ Nlumbergh "}) Ms.Index ('Email_2', {'Texto': 'Todos, \ N \ NM-MMM-My Red Stapler se ha desaparecido. HH-tiene A-A-A-A-A-AN Cualquier persona que lo haya visto? \ n \ Nmilton '}) Ms.Index (' Email_3 ', {' Texto ': "Peter, \ N \ Nyeah, necesitaré que vengas al sábado. No olvides esos informes. \ n \ nlumbergh"} ) Ms.Index ('Email_4', {'Texto': '¿Cómo se siente acerca de convertirse en la administración? \ n \ nThe Bobs'}) # Buscar en It.ms.search ('Peter') Ms.search ('Informe de TPS') La biblioteca de Shortcomingsthis está destinada a ayudar a otros a aprender. Si bien tiene cobertura de prueba completa, puede que no sea adecuado para uso de producción. Por las razones, es posible que no desee usarlo en código real: - Ningún soporte de concurrencia intenta trabajar atómicamente con archivos, pero no hay cerraduras, por lo que es posible que las escrituras se superpongan entre los procesos, ¡quizás la caja fuerte de los hilos? Casi todo lo que todo está en una instancia, pero no lo he probado mucho con el roscado, sin soporte para eliminar documentos si un documento existente cambia o se elimina, los datos estancados se dejarán en el índice, una solución alternativa estaría soplando el directorio de índice, Mover los documentos y renunciar a ellos: / - Solo los n-gramos se admiten porque escribir un portero completo o un surtmer de bola de nieve está más allá de las necesidades de esta biblioteca, ninguna pista en el rendimiento a escala, esta es una herramienta de prueba de concepto y aprendizaje, ¡NO LUCENO! Con un MBP de 2011 en los primeros 1.2K Docs of the Enron Corpus: - La indexación es bastante lenta en ~ 1 documento por segundo, la búsqueda es bastante rápida a ~ 0.007 seg. Por consulta, nunca excedió 15 MB cuando la indexación, 10 MB al buscar. En la fuente Repo como enron_bench.py.Running Testswith una fuente de pago, Ejecute: en Python 2: Python -M Unittest2 Testsin Python 3: Python -M Los mejores teststststs deben pasar en todo momento bajo Python 2.7 y Python 3.2.Product's Página de inicio


microsardeo Software relacionado

JSONRPCLIB-NED14

Este proyecto es una implementación de la especificación JSON-RPC V2.0 (compatible con el revés) como cliente ... ...

85

Descargar

zc.z3monitor

Una interfaz de línea de comandos accesible en la red para monitorear un proceso de Zope 3 ...

227

Descargar