derivado

Implementaciones de Python de varios algoritmos de stemming
Descargar ahora

derivado Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • Public Domain
  • Precio:
  • FREE
  • Nombre del editor:
  • Matt Chaput
  • Sitio web del editor:
  • http://whoosh.ca

derivado Etiquetas


derivado Descripción

Implementaciones de Python de varios algoritmos de stemming. STEMMING es una implementación de Python de los algoritmos PORTER, PAICE-HUSK, PORTER2 y Lovins stemming para el inglés. Estas implementaciones son sencillas y eficientes, a diferencia de algunas versiones de Python de los mismos algoritmos disponibles en la web. Este paquete es una extracción del código de STEMMing incluido en el motor de búsqueda de Whoosh. Nota que estas son implementaciones púas python. Envoltorios de Python para, por ejemplo. Los STEMMMERS SNOBALTS y la implementación de SNOBALL del PORTER STEMMER están disponibles en PYPI y serán más rápidos, si el uso del código compilado es una opción para usted. El intento de algoritmos del sistema eliminar automáticamente los sufijos (y en algunos casos prefijos) para encontrar la "raíz palabra "o tallo de una palabra dada. Esto es útil en varios escenarios de procesamiento de idiomas naturales, como la búsqueda. En general Porter2 es el mejor algoritmo general de tallo, pero no necesariamente el paquete más rápido o más agresivo. El paquete de stemming contiene módulos para cada algoritmo (Lovins, PaiceHusk, Porter y Porter2 ). Cada módulo contiene una función de vástago (): >> desde STEMMING.PORTER2 Importar STEM >> STEM ("El algoritmo de" facción-cáscara permite a los conjuntos de reglas de stemming personalizados, por lo que el módulo de PaiceHusk también incluye una clase de PaiceHusstemmer que puede crear una instancia con reglas personalizadas). El código fuente para este paquete está disponible en Bitbucket: http: //bitbucket.org/mchaput/stemmingPlease Use Bitbucket para archivar informes de errores o solicitudes de características: http: //bitbucket.org/mchaput/stemming/sissues / Requisitos: · Python


derivado Software relacionado