Texto :: Dedante

Cerca del módulo de detección de duplicados
Descargar ahora

Texto :: Dedante Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • Perl Artistic License
  • Precio:
  • FREE
  • Nombre del editor:
  • Jan Pomikalek
  • Sitio web del editor:
  • http://search.cpan.org/~janpom/

Texto :: Dedante Etiquetas


Texto :: Dedante Descripción

Cerca del módulo de detección de duplicados Texto :: DEDUTPER es un módulo PERL que utiliza la medida de semejanza según lo propuesto por Andrei Z. Broder en AL (http://www.ra.ethz.ch/cdstore/wwww6/technical/paper205/paper205.html) para detectar similares Documentos (cerca de duplicados) según su texto. Nota de precaución: el módulo solo funciona correctamente con los idiomas donde los textos se pueden tokenar en palabras al detectar secuencias de caracteres alfabéticos. Por lo tanto, podría no proporcionar muy buenos resultados para, por ejemplo. China.Synopsis usa texto :: Dedante; $ DEDUTPER = Nuevo texto :: Deduper (); $ dedant-> add_doc ("Doc1", $ Doc1Text); $ dedant-> add_doc ("Doc2", $ Doc2Text); @similar_docs = $ DEDUPER-> Find_Similar ($ Doc3Text); ... # Eliminar cerca de duplicados de una matriz de textos $ dedente = nuevo texto :: dedant (); foreach $ text (@Texts) {Siguiente si $ DEDTPER-> Find_Similar ($ Texto); $ dedant-> add_doc ($ i ++, $ texto); Push @no_near_dupplicates, $ texto; } Requisitos: · Perl


Texto :: Dedante Software relacionado

filtrante

permite que las pruebas de la unidad se diseñen para los programas de línea de comandos ...

125

Descargar