| Texto :: Dedante Cerca del módulo de detección de duplicados |
Descargar ahora |
Texto :: Dedante Clasificación y resumen
- Licencia:
- Perl Artistic License
- Nombre del editor:
- Jan Pomikalek
- Sitio web del editor:
- http://search.cpan.org/~janpom/
Texto :: Dedante Etiquetas
Texto :: Dedante Descripción
Cerca del módulo de detección de duplicados Texto :: DEDUTPER es un módulo PERL que utiliza la medida de semejanza según lo propuesto por Andrei Z. Broder en AL (http://www.ra.ethz.ch/cdstore/wwww6/technical/paper205/paper205.html) para detectar similares Documentos (cerca de duplicados) según su texto. Nota de precaución: el módulo solo funciona correctamente con los idiomas donde los textos se pueden tokenar en palabras al detectar secuencias de caracteres alfabéticos. Por lo tanto, podría no proporcionar muy buenos resultados para, por ejemplo. China.Synopsis usa texto :: Dedante; $ DEDUTPER = Nuevo texto :: Deduper (); $ dedant-> add_doc ("Doc1", $ Doc1Text); $ dedant-> add_doc ("Doc2", $ Doc2Text); @similar_docs = $ DEDUPER-> Find_Similar ($ Doc3Text); ... # Eliminar cerca de duplicados de una matriz de textos $ dedente = nuevo texto :: dedant (); foreach $ text (@Texts) {Siguiente si $ DEDTPER-> Find_Similar ($ Texto); $ dedant-> add_doc ($ i ++, $ texto); Push @no_near_dupplicates, $ texto; } Requisitos: · Perl
Texto :: Dedante Software relacionado