dedupe Clasificación y resumen
- Nombre del editor:
- Graham Poulter
- Sitio web del editor:
- https://launchpad.net/~graham-poulter
dedupe Etiquetas
dedupe Descripción
Biblioteca de deduplicación de Python Dedupe es una biblioteca de Python para encontrar filas similares en una tabla de registros (por ejemplo, en una base de datos o archivo CSV) o enlazar filas similares entre dos tablas. (1) Índice los registros en bloques, (2) Compare todos los pares de registros en cada uno Bloqueo con una función de similitud y (3) clúster La comparación parela en "coincidencias" y "no coincidencias". Requisitos: · Python
dedupe Software relacionado