Duque

Un motor de deduplicación rápida
Descargar ahora

Duque Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • Apache License 2.0
  • Nombre del editor:
  • Lars Marius Garshol
  • Tamaño del archivo:
  • 1.8 MB

Duque Etiquetas


Duque Descripción

Un motor rápido y flexible de deduplicación (o resolución de entidad, o enlace de récord) escrito en Java Duke es un motor rápido y flexible de deduplicación (o resolución de entidades, o enlace de récord) escrito en Java en la parte superior de Lucene. En este momento, puede procesar 1,000,000 registros en 11 minutos en una computadora portátil estándar en un solo hilo. Consiste en una herramienta de línea de comandos que puede leer datos CSV, JDBC, SPARQL y Ntriples. También hay una API para programar el procesamiento incremental y almacenar el resultado del procesamiento en una base de datos relacional.


Duque Software relacionado

R portátil

R es un entorno de software gratuito para la computación estadística y los gráficos. Recopila y se ejecuta en una amplia variedad de plataformas, ventanas y macos de UNIX. ...

899 38.8 MB

Descargar

TransverTool

Una pequeña aplicación que le permite aplicar varias operaciones a las entradas deseadas. ...

60 2 KB

Descargar

edpath

Un script para ver y editar variables de entorno tipo ruta ...

112 3.8 MB

Descargar