| Gráfico web WebGrh es un marco para estudiar el gráfico web. |
Descargar ahora |
Gráfico web Clasificación y resumen
- Nombre del editor:
- Sebastiano Vigna
- Sitio web del editor:
- http://archive4j.dsi.unimi.it/
Gráfico web Etiquetas
Gráfico web Descripción
WebGrh es un marco para estudiar el gráfico web. WebGrh es un marco para estudiar el gráfico web. WebGrh proporciona formas simples de administrar gráficos muy grandes, explotando las técnicas de compresión modernas. Más precisamente, actualmente está hecho de: 1. Un conjunto de códigos planos, llamados códigos, que son particularmente adecuados para almacenar gráficos web (o, en general, enteros con distribución de la ley de energía en un cierto rango de exponente). El hecho de que estos códigos funcionen bien pueden probarse fácilmente empíricamente, pero también intentamos proporcionar un análisis matemático detallado. 2. Algoritmos para comprimir gráficos web que explotan la compresión y la referencias de la brecha (? LA ENLACE), la intervalización y los códigos para proporcionar una relación de compresión alta: por ejemplo, el gráfico de la banda web (2001 rastreo) se comprime en 3.08 bits por enlace, y una instantánea De aproximadamente 18,500,000 páginas del dominio .uk reunidas por Ubicrawler se comprimen en 2.22 bits por enlace (las cifras correspondientes para los gráficos transpuestos son 2.89 bits por enlace y 1.98 bits por enlace). Los algoritmos están controlados por varios parámetros, que proporcionan diferentes compensaciones entre la velocidad de acceso y la relación de compresión. 3. Algoritmos para acceder a un gráfico comprimido sin descomprimirlo en realidad, utilizando técnicas perezosas que retrasan la descompresión hasta que realmente sea necesario. 4. Una implementación completa y documentada de los algoritmos anteriores en Java, contenida en el paquete it.unimi.dsi.webgraph. Además de una API claramente definida, el paquete contiene varias clases que permiten modificar (por ejemplo, transponer) o volver a comprimir un gráfico, por lo tanto, para experimentar con varias configuraciones. El paquete se basa en Fastutil para un marco de colecciones de alto rendimiento de tipo específico de tipo, en MG4J para E / S de nivel de bit, en la distribución de COLT para algoritmos listos para usar, eficientes y en GNU Getopt para el análisis de comando de línea. 5. Conjuntos de datos para un gráfico muy grande (por ejemplo, mil millones de enlaces). Estos se recopilan de fuentes públicas (como la base web), o producidas por Ubicrawler. En el extremo, con WebGraph, puede acceder y analizar un gráfico web muy grande, incluso en una PC con tan solo 256 Mbytes de RAM. El uso de WebGrh es tan fácil como instalar algunos archivos JAR y descargando un conjunto de datos. Esto hace que estudie fenómenos, como PageRank, distribución de propiedades gráficas del gráfico web, etc. Muy fácil. ¿Qué hay de nuevo en este lanzamiento: · Una nueva construcción "componer" hace posible componer gráficos (etiquetados por arco).
Gráfico web Software relacionado