| Cascada Una API rica en funciones para definir y ejecutar flujos de trabajo complejos, sin escala y de procesamiento de datos tolerantes a fallas en un clúster de Hadoop |
Descargar ahora |
Cascada Clasificación y resumen
- Nombre del editor:
- Concurrent Inc
- Sitio web del editor:
- http://www.cascading.org/
- Sistemas operativos:
- Mac OS X
- Tamaño del archivo:
- 4.7 MB
Cascada Etiquetas
Cascada Descripción
Una API rica en características para definir y ejecutar flujos de trabajo de procesamiento de datos complejos, sin escala y de procesamiento de datos tolerantes a fallas en un clúster de Hadoop La API de procesamiento en cascada permite al desarrollador reunir rápidamente procesos distribuidos complejos sin tener que "pensar" en MapReduce, y programarlos de manera eficiente en función de sus dependencias y otros meta-datos disponibles. Obviamente, también se admiten aplicaciones de procesamiento de datos simples, ya que los trabajos complejos tienden a iniciarse simples. Aquí hay algunas características clave de "Cascading": · API de procesamiento de datos · Programador topológico · Notificación de eventos · Mapreduce Job Planner · Corrientes de aseveraciones · Trampas de falla · Interfaz de escritura · Interfaces de datos externos. · Trabajos de MapReduce personalizados ¿Qué hay de nuevo en este lanzamiento: · Comportamiento cambiado al limpiar archivos TEMP que permite el cierre para continuar incluso si se lanza una excepción durante el archivo TEMP Eliminar. · Fije el error donde C.F.FlowProcess # opentapforread () incluyó valores de archivos de entrada actuales en Iterator. · Fija para los archivos TEMP intermedios que no se limpian en C.F.Flow # Stop (). · Se corrigió el error donde se lanzó NPE si todas las propiedades predeterminadas de Hadoop no están disponibles.
Cascada Software relacionado