Cóndor

Ejecuta aplicaciones intensivas de CPU remotas utilizando los ciclos inactivos de estaciones de trabajo de propiedad distribuida.
Descargar ahora

Cóndor Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • The Apache License
  • Precio:
  • FREE
  • Nombre del editor:
  • Condor Authors
  • Sitio web del editor:
  • http://www.cs.wisc.edu/condor/

Cóndor Etiquetas


Cóndor Descripción

Ejecuta aplicaciones intensivas de CPU remotas utilizando los ciclos inactivos de estaciones de trabajo de propiedad distribuida. Los horarios del cóndor y ejecutan aplicaciones intensivas de CPU remotas utilizando los ciclos inactivos de estaciones de trabajo de propiedad distribuida. Monitorea un grupo de máquinas para encontrar máquinas inactivas que se usan para completar los trabajos enviados, y también proporciona puntos de control y mecanismos de sistema remoto que permiten la migración de empleo y Ejecución remota transparente. ¿Qué hay de nuevo en este lanzamiento: Notas de lanzamiento: · El formato de la salida de Condor_STATUS con la opción -grid se ha cambiado para proporcionar más información útil. · Se quitó la nueva línea adjunta al final de la salida Condor_Status -Format. Por lo tanto, el código que analiza la salida de este comando ahora debe tener cuidado al recortar la última línea. Nuevas características: · Condor_fetchlog puede ahora obtener los archivos de historial de un demonio de Condor_Schedd. Y, el archivo de historia guardado por el demonio de Condor_Schedd ahora se puede girar a diario o mensualmente. · El Condor_CKPT_SERVER limpiará automáticamente los archivos de punto de control estancados. Las variables de configuración que controlan este comportamiento se describen a continuación. · El ejecutable Condor_CkPt_Server (ya sea el ejecutable de 32 bits o 64 bits) ahora se comunicará correctamente entre los nodos de envío de 32 bits y de 64 bits. Si, según algunos problemas de ancho de la oportunidad, surgen en el protocolo de punto de control (por ejemplo, con tamaños de archivo), los mensajes de error transparentes se registran en los registros del servidor de punto de control. · La nueva herramienta Condor_ssh_to_job permite la depuración interactiva de los trabajos de ejecución. Consulte la página Manual en para más detalles. · El comando condor_status ahora es sustancialmente más rápido, especialmente con la opción -Format. · Se ha agregado una cuadrícula de cuadrícula tipo GT5 para su presentación al servicio New Globus Gram5. Cuando se identifica un servicio de gramo como GT5, la aceleración de JobManager y el monitor de la cuadrícula no se utilizan. Consulte la Sección 5.3.2 para más detalles. · Se ha agregado crema tipo cuadrícula tipo cuadrícula para la presentación al servicio de trabajo de crema de glite. Consulte la sección 5.3.8 para más detalles. · Cuando se baja en los descriptores de archivos para crear nuevos sockets de red, el demonio de Condor_Schedd ahora evita el apilamiento ilimitado de los mensajes que envía periódicamente al Condor_negotiator y Condor_Startd. · Se ha mejorado el rendimiento y la manipulación de fallas del monitor de la cuadrícula. · Para el tipo de cuadrícula NORDUGRID en el universo de la cuadrícula, la información de estado del trabajo ahora se obtiene utilizando el servidor LDAP de ARC de Nordugrid, que debería mejorar enormemente el rendimiento. Además, Condor ahora puede decir cuándo se están ejecutando estos trabajos. · La opción Nuevo -Valgrind a Condor_SUBMIT_DAG causa Condor_SUBMIT_DAG para generar un archivo de descripción de envío que utiliza Valgrind en Condor_Dagman, en lugar del binario Condor_Dagman como su ejecutable. · Condor_Dagman ahora evalúa perezosamente y abre archivos de registro de trabajos de nodo. En lugar de analizar todos los archivos de envío de envío y abrir inmediatamente sus archivos de registro especificados al inicio, Condor_Dagman ahora analiza los archivos de descripción del envío justo antes de que se envíe cada trabajo, y tiene cada archivo de registro solo cuando los trabajos relevantes estén en la cola o ejecutando los scripts posts . Además, Condor_Dagman ahora genera automáticamente un archivo de registro de usuario predeterminado para cualquier trabajo de nodo que no especifique uno. · Tanto el soporte como la documentación para el universo de MPI se han eliminado. Las aplicaciones MPI son compatibles con el uso del universo paralelo. · Cuando falla la prueba del software de máquina virtual de Condor_startdd (para máquinas configuradas como capaces de ejecutar máquinas virtuales), el Condor_Startd volverá a intentar la prueba hasta que tenga éxito. · El Nordugrid_gahP ahora limita el número de conexiones hechas a cada servidor de arco de NorduGrid y reutiliza las conexiones cuando sea posible. · Se agregó la función EVAL (), que toma un argumento de cadena y evalúa el contenido de la cadena como una expresión de la clase. Un ejemplo de políticas donde se describe esto, se describe en la Sección 3.5.9 en suspensión de trabajo. · La opción Nueva Condor_Q -Attributes limita los atributos que se muestran cuando se utilizan las opciones -xml o -long. Limitar el número de atributos también aumenta la eficiencia de la consulta. · Las capacidades de administración de energía del cóndor ahora se implementan como un complemento. En particular, el Condor_Startd ahora ejecuta un programa externo, según lo especificado por la variable de configuración HIBERNATION_PLUGIN, para realizar la detección de los estados de baja potencia disponibles y el cambio a estos estados de baja potencia. · Se ha agregado el nuevo condor Daemon Condor_rooster a las máquinas de activación de la hibernación cuando la expresión definida por la variable de configuración no es cierta. Las variables de configuración relacionadas con Condor_rooster se describen en la Sección 3.3.35. · Señaló la posibilidad de extraer información del búfer de estado del lector del registro de eventos del usuario al lector de registros de usuario. Esto se implementa a través de una nueva clase ReadUserLogStateAccess C ++ tal como se define en READ_USER_LOG.H. · Los cambios en el valor de la variable de configuración Certificate_mapfile o el contenido del archivo al que se refiere ya no requiere un reinicio completo de Condor. En su lugar, el comando condor_reconfig hará que se utilicen los cambios. · El demonio de Condor_Master ahora imprimirá la ruta y los argumentos a cualquier demonio que comience si D_FULLLDEBUG está habilitado. Anteriormente, no había manera de conseguir que muestre los argumentos con los que comenzaba un demonio. · El demonio de Condor_HAD ahora tiene la capacidad de controlar los demonios que no sean el condor_negotiator. Esto se controla a través de la macro had_controllee. · El Condor ahora reconoce las extensiones de VASTS en los proxies X.509. Los atributos de las vajas están codificadas en el atributo de la clase de trabajo x509UserProxysubject. · El Condor_Startd ahora puede limpiar máquinas virtuales trenzadas, siguiendo un accidente de cóndor o su sistema operativo host. · Tras un accidente, el Condor_GridManager ya no reinicia todos los trabajos de trabajo para trabajos GT2. Esto debería mejorar el tiempo de recuperación. · El cóndor funciona mejor con las clases categorizadas como genéricas en el demonio de Condor_Collector. Varios Daemons que se registran con las clases genéricas ahora pueden tener herramientas que usan la opción de sistema manipular sus clases adecuadamente. · Condor ahora proporciona un mecanismo para hacer cumplir la limitación de recursos estrictos para algunos universos de trabajos en ejecución. Adiciones de la variable de configuración y cambios: · La nueva variable de configuración Email_Signature Especifica una firma personalizada que se agregará al correo electrónico enviado por el sistema Cóndor. Si se define, entonces esta firma personalizada reemplaza el predeterminado que se especifica internamente. No hay un valor predeterminado para esta variable. · La nueva variable de configuración ckpt_server_client_timeut informa al Condor_schedd cuánto tiempo en segundos está dispuesto a esperar para intentar hablar con un proceso de Condor_Ckpt_Server antes de declarar a un Condor_Ckpt_Server hacia abajo. Consulte la Sección 3.3.11 para la descripción completa. . Consulte la Sección 3.3.11 para la descripción completa. · La nueva variable de configuración ckpt_server_remove_stale_ckpt_interval informa al Condor_Ckpt_Server para comenzar la eliminación de puntos de control obsoletos en el intervalo especificado en segundos. Consulte la Sección 3.3.8 para la descripción completa. . Esta vez se compara con la noción actual de ahora cuando el servidor de Checkpoint comprueba el archivo de imagen de punto de control. Consulte la Sección 3.3.8 para la descripción completa. · La nueva configuración de la variable de la variable se puede usar para administrar un mayor peso al calcular el uso, computar acciones justas y hacer cumplir los cuotas de grupo. Consulte 3.3.10 para la descripción completa. · La nueva variable de configuración MAX_PERIODIC_EXPR_INTERVAL implementa un límite máximo en el tiempo entre la evaluación de las expresiones periódicas, debido a la sincronización adaptativa implícita por la variable de configuración periodic_expr_ietimelice. Consulte 3.3.11 para la descripción completa. · La nueva variable de configuración GRIDMANAGER_SELECT_EXPR se puede usar para controlar cuántos procesos Condor_GridManager se generarán para administrar los trabajos de Grid Universe. Como parte de este cambio, eliminó la variable de configuración y el código de soporte para gridmanager_per_job, ya que la nueva variable de configuración lo reemplaza. Consulte 3.3.11 para la descripción completa. · La variable de configuración gridmanager_max_pending_submits_per_resource y el acelerador correspondiente gridmanager_max_pending_submits se han eliminado. · La nueva variable de configuración grid_monitor_disable_time controla cuánto tiempo esperará el condor_gridmanager después de encontrar un error antes de intentar reiniciar un trabajo de monitor de cuadrícula. Vea 3.3.23 para la descripción completa. · La nueva configuración de configuración predefinida Detected_Memory indica la cantidad de memoria física (RAM) detectada por Condor. El valor se da en Mbytes. · La nueva configuración predefinida Macro Detected_cores indica el número de núcleos de CPU detectados por Condor. · La nueva variable de configuración Delegate_Full_Job_GSI_CREDENCIALS controla si se delega un proxy X.509 completo o LIMITADO para los trabajos de universo de cuadrícula GT2 de tipo cuadrícula. Vea 3.3.26 para la descripción completa. · La nueva variable de configuración es utilizada por el Condor_Startd para publicitar en su clase una expresión booleana que especifica cuándo se debe despertar la máquina, por ejemplo, Condor_rooster. Consulte 3.3.10 para la descripción completa. · La nueva variable de configuración HIBERNATION_PLUGIN Especifica la ruta al enchufe que usa el Condor_startd usa para detectar las capacidades de estado de baja potencia de una máquina y para cambiar la máquina a un estado de potencia baja. Consulte 3.3.10 para la descripción completa. · La nueva variable de configuración HIBERNATION_PLUGIN_ARGS Especifica los argumentos de línea de comandos adicionales que el Condor_Startd pasará al complemento al invocarlo para cambiar la máquina a un estado de baja potencia. Consulte 3.3.10 para la descripción completa. · La nueva variable de configuración HIBERNATION_OVERRIDE_WOL se puede usar para dirigir el Condor_startd para ignorar la función de la interfaz de red LAN (WOL) de la interfaz de red de la máquina, y para cambiar a un estado de baja potencia, incluso si la interfaz no admite WOL, o si WOL está deshabilitada en eso. Consulte 3.3.10 para la descripción completa. · La nueva variable de configuración DAGMAN_USER_LOG_SCAN_INTERVAL controla la forma en que Long Condor_Dagman espera entre la comprobación de los archivos de registro de trabajos para las actualizaciones de estado. Consulte 3.3.25 para la descripción completa. · La nueva variable de configuración DAGMAN_DEFAULT_NODE_LOG establece el nombre del archivo de registro predeterminado para la nueva función de archivo de registro de nodo predeterminado de Condor_DAGMAN. Consulte 3.3.25 para la descripción completa. · Quitado la variable de configuración DAGMAN_DELETE_OLD_LOGS; El nuevo código de lectura del archivo de registro lo hace obsoleto. · La nueva variable de configuración had_controllee se usa para especificar el nombre del demonio que controla el Condor_HAD. Este nombre debe coincidir con el nombre del demonio en el Daemon_List de Condor_Master. Errores corregidos: · Se corrigió un error en las funciones de Classad donde los argumentos que deberían haber sido coaccionados correctamente en cadenas, en lugar de ser evaluadas a error. · Se corrigió un mensaje de diagnóstico confuso con el trabajo de trabajo, que ocurrió cuando se eliminó un trabajo dentro de los 5 minutos de ser enviados. · Se corrigió un error en el que el uso de ranuras dinámicas (consulte la Sección 3.13.7) causó que la máquina Attribute slot_startd_attrs desapareciera de la clase para algunas ranuras. · Se corrigió un error de la plataforma Windows en la que la ventana que pertenece a un trabajo de Condor no recibe un mensaje de pintura. · Se corrigió un error que causa que Condor_Q -analyze se bloquee cuando no hubiera un archivo Classad Daemon de Condor_Schedd. · Se corrigió un bloqueo de Condor_PROCD causado cuando el entorno de un proceso monitoreado excedió 1Mbyte in / proc. · Se corrigió un error de la plataforma Windows que podría hacer que el Condor_Credd se bloquee si una credencial solicitada no está en la tienda de contraseñas. · Se corrigió un error que estaba causando que el bloqueo de rotación de registro de eventos de trabajo se creara con permisos incorrectos. · Se corrigió un error en la rotación del registro de eventos de trabajo que podría hacer que nunca se gire en el puerto de Windows de Condor. · Se corrigió una condición de raza potencial en la inicialización del registro de eventos de trabajo. · Condiciones de raza fija que podría causar un choque del Condor_Collector y Condor_Schedd en el apagado. · Se corrigió un error en el que el Condor_Master a veces moriría y produciría un archivo DPRINTF_FAILURE.MASTER cuando se reinicia debido a las nuevas marcas de tiempo binarias o cuando se inició inicialmente. · Se corrigió una fuga de memoria relacionada con las variables de configuración de SOAP que ocurrieron cuando se reconfiguró el cóndor. · Se corrigió un error en el que el comando del archivo de descripción envía cron_day_of_week fue ignorado erróneamente. · Se corrigió el error en el que las variables de configuración max_job_queue_log_rotations y gridmanager_selection_expr no funcionarían correctamente en la puesta en marcha; Solo trabajaron después de un Condor_Reconfig. · Se corrigió un error en el que las operaciones de SOAP se estaban autorizando incorrectamente con el PEER IP. · Se corrigió un error de la plataforma de Windows en la que no se confiaba en el firewall de Windows (previamente conocido como Firewall o ICF de conexión a Internet). · Se corrigió una condición de carrera de apagado en el Condor_Master con respecto a los demonios de alta disponibilidad. · Se corrigió un error en el que un demonio de Condor determinó incorrectamente que se había quedado sin descriptores de zócalo. · Se corrigió un error donde el Condor_Schedd bloquearía durante largos períodos de tiempo mientras intentaba conectarse a un servidor de punto de control. Ahora, Condor_Schedd hará un bloqueo con conexión con un tiempo de espera al servidor de punto de control para un número configurable de segundos. Si la conexión falla, el Condor_SCHEDD pondrá una moratoria en la conexión al servidor de Punto de control hasta que pase el período de moratoria configurable. Las variables de archivo de configuración que describen este comportamiento se describen anteriormente. · Cambió el cheque que Condor_Dagman hace para otras instancias de Condor_Dagman que ejecutan el mismo DAG, si encuentra un archivo de bloqueo al inicio. Ahora, si Condor_Dagman no está seguro de si el otro Dagman está vivo, continúa, en lugar de salir. · Se corrigió una fuga de descriptor de archivo importante en el demonio de la cigüeña. · Se corrigió un error en el que se marcaban las transferencias de cigüeña exitosas como falló. · Se corrigió una fuga de memoria poco común en el código de registro de archivos de eventos del usuario al leer eventos muy formateados. · Se corrigió un error en el que múltiples clases de máquinas en el condor_collector con el mismo nombre, pero los diferentes valores de atributos de StartDipAddr harían que el Condor_negotiator salte con un error. Esto es inusual y no debe suceder en una instalación típica del cóndor. La causa más probable es usar Condor_advertise para anunciar las clases de CUSTOM para el emparejamiento de la cuadrícula. · Se solucionó un error que hizo que Condor_DAGMAN a CORE VUELT si todos los intentos de envío fallaron en un nodo DAG que tiene un script POST. Este error ha existido desde la versión 7.1.4 de Condor. · Se corrigió una fuga de memoria en el Condor_SCHEDD, que se produjo cuando se utilizó la variable de configuración negociadora_match_exprs. · Se corrigió un error en el código de la plataforma Windows que trata los scripts como ejecutables. Las extensiones de archivo desconocidas se trataron como un error, en lugar de un ejecutable de Windows. · El Condor_JOB_ROUTER ahora establece correctamente el atributo de la clase ingresado en CurrentStatus a la hora actual al crear un nuevo trabajo enrutado. Anteriormente, copió este atributo del trabajo original. · El Condor_Job_Router emite un mensaje de registro más amigable cuando observa que se eliminó la copia enrutada del trabajo. · Se ha realizado una solución para un problema visto en 7.3.1 en el que los demonios del cóndor que usan CCB para conectarse a otros demonios del cóndol a veces consumirían grandes cantidades de tiempo de CPU sin ninguna razón. · Se corrigió un error de caso raro de falla en el que los intentos de conectarse a través de CCB podrían permanecer en un estado pendiente indefinidamente. · Un error únicamente UNIX hizo que los demonios del cóndor no pudieran comenzar si MAX_FILE_DESIPTORS se configuró más alto que el límite duro actual heredado por Condor. Si el condado se está ejecutando como root, este ya no es el caso. · El Condor_GridManager ahora anuncia las clases de cuadrícula correctamente cuando hay múltiples demonios de Condor_Collector. · Cuando use Condor_Q -xml y -Format juntos para limitar el número de atributos de CLASIAD que se devuelven en la consulta, la etiqueta del contenedor XML no se generó. Esto es fijo, pero ahora la forma preferida de limitar los atributos devueltos es usar la opción Condor_Q -Attributes. · Se corrigió un error en el que el Unix Condor_Master falló al intentar reiniciarse, si se definió la variable Master_Lock de configuración, o si se invocó Condor_Master con la opción -t. Este error ha existido desde la serie 7.., y es probable que haya existido mucho más tiempo que eso. · Se corrigió una pérdida de memoria significativa en el GAHP_SERVER. Esta fuga solo estaba presente en los lanzamientos anteriores del Condor 7.3.x. · Se corrigió un error que puede causar un trabajo eliminado que se mantiene y luego se libera para volver al estado inactivo. · Los archivos JAR de Globus distribuidos con el X86-64 RHEL 5 RPM se dañaron, lo que hizo que los trabajos de tipo cuadrícula GT4 fallaran. Esto ha sido arreglado.


Cóndor Software relacionado

paexec

Una utilidad que distribuye tareas dadas (STDIN) en varias CPU o máquinas en una red. ...

188

Descargar

Muelle

contiene almacenamiento de archivos agrupados que puede escalar a Bytes PETA ...

170

Descargar

Atari800

Una computadora Atari de 8 bits y un emulador de sistema de juegos 5200 para múltiples plataformas. ...

172

Descargar