check_ganglia_metric

GANGLIOS métricos con comprobante de comprobante de nagios
Descargar ahora

check_ganglia_metric Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • Freely Distributable
  • Nombre del editor:
  • Michael T. Conigliaro
  • Sitio web del editor:
  • http://conigliaro.org

check_ganglia_metric Etiquetas


check_ganglia_metric Descripción

Ganglia métrica comprobar complemento para nagios Check_ganglia_metric es un complemento de Nagios que le permite activar alertas en cualquier ganglio métrico.Check_ganganglia_métrico se inspiró en gran medida en el check_ganganglia_metric.php de Vladimir Vuksan, pero viene con una serie de mejoras. Inicialización # PIP Instale check_ganglia_metric ... o: # Easy_Install Check_Ganglia_METRICGANGLIA CONFIGURALURA INTERNE Su servidor Nagios y Ganglia Meta Daemon se están ejecutando en el mismo host, es probable que necesite editar su gmetad.conf para permitir las conexiones remotas de su servidor Nagios. Para permitir las conexiones de nagios-server.example.com:trusted_hosts nagios-server.example .como permitir conexiones de todos los hosts (probablemente un riesgo de seguridad): all_trusted OnTesting en la línea de comandos, veamos si check_ganglia_metric puede comunicarse con el Daemon Meta: check_ganglia_metric.py --gmetad_host = gmetad-server.example.com \ - metric_host = host.example.com --metric_name = cpu_idlestatus ok, CPU inactivo = 99.3% | CPU_IDLE = 99.3% ;;; El mensaje "Estado OK" indica que el Che CK_GANGLIA_METRIC está funcionando. Si tiene problemas para que esto funcione, intente nuevamente el registro verboso habilitado (--verbose) con el fin de obtener una mejor idea de lo que está funcionando. Ahora intentemos establecer un umbral de alerta: check_ganglia_metric.py --gmetad_host = gmetad- servidor.example.com \ --metric_host = host.example.com --metric_name = cpu_idle - critici = 99status crítico, CPU inactivo = 99.6% | CPU_idle = 99.6%; 99 ;; Le dijimos a Check_Ganglia_métrico devolver un "crítico "Estado si la CPU inactiva fue mayor que 99. El mensaje" Estado crítico "indica que funcionó. Tenga en cuenta que los cordones y los umbrales de los análisis de cheque_ganglia_métrico según las directrices oficiales de desarrollo de la plugina de Nagios. check_ganglia_metric command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ hostaddress $ --metric_name = $ arg1 $ --warning = $ arg2 $ - _ {} - $ arg3 $} Ahora puede usar el comando anterior en sus definiciones de servicio: define el servicio {service_description CPU inactivo - Gangly Use Some_Template Check_Command Check_Ganglia_METRIC! CPU_IDLE! 0: 20! 0: 0 host_name host.example.com} Esto funcionará bien con algo Check_ganglia_métrico (por ejemplo, el archivo de caché no se puede leer / escrito en, no se puede llegar al demonio de Ganglia Meta, etc.). En ese momento, cada servicio que se basa en check_ganglia_métrico fallará, posiblemente lo inundará con las alertas. Podemos prevenir esto mediante el uso de las dependencias del servicio. La primera cosa que necesitamos es una definición de comando para verificar la edad de un archivo: define el comando {command_name check_file_age command_line / usr / lib / nagios / complementos / check_file_age -f $ arg1 $ - W $ ARG2 $ -C $ ARG3 $} A continuación, definimos un servicio que comprueba la edad del archivo de caché de check_ganglia_metric. Tenga en cuenta que para ser verdaderamente efectivo, este servicio debe verificarse al menos como (preferiblemente más) con frecuencia que todos los otros cheques que se basan en check_ganglia_metric: define el servicio {service_description caché para check_ganglia_metric use some_template check_command check_file_age! / Var / lib / nagios / .check_ganglia_metric.cache! 60! 120 host_name localhost check_interval 1 max_check_attempts 1} y, finalmente, establecemos la dependencia del servicio real. Tenga en cuenta que he habilitado wee_regexp_matching en Nagios, lo que me permite usar expresiones regulares en mis directivas. Al adherirse "- Ganglios" al final de cada servicio que se basa en check_ganglia_metric, puedo ahorrar mucho esfuerzo: Define ServiceEpendency {Host_Name LocalHost Service_Description Cache para check_ganganglia_metric dependiente_host_name. * Dependiente_service_descripción. * \ - ganglia $ ejecución_failure_criteria c, p} Ahora, si algo sale mal con check_ganglia_metric, solo se enviará una alerta sobre el archivo de caché y todas las verificaciones de servicio dependientes se detendrán hasta que solucione el problema que causó que Check_Ganglia_métrico fallará. Una vez que se solucione el problema, deberá actualizar la marca de tiempo en el archivo de caché para que vuelva a colocar el servicio "cache para check_ganglia_metric" en un estado OK (que permitirá que las verificaciones de servicio dependientes continúen): Toque / Var / lib /nagios/.check_ganglia_metric.cachetips y trucksit es posible obtener una lista completa de los hosts y métricas disponibles al permitir el registro de "más verbose" (-vv). Dado que se requieren las opciones de METRIC_HOST y METRIC_NAME, tiene un poco de un problema de "pollo y huevo" aquí, pero está bien. Sólo suministre algunos datos fantásticos. El complemento se equivocará al final con un error "host / métrico no encontrado", pero no antes de que verga su caché: check_ganglia_metric.py --gmetad_host = gmetad-server.example.com \ --metric_host = maniquí --metric_name = Dummy -vv Requisitos: · Python · Nagios Limitaciones: · No funciona con Python 2.4


check_ganglia_metric Software relacionado

GRAPHITE-METRICS

Collectores de datos métricos de grafito independiente para varias cosas que no están (o mal) manejadas por OTH ... ...

173

Descargar