Nagios之配置事件处理

日期：2020-09-30 栏目：程序人生浏览：次

所谓的事件处理也就是让nagios更加聪明一点，当出现某些事件时能够做些其他事情，而不是只会报警。例如，当nagios检测到apache服务挂掉的时候，不是立即发报警，先尝试重启apache服务，当重启后还检测不成功时才发报警，下面就以apache服务为例：

前提条件：
主配置文件/usr/local/nagios/etc/nagios.cfg中 enable_event_handlers=1 此选项为事件处理的总开关
服务或主机的配置文件中 event_handler_enabled 的值为1

1、配置监控能够通过公钥认证不需要密码登录被监控端
在监控端配置：
su nagios
ssh-keygen -t rsa
exit
scp /home/nagios/.ssh/id_rsa.pub root@192.168.56.201:/root

在被监控端配置：
mkdir /home/nagios/.ssh
cat id_rsa.pub > /home/nagios/.ssh/authorized_keys
chown -R nagios.nagios /home/nagios/.ssh/
chmod 700 /home/nagios/.ssh/
chmod 600 /home/nagios/.ssh/authorized_keys

在监控端测试：
su nagios
ssh nagios@192.168.56.201

2、在被监控端上编写用于执行的事件脚本
mkdir /usr/local/nagios/libexec/eventhandlers
vim /usr/local/nagios/libexec/eventhandlers/restart-httpd ==> 脚本内容如下

#!/bin/bash
# Event handler script for restarting the web server on the local machine
case "$1" in
OK)
        ;;
WARNING)
        ;;
UNKNOWN)
        ;;
CRITICAL)
        case "$2" in
        SOFT)
                case "$3" in
                3)
                        echo -n "Restarting HTTP service (3rd soft critical state)..."
                        sudo /etc/rc.d/init.d/httpd restart
                        ;;
                        esac
                ;;
        HARD)
                echo -n "Restarting HTTP service..."
                sudo /etc/rc.d/init.d/httpd restart
                ;;
        esac
        ;;
esac
exit 0

说明：该脚本会在服务状态检测三次处于CRITICAL的软状态之后执行重启httpd服务，在服务首次进入硬CRITICAL状态后执行一次重启httpd服务。

3、在被监控端配置sudo，使nagios可以以root身份执行httpd服务的restart操作
安装sudo软件包
yum install sudo

配置sudo可以无需密码运行脚本
vim /etc/sudoer ==> 修改并添加如下

#Defaults requiretty #注释掉该行
nagios ALL=(root) NOPASSWD:/usr/local/nagios/libexec/eventhandlers/restart-httpd #添加该行

测试是否可以无密码执行
su nagios
sudo /usr/local/nagios/libexec/eventhandlers/restart-httpd CRITICAL HARD

4、在监控端添加restart-httpd命令
vim /usr/local/nagios/etc/objects/commands.cfg ==> 添加如下行

define command{
        command_name    restart-httpd
        command_line    /usr/bin/ssh nagios@$HOSTADDRESS$ "sudo /usr/local/nagios/libexec/eventhandlers/restart-httpd $SERVICESTATE$ $SERVICESTATETYPE$ $SERVICEATTEMPT$"
        }

5、在监控端的服务定义中使用此命令
vim /usr/local/nagios/etc/objects/web.cfg ==> 修改为如下

define service{
        use                             cihi-service
        hostgroup_name                  web
        service_description             HTTP
        check_command                   check_http!-u /.heartbeat.html -t 5 -s "ok"
        event_handler                   restart-httpd         #这个是新增加的内容
        }

问题总结：配置过程并不复杂，但很容易出现脚本不会执行的问题，可以尝试在监控端切换到nagios，通过ssh连接到被监控端执行sudo /usr/local/nagios/libexec/eventhandlers/restart-httpd CRITICAL HARD 看能否成功执行重启apache的操作，只要这样可以成功基本上就没什么问题了，有了这样一个例子就可以自己扩展了，脚本内容可以根据自己需要写。

转载注明出处：http://www.heiqu.com/7614d3bd31702ea8f55f89a8b0d7645a.html

Nagios之配置事件处理

相关推荐