Nagios之配置事件处理

所谓的事件处理也就是让nagios更加聪明一点,当出现某些事件时能够做些其他事情,而不是只会报警。例如,当nagios检测到apache服务挂掉的时候,不是立即发报警,先尝试重启apache服务,当重启后还检测不成功时才发报警,下面就以apache服务为例:

前提条件:
    主配置文件/usr/local/nagios/etc/nagios.cfg中 enable_event_handlers=1 此选项为事件处理的总开关
    服务或主机的配置文件中 event_handler_enabled 的值为1

1、配置监控能够通过公钥认证不需要密码登录被监控端
在监控端配置:
su nagios
ssh-keygen -t rsa
exit
scp /home/nagios/.ssh/id_rsa.pub root@192.168.56.201:/root

在被监控端配置:
mkdir /home/nagios/.ssh
cat id_rsa.pub > /home/nagios/.ssh/authorized_keys
chown -R nagios.nagios /home/nagios/.ssh/
chmod 700 /home/nagios/.ssh/
chmod 600 /home/nagios/.ssh/authorized_keys

在监控端测试:
su nagios
ssh nagios@192.168.56.201

2、在被监控端上编写用于执行的事件脚本
mkdir /usr/local/nagios/libexec/eventhandlers
vim /usr/local/nagios/libexec/eventhandlers/restart-httpd  ==> 脚本内容如下

#!/bin/bash
# Event handler script for restarting the web server on the local machine
case "$1" in
OK)
        ;;
WARNING)
        ;;
UNKNOWN)
        ;;
CRITICAL)
        case "$2" in
        SOFT)
                case "$3" in
                3)
                        echo -n "Restarting HTTP service (3rd soft critical state)..."
                        sudo /etc/rc.d/init.d/httpd restart
                        ;;
                        esac
                ;;
        HARD)
                echo -n "Restarting HTTP service..."
                sudo /etc/rc.d/init.d/httpd restart
                ;;
        esac
        ;;
esac
exit 0

说明:该脚本会在服务状态检测三次处于CRITICAL的软状态之后执行重启httpd服务,在服务首次进入硬CRITICAL状态后执行一次重启httpd服务。

3、在被监控端配置sudo,使nagios可以以root身份执行httpd服务的restart操作
安装sudo软件包
yum install sudo

配置sudo可以无需密码运行脚本
vim /etc/sudoer  ==>   修改并添加如下

#Defaults    requiretty      #注释掉该行
nagios  ALL=(root)      NOPASSWD:/usr/local/nagios/libexec/eventhandlers/restart-httpd    #添加该行

测试是否可以无密码执行
su nagios
sudo /usr/local/nagios/libexec/eventhandlers/restart-httpd CRITICAL HARD

4、在监控端添加restart-httpd命令
vim /usr/local/nagios/etc/objects/commands.cfg  ==>  添加如下行

define command{
        command_name    restart-httpd
        command_line    /usr/bin/ssh nagios@$HOSTADDRESS$ "sudo /usr/local/nagios/libexec/eventhandlers/restart-httpd $SERVICESTATE$ $SERVICESTATETYPE$ $SERVICEATTEMPT$"
        }

5、在监控端的服务定义中使用此命令
vim /usr/local/nagios/etc/objects/web.cfg    ==>  修改为如下

define service{
        use                             cihi-service       
        hostgroup_name                  web
        service_description             HTTP
        check_command                   check_http!-u /.heartbeat.html -t 5 -s "ok"
        event_handler                   restart-httpd         #这个是新增加的内容
        }
 
问题总结:配置过程并不复杂,但很容易出现脚本不会执行的问题,可以尝试在监控端切换到nagios,通过ssh连接到被监控端执行sudo /usr/local/nagios/libexec/eventhandlers/restart-httpd  CRITICAL HARD 看能否成功执行重启apache的操作,只要这样可以成功基本上就没什么问题了,有了这样一个例子就可以自己扩展了,脚本内容可以根据自己需要写。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/7614d3bd31702ea8f55f89a8b0d7645a.html