所谓的事件处理也就是让nagios更加聪明一点,当出现某些事件时能够做些其他事情,而不是只会报警。例如,当nagios检测到apache服务挂掉的时候,不是立即发报警,先尝试重启apache服务,当重启后还检测不成功时才发报警,下面就以apache服务为例:
前提条件:
主配置文件/usr/local/nagios/etc/nagios.cfg中 enable_event_handlers=1 此选项为事件处理的总开关
服务或主机的配置文件中 event_handler_enabled 的值为1
1、配置监控能够通过公钥认证不需要密码登录被监控端
在监控端配置:
su nagios
ssh-keygen -t rsa
exit
scp /home/nagios/.ssh/id_rsa.pub root@192.168.56.201:/root
在被监控端配置:
mkdir /home/nagios/.ssh
cat id_rsa.pub > /home/nagios/.ssh/authorized_keys
chown -R nagios.nagios /home/nagios/.ssh/
chmod 700 /home/nagios/.ssh/
chmod 600 /home/nagios/.ssh/authorized_keys
在监控端测试:
su nagios
ssh nagios@192.168.56.201
2、在被监控端上编写用于执行的事件脚本
mkdir /usr/local/nagios/libexec/eventhandlers
vim /usr/local/nagios/libexec/eventhandlers/restart-httpd ==> 脚本内容如下
#!/bin/bash
# Event handler script for restarting the web server on the local machine
case "$1" in
OK)
;;
WARNING)
;;
UNKNOWN)
;;
CRITICAL)
case "$2" in
SOFT)
case "$3" in
3)
echo -n "Restarting HTTP service (3rd soft critical state)..."
sudo /etc/rc.d/init.d/httpd restart
;;
esac
;;
HARD)
echo -n "Restarting HTTP service..."
sudo /etc/rc.d/init.d/httpd restart
;;
esac
;;
esac
exit 0
说明:该脚本会在服务状态检测三次处于CRITICAL的软状态之后执行重启httpd服务,在服务首次进入硬CRITICAL状态后执行一次重启httpd服务。
3、在被监控端配置sudo,使nagios可以以root身份执行httpd服务的restart操作
安装sudo软件包
yum install sudo
配置sudo可以无需密码运行脚本
vim /etc/sudoer ==> 修改并添加如下
#Defaults requiretty #注释掉该行
nagios ALL=(root) NOPASSWD:/usr/local/nagios/libexec/eventhandlers/restart-httpd #添加该行
测试是否可以无密码执行
su nagios
sudo /usr/local/nagios/libexec/eventhandlers/restart-httpd CRITICAL HARD
4、在监控端添加restart-httpd命令
vim /usr/local/nagios/etc/objects/commands.cfg ==> 添加如下行
define command{
command_name restart-httpd
command_line /usr/bin/ssh nagios@$HOSTADDRESS$ "sudo /usr/local/nagios/libexec/eventhandlers/restart-httpd $SERVICESTATE$ $SERVICESTATETYPE$ $SERVICEATTEMPT$"
}
5、在监控端的服务定义中使用此命令
vim /usr/local/nagios/etc/objects/web.cfg ==> 修改为如下
define service{
use cihi-service
hostgroup_name web
service_description HTTP
check_command check_http!-u /.heartbeat.html -t 5 -s "ok"
event_handler restart-httpd #这个是新增加的内容
}
问题总结:配置过程并不复杂,但很容易出现脚本不会执行的问题,可以尝试在监控端切换到nagios,通过ssh连接到被监控端执行sudo /usr/local/nagios/libexec/eventhandlers/restart-httpd CRITICAL HARD 看能否成功执行重启apache的操作,只要这样可以成功基本上就没什么问题了,有了这样一个例子就可以自己扩展了,脚本内容可以根据自己需要写。