Ubuntu上快速搭建Nagios监控(2)

想查看check_http/check_ping/check_mysql的详细,对应的请查看http.cfg/ping.cfg/mysql.cfg里是怎么配置的。一般都是调用/usr/lib/nagios/plugins下的脚本,这些脚本都是可执行的,加"-- help"可查看该脚本的具体用法。如:

 

1   /usr/lib/nagios/plugins/check_http --help  

可输出check_http的使用说明。


配置的组成结构

在/etc/nagios3/conf.d下有一组配置,该配置的结构为:

1) contacts_nagios2.cfg: 配置联系人,可配置报警的命令等,一般我会在这里修��了联系人的email;

2) generic-service_nagios2.cfg和generic-host_nagios2.cfg配置,generic-host/generic-service的一些配置,这样你配置的host/service只要配上use generic-host/use generic-service就能继承相应的配置。扩展的配置放在extinfo_nagios2.cfg里,时间段配置在timeperiods_nagios2.cfg里,这几个文件我都没有修改。

3) hostgroups_nagios2.cfg里配置host的分组,实际上它的主要作用是给host进行分类;

4)最重要的是services_nagios2.cfg,这里配置了需监视的service,每个service可指定针对哪类host有效。如:

 

1   define service {  

2           hostgroup_name                  http-servers           

 

1           service_description             HTTP  

2           check_command                   check_http  

3           use                             generic-service  

4           notification_interval           0 ; set > 0 if you want to be renotified  

5   }  

比较合理的配置方法是,在service_nagios2.cfg里为每类server配置service,然后在hosts.cfg和hostgroup_nagios2.cfg,配置相应的server和该server的类别。这样,在server地址或server上的服务发生变化的情况下,只需要修改host.cfg和hostgroup_nagios2.cfg即可。


被监控机器的配置

配置文件是/etc/nagios/nrpe.cfg。主要配置项有:

 

1   #server_address=127.0.0.1  

默认是只有本机才能访问,多IP地址的情况下也不知道用的哪个IP,通常情况下会配成内网的地址;

 

1   allowed_hosts=127.0.0.1  

容许访问nrpe的机器,多个主机用','分隔,注意不要留空格,“127.0.0.1, 192.168.1.12”是不工作的,必须是"127.0.0.1,192.168.1.12";

nrpe里的自定义command,如:

 

1   command[check_users]=/usr/lib/nagios/plugins/check_users -w 5 -c 10  

2   command[check_load]=/usr/lib/nagios/plugins/check_load -w 15,10,5 -c 30,25,20  

3   command[check_hda1]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p /dev/hda1  

这样在nagios server上可通过/usr/lib/nagios/plugins/check_nrpe -H <被监控机器> -c check_load来调用被监控机上的check_load;又参见/etc/nagios-plugin/config/check_nrpe.cfg,需要配置的command line应为check_nrpe_1arg!check_load。我就是在这里写成了check_nrpe!check_load导致服务unknown的。


后继

按以上步骤,大概20分钟后就可以搭起一个最基本的监控系统。完成后可通过nagios的web查看各个host和service,观看详细的运行情况,包括下次监控脚本运行时间等等。如果需要细致的配置,如配置检查间隔等,请查看nagios的官方文档。(nagios主页位于)

如果需要扩展监控脚本,需自己写一个脚本,返回值为0, 1, 2时分别代表Normal,Warning,Critical的状态,然后在nrpe里配好command即可。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/f3927ab75cac3d60f8516e26491fe2ea.html