通过浏览器访问 通过 Current Status --> Service可以看到添加的主机 192.168.0.28 对应的3个服务的列表,刚开始都是 pending 状态,过一段时间 Status 会变成 OK 字样。
5. 配置文件解释说明
我们定义的配置文件中一共监控了三个 service: ssh ping http 这三个项目是使用本地的 nagios 工具去连接远程机器,及时没有安装任何的插件也是可以监测到的。
max_check_attempts 5:尝试检测到5次有问题才会告警,如果设置为1,一旦检测到问题立马告警
normal_check_interval 1:重新检测的时间间隔,单位是分钟,默认是 3 分钟。
notification_interval 60:出现异常后故障一直没有解决,nagios再次对使用者发出通知的时间。设置为0,仅通知一次。
其它的一些 service 诸如负载、磁盘使用等需要服务端通过 nrpe 去连接到远程主机获得信息,所以需要远程主机安装 nrpe 服务以及相应的插件程序。
1. 监控客户端
IP 地址:192.168.0.28
2. 客户端需要安装的软件
[root@nagios ~]# yum install epel-release -y # 安装epel源 [root@nagios ~]# yum install nrpe -y # 安装nrpe服务软件 [root@nagios ~]# yum install nagios-plugins-all -y # 安装所有nagios插件
3. 配置客户端nrpe服务能被监控
[root@nagios ~]# vim /etc/nagios/nrpe.cfg # 修改如下内容
allowed_hosts=127.0.0.1,192.168.0.8
# 添加192.168.0.8来监控
dont_blame_nrpe=1
# 修改0为1,设置可以传递参数
command[check_hda1]=/usr/lib64/nagios/plugins/check_disk -w 20% -c 10% -p /dev/sda1
4. 客户端启动nrpe服务
[root@nagios ~]# service nrpe start Starting nrpe: [确定]
5. 服务器端配置来监控客户端
[root@vip ~]# vim /etc/nagios/objects/commands.cfg 在最后面增加如下: define command{ command_name check_nrpe command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ }
[root@vip ~]# vim /etc/nagios/conf.d/192.168.0.28.cfg
增加如下内容:
define service{ # 添加监控负载 use generic-service host_name 192.168.0.28 service_description check_load check_command check_nrpe!check_load max_check_attempts 5 normal_check_interval 1 } define service{ # 添加监控sda1磁盘 use generic-service host_name 192.168.0.28 service_description check_disk_hda1 check_command check_nrpe!check_hda1 max_check_attempts 5 normal_check_interval 1 }
6. 重新加载服务器配置
[root@vip ~]# service nagios reload
通过浏览器访问 正常显示。
七、Nagios 配置图形显示Nagios 对服务或主机监控的是一个瞬时状态,有时候系统管理员需要了解主机在一段时间内的性能及服务的响应状态,并且形成图表,这就需要通过查看日志数据来分析。但是这种方式不仅烦琐,而且抽象。为了能更直观的查看主机运行状态,这里采用 PNP 来实现此功能。PNP 是一个小巧的开源软件包,它是基于 PHP 和 Perl 脚本编写,PNP 可以利用 rrdtoul 工具将 Nagios 采集的数据绘制成图表,然后显示主机或者服务在一段时间内运行的状况。注:以下操作都是针对中心服务器的。
1. 安装pnp4nagios软件
[root@vip ~]# yum install -y pnp4nagios rrdtool
2. 修改主配置文件