Nagios监控路由器和交换机设备简析

1.功能介绍
 
Nagios可以监控有IP可管理的交换机和路由器的设备状态。对小型无管理功能的交换机和HUB是无法监控。监控的方式是通过外部的ping所反馈的信息或者通过SNMP协议来获取相关的状态信息。
 
能够在网络设备上获取的信息包括:
 
包丢失率,包往返时间平均值
 
SNMP状态信息
 
带宽和传输数率
 
 
 
2.概述
 
   
 
监控的方式有两种
 
一种是利用ping的方式,获取数据包的响应时间和丢包率
 
另一种是利用网络设备的SNMP数据,通过check_snmp获取端口状态和check_mrtgtraf来了解带宽状况。
 
在使用check_snmp之前必须安装snmp包到系统中。如果没有安装则需要先安装好snmp系统包,然后再重新编译nagios plugins
 
3.配置步骤
 
完成第一次执行需要做的操作
 
创建新的监控设备主机和服务对象
 
重新启动Nagios
 
 
 
4.确认一下内容
 
 
 
在/usr/local/nagios/etc/objects/commands.cfg里面是否包含了check_snmp和check_local_mrtgtraf的命令定义
 
在/usr/local/nagios/etc/objects/templates.cfg里面是否包含了generic-switch
 
 
 
5.配置Nagios   
 
a.编辑/usr/local/nagios/etc/nagios.cfg
 
将#cfg_file=/usr/local/nagios/etc/objects/switch.cfg前面的#去掉
 
b.编辑/usr/local/nagios/etc/object/switch.cfg文件
 
设定监控主机的相关内容
 
define host{
 
        use        generic-switch        ; Inherit default values from a template
 
        host_name        Gateway                ; The name we're giving to this switch
 
        alias        Firewall        ; A longer name associated with the switch
 
        address        192.168.200.1        ; IP address of the switch
 
        hostgroups        allhosts,switches        ; Host groups this switch is associated with
 
        }监控包的丢失率和RTA响应时间
 
define service{
 
        use                generic-service        ; Inherit values from a template
 
        host_name                Gateway        ; The name of the host the service is associated with
 
        service_description        PING; The service description
 
        check_command        check_ping!200.0,20%!600.0,60%        ; 在超过200ms或丢包率在20%上的启动警告,超过600ms或丢包达到60%的启动报警
 
        normal_check_interval        5; 在正常情况下,每五分钟监控一次
 
        retry_check_interval        1; 在异常情况下,每分钟监控一次
 
        }
 
利用SNMP监控交换和网关设备define service{
 
        use                generic-service        ; Inherit values from a template
 
        host_name                Gateway
 
        service_description        Uptime     
 
        check_command        check_snmp!-C public -o sysUpTime.0
 
        }   
 
 
利用MRTG来监控网络流量信息
 
define service{
 
use generic-service ; Inherit values from a template
 
host_name Gateway
 
service_description Port 1 Bandwidth Usage
 
check_command check_local_mrtgtraf!/var/lib/mrtg/192.168.200.1_1.log!AVG!1000000,2000000!5000000,5000000!10
 
}利用command里面设定的check_local_mrtgtraf获取本地保存的mrtg流量日志信息来监控,获取文件是/var/lib/mrtg/192.168.200.1_1.log获取数据值是采取AVG的值,数值在1M~2M之间,则状态改为warning,如果超过5M的话则状态改为critical 完成配置后service nagios restart

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/824d2c0ef6a85ef1e12b9ce42f7e61b8.html