Zabbix企业级监控实践详述(6)

parameter:函数参数;大多数数值函数可以接受秒数为其参数,而 如果在数值参数之前使用"#"做为前缀,则表示为最近几次的取值,如:

sum(300)表示300秒内所有取值之和,而sum(#10)则表示最近10次取值之和;

此外,avg、count、last、min和max还支持使用第二个参数,用于完 成时间限定;例如,max(1h,7d)将返回一周之前的最大值;

operator:表达式所支持的运算符及其功能如下表所示

Zabbix企业级监控实践详述

触发器表达式的例子

一个例子

{:system.cpu.load[all,avg1].last(0)}>3

表示主机上所有CPU的过去1分钟内的平均负 载的最后一次取值大于3时将触发状态变换

对last函数来说,last(0)相当于last(#1)

触发器间的依赖关系

在一个网络中,主机的可用性之间可能存在依赖关系

例如,当某网关主机不可用时,其背后的所有主机都将无法正常访问

如果所有主机都配置了触发器并定义了相关的通知功能,相关人员将会接收到许多告警信息,这既不利于快速定位问题,也 会浪费资源

正确定义的触发器依赖关系可以避免类似情况的发生,它将使 用通知机制仅发送最根本问题���关的告警

注意:目前zabbix不能够直接定义主机间的依赖关系,其依 赖关系仅能通过触发器来定义

1.被监控主机触发器的依赖关系

Zabbix企业级监控实践详述

监控主机zabbix server 通过交换机的网络连接线来监控两台主机,假如交换机出现故障了,那么zabbix server也就采集不了被监控主机的数据了,不仅交换机的触发器会报警,被监控主机的触发器也会报警,此时定位故障就不好定位了,我们不知道到底是交换机出现了故障,还是被监控主机出现了问题,所以此时要定义触发器间的依赖关系,如果交换机出现了故障,交换机的触发器报警了,所有依赖此交换机触发器的主机就不用报警了。

2.被监控主机上服务触发器的依赖关系

Zabbix企业级监控实践详述

如图:触发器之间的依赖关系:被监控主机上的服务是否正常依赖于主机和主机网卡,而主机和主机网卡是否正常,依赖于交换机,所以监控到交换机故障,被监控主机就不用报警了,监控到被监控主机网卡故障,被监控主机上的服务就不用报警了(被监控网卡故障会导致zabbix server不能采集到被监控主机服务指标的数据)。 注释:定义触发器之间的依赖关系需要根据网络拓扑图来定义的 在web界面创建触发器(trigger)

Zabbix企业级监控实践详述

点击create trigger,定义表达式

Zabbix企业级监控实践详述

Zabbix企业级监控实践详述

点击添加

Zabbix企业级监控实践详述

再回到host中查看,如图:变绿了

Zabbix企业级监控实践详述

再次回到monitoring

Zabbix企业级监控实践详述

老师的图:在100pkts/sec那里有一根黄线

Zabbix企业级监控实践详述

Zabbix企业级监控实践详述

在web界面定义触发器的依赖关系

Zabbix企业级监控实践详述

action执行动作

1.在配置好监控项和触发器之后,一旦正常工作中的某触发器状态发生改变,一般意味着有异常情况发生,此时通常需要采取一定的动作(action),如告警或者执行远程命令等

2.并非所有的触发器状态发生改变的场景都需要对其进行干预,如转变为"OK"状态时,相应地,如果触发器的状态转变为"Problem",就需要告知所有关心其相关监控指标的人员了。

3."通知(notification)"是zabbix中最常用的"动作"之一

实现zabbix的通知功能,一般需要两个步骤: 1. 定义所需的"媒介(media)":通常指发送信息的途径,如邮件、Jabber和SMS等;

2.配置一个"动作(action)":发送信息至某"媒介";

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/82f0cd2c45fdd400bdc50ba9007b166c.html