企业级监控zabbix基础 (7)

4.一旦某次采集的数据超出了此触发器定义的阈值,触发器状 态将会转换为"Problem";而当采取的数据再次回归至合理范 围内时,其状态将重新返回到"OK"

触发器表达式

触发器表达式高度灵活,可以以之创建出非常复杂的测试条件

基本的触发器表达式格式如下所示

{<server>:<key>.<function>(<parameter>)}<operator><constant>

server:主机名称;

key:主机上关系的相应监控项的key;

function:评估采集到的数据是否在合理范围内时所使用的函数,其 评估过程可以根据采取的数据、当前时间及其它因素进行;

目前,触发器所支持的函数有avg、count、change、date、dayofweek、delta、diff、iregexp、last、max、min、nodata、now、sum等

parameter:函数参数;大多数数值函数可以接受秒数为其参数,而 如果在数值参数之前使用"#"做为前缀,则表示为最近几次的取值,如:

sum(300)表示300秒内所有取值之和,而sum(#10)则表示最近10次取值之和;

此外,avg、count、last、min和max还支持使用第二个参数,用于完 成时间限定;例如,max(1h,7d)将返回一周之前的最大值;

operator:表达式所支持的运算符及其功能如下表所示

企业级监控zabbix基础

触发器表达式的例子

一个例子

{:system.cpu.load[all,avg1].last(0)}>3

表示主机上所有CPU的过去1分钟内的平均负 载的最后一次取值大于3时将触发状态变换

对last函数来说,last(0)相当于last(#1)

触发器间的依赖关系

在一个网络中,主机的可用性之间可能存在依赖关系

例如,当某网关主机不可用时,其背后的所有主机都将无法正常访问

如果所有主机都配置了触发器并定义了相关的通知功能,相关人员将会接收到许多告警信息,这既不利于快速定位问题,也 会浪费资源

正确定义的触发器依赖关系可以避免类似情况的发生,它将使 用通知机制仅发送最根本问题相关的告警

注意:目前zabbix不能够直接定义主机间的依赖关系,其依 赖关系仅能通过触发器来定义

 

1.被监控主机触发器的依赖关系

企业级监控zabbix基础

监控主机zabbix server 通过交换机的网络连接线来监控两台主机,假如交换机出现故障了,那么zabbix server也就采集不了被监控主机的数据了,不仅交换机的触发器会报警,被监控主机的触发器也会报警,此时定位故障就不好定位了,我们不知道到底是交换机出现了故障,还是被监控主机出现了问题,所以此时要定义触发器间的依赖关系,如果交换机出现了故障,交换机的触发器报警了,所有依赖此交换机触发器的主机就不用报警了。

 

2.被监控主机上服务触发器的依赖关系

企业级监控zabbix基础

如图:触发器之间的依赖关系:被监控主机上的服务是否正常依赖于主机和主机网卡,而主机和主机网卡是否正常,依赖于交换机,所以监控到交换机故障,被监控主机就不用报警了,监控到被监控主机网卡故障,被监控主机上的服务就不用报警了(被监控网卡故障会导致zabbix server不能采集到被监控主机服务指标的数据)。 注释:定义触发器之间的依赖关系需要根据网络拓扑图来定义的 在web界面创建触发器(trigger)

企业级监控zabbix基础

点击create trigger,定义表达式

企业级监控zabbix基础

 

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wpgggp.html