prometheus监控VShereClient7.0_EXSi7.0主机状态

prometheus监控VShereClient7.0_EXSi7.0主机状态这篇文章就够了,网上一些菜鸡那文章简直辣眼睛,就是瞎几把炒文章。

我用的docker的方式监控的,方便不需要编译。我监控的是:

VShereClient7.0_EXSi7.0主机状态

VShereClient7.0_EXSi7.0主机状态

VShereClient7.0_EXSi7.0主机状态

重要的事情说三遍。下面贴一张监控展示图,下面开始部署。

前提是把单台的EXSi7.0通过VShereClient7.0组成集群,vmware_exporter采集的数据是VShereClient7.0的数据,如下图。注意!!!!

第一步、编写docker-compose
[root@monitor vmware_exporter]# ls
docker-compose.yaml
[root@monitor vmware_exporter]# cat docker-compose.yaml
services:
vmware-exporter:
image: pryorda/vmware_exporter:v0.11.1
container_name: vmware-exporter
restart: unless-stopped
ports:
- \'9272:9272\'
expose:
- 9272
environment:
VSPHERE_HOST: "10.0.10.210"
VSPHERE_IGNORE_SSL: "True"
VSPHERE_USER: "administrator@vsphere.local"
VSPHERE_PASSWORD: "1qazXSW@"
labels:
org.label-schema.group: "monitoring"
第二、使用docker-compose将容器运行起来。
使用docker-compose将该容器运维起来。docker ps 查询该容器是否运行起来。如果没有请自行排查原因。

docker-compose up -d


第三、浏览该问监控所在服务器的ip+端口。
访问ip+端口发现vmware_exporter可以正常采集到数据,说明这就成功了80%了,剩下的就是配置监控项报警规则。

第四、配置监控项报警规则
添加监控项,并浏览器查看,满足监控规则就会报警。报警途径有许多请自行设置。

[root@monitor rules]# cat VsphereAlert.yml
groups:
- name: EXSi主机状态监控告警
rules:
- alert: EXSi主机状态
expr: vmware_host_power_state ==0
for: 5m
labels:
type: lost
severity: fatal
annotations:
summary: "EXSi主机 {{$labels.host_name}} 失联"
description: "EXSi任务 {{$labels.job}} 下的主机 {{$labels.host_name}} 已经超过五分钟没有数据了."
monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"

- alert: EXSi主机CPU使用情况
expr: (vmware_host_cpu_usage / vmware_host_cpu_max) * 100 >80
for: 5m
labels:
type: cpu
severity: warning
annotations:
summary: "EXSi主机 {{ $labels.host_name }} 的 CPU 使用率告警"
description: "EXSi主机 {{ $labels.host_name }} CPU 使用率超过 80%, 当前值为: {{ $value }}"
monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"

- alert: EXSi主机内存使用
expr: (vmware_host_memory_usage/ vmware_host_memory_max) * 100 >85
for: 5m
labels:
type: mem
severity: warning
annotations:
summary: "EXSi主机 {{ $labels.host_name }} 的内存使用率告警"
description: "EXSi主机 {{ $labels.host_name }} 的内存使用率超过 85%, 当前值为: {{ $value }}"
monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"

- alert: EXSi主机磁盘容量
expr: ((vmware_datastore_capacity_size- vmware_datastore_freespace_size) / vmware_datastore_capacity_size) * 100 >70
for: 5m
labels:
type: cpu
severity: warning
annotations:
summary: "EXSi主机 {{ $labels.host_name }} 的磁盘使用率告警"
description: "EXSi主机 {{ $labels.host_name }} 的磁盘使用率超过 70%, 挂载点: {{ $labels.mountpoint }} 当前值为:{{ $value }}%"
monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"


第五、添加Grafana展示模板。

请自行添加模板(连接地址https://grafana.com/grafana/dashboards/11243)模板ID:11243,添加时模板数据源选择promethus。最终展示如下图。

这是报警截图。

感谢大家不足之处请指出,谢谢。


————————————————
版权声明:本文为CSDN博主「遥襟」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_46396833/article/details/118021606

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zzzxfp.html