做数仓运维,你必须要认识这个眼观六路耳听八方的“能人” (3)

因为上面已经分析了指标的维度关系,所以我们下面将只讨论具体的数据库指标类型,而不会对指标的维度进行展开。数据库是一个软件服务,而它必须运行在一个宿主机和操作系统之上,因此监控指标大致可以分为两类:

系统资源类指标:这一类指标主要描述系统上的各种资源消耗

数据库相关指标:这一类指标主要描述数据性能相关的业务负载水平

DMS集群指标设计.jpg

上图总结了DMS采集的数据库主要指标,具体指标项按照指标大类,原子指标和派生指标三个层次排列。不过,目前该指标地图并不固定,未来随着GaussDB(DWS)智能运维系统的逐步成熟,该指标地图会逐步完善并固定下来。

因为MPP数据库的特殊构型,数据库实例是作为进程试运行在节点上的。因此,我们的指标设计其实本身会自带维度属性,比如磁盘使用率指标,最小的维度应该是某个DN实例,上一级是节点级,再上一级就是整个集群。所以,我们实际提供的监控指标应该是指标维度关系与集群指标地图的一个笛卡尔积。为了描述这种情形,我们引入原子指标,派生指标和组合指标的概念。以上面的磁盘使用率为例,我们将DN实例的磁盘使用率作为原子指标,而其他维度的磁盘使用率作为派生指标。

原子指标:描述数据库某个特性的最小维度指标,比如节点的CPU使用率,DN实例的磁盘使用率,等等。

派生指标:(1)原子指标在不同维度上的聚合结果,比如集群平均CPU使用率,集群磁盘使用率,等等;(2)对原子指标做统计运算得到的新指标,比如CPU倾斜率,等等。

组合指标:将多个原子指标或者派生指标组合在一起,从而得到的更加便于理解的新指标。比如集群健康度,等等。

目前DMS的指标建设更多停留在原子指标和派生指标阶段,因为我们认为应该首先补齐数据库的基础指标形成基本的监控运维能力之后,才能结合用户使用习惯,深度挖掘指标在各个维度下的运维含义以及多种指标组合后所代表的运维意义。

总结

最后,总结一下,本文主要介绍了GaussDB(DWS)数据库智能监控运维服务体系的设计规划和现状。本文作为DMS系列文章的第一篇,主要起到一个概要介绍的作用,让大家对GaussDB(DWS)数据库智能监控运维服务体系有个概略的认识,更多干货细节欢迎期待后续的文章。

想了解GuassDB(DWS)更多信息,欢迎微信搜索“GaussDB DWS”关注微信公众号,和您分享最新最全的PB级数仓黑科技,后台还可获取众多学习资料哦~

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zygpgf.html