解放运维的双手,谈自动化运维管理平台设计 (2)

CMDB在这里更多是偏向IT设备管理,因为这样可以更快地完成。与传统的CMDB不同,我们把配置管理放在了自动运维模块了。这里的CMDB主要是将整个IT部门的硬件资源,已有系统,服务包括供应商做一个管理,为以后的监控和自动化运维等提供基础数据。该平台CMDB的建设思路主要是以产品线和项目为导向,具体顺序说明如下。

一、产品线和项目

首先是确定整个公司的IT产品线。以某航空公司为例,涉及到的系统有运行控制系统、飞行排班系统、机务管理系统、B2C官网系统、呼叫中心系统等。

经过分析判断,可以确定该公司主要分为两大产品主线,即:运行相关系统主线和运营相关主线。运行相关涉及到运行控制、飞行排班、机务等各个项目系统;运营相关系统主要有呼叫中心、B2C等。

为了更好地理解产品线和项目的划分,再举一个B2B电商的例子,涉及到的有买卖家管理系统、订单系统、支付系统、物流系统、对账系统等。可以大概分为销售产品线:买卖家管理、订单管理;财务产品线:支付系统、对账系统;物流产品线:物流系统、第三方物流接口等。

产品线的划分一定要站在公司的角度进行,可以结合公司的主要部门,和大产品群进行划分。产品线划分好后,接下来就是梳理整个公司的所有项目,将每一个项目,按照所属产品线进行归类。

二、IT资产管理

经过产品线划分和项目归类之后,可以一目了然地看到目前公司所有的IT系统。接下来根据每一个项目梳理项目中涉及到的服务器或是虚拟机。然后还需要从另一个维度去梳理:每一台服务器或是虚拟机上面部署的项目,服务(数据库、Tomcat、WebLogic等)。经过这一步,可以明确每一个项目涉及哪些服务器或是虚拟机,每一台服务器或虚拟机上又关联多少个项目,部署了多少服务。

虚拟机在哪些宿主机,宿主机又分布在哪些物理机上,而这些物理机又部署在哪个机房的哪个机柜;网络连接是怎样,上行和下行分别是什么,都需要进行梳理和完善,这样可以从硬件层面去关注每一个系统的硬件关联。如果硬件或是网路出现任何问题,可以快速地清楚知道涉及到的系统和影响度。

三、供应商管理

每一个公司的IT设备或是系统基本都会有供应商公司的参与。集中统一管理这些供应商的信息,可以在系统出现问题的时候紧急联系供应商,进行协助解决。

2生产数据库

生产数据库作为基础数据的重要一环,为业务数据监控提供主要途径。我们在监控模块中有一个业务监控,主要依赖业务数据库中的数据,根据业务逻辑进行数据比对,判断业务的实时性和准确性。

一般在监控和备份的时候,数据库都会作为单独的一个主题进行(因为太重要)。在基础数据模块,将所有的生产数据库信息进行集中采集,可以很方便地为以后的数据库监控和备份等运维工作提供操作对象参考,以免遗漏。

生产数据库一般按照数据库的类型(MySQL、Oracle、SQL Server等)进行分类管理。数据库的名称一般即业务系统的名称,简单标识,见名知意。

3日志数据

日志数据是IT系统的重要数据之一,可以很好地反映系统的运行状况,系统出现问题的时候,可以通过反查日志进行查因、排故。

一、系统日志

系统日志主要是包括操作系统级别的日志,包括物理机、宿主机、虚拟机等部署有操作系统的系统日志。一般主要关注以下几种日志:系统操作日志、安全日志、定时任务日志等。

系统操作日志可以看到什么用户什么时间登录了哪台操作系统,做了什么操作等;安全日志可以判断系统是否已遭受或是正在遭受攻击,是否有过危险操作等;定时任务日志可以看到部署在系统中的定时任务是否按时准确地执行完成。

系统日志主要反映系统级别的运行情况,一定要做好备份和分析的工作。

二、应用日志

应用日志一般分应用服务日志和业务操作日志。应用服务日志指如Tomcat、Nginx运行时候产生的日志等,通过其可以看到应用服务运行的健康情况;业务操作日志主要是业务系统将部分业务操作或是业务错误写到日志中,可能单独一个日志文件也可能集成到应用服务日志中。业务操作日志是进行业务审计,业务监控的重要数据源。

三、数据库日志

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zzwxff.html