再比如,在告警处理及故障恢复场景,为了避免运维制作大量针对不同业务的“故障自动恢复”类工具,蓝鲸团队提供了通用的“故障自愈”服务:
1. 将基础告警及自定义告警的产生封装成了通用服务;
2. 将告警处理中常用的一些节点封装成组件再集成为套餐供运维通过图形化界面选用。
当然为了适配个性化的场景,也提供了PaaS编辑器,允许运维用python语言自定义复杂的故障分析树。
运维是一个被压抑了太久的岗位。在行业的一些交流中,很多公司的运维说他们虽然掌控着运营环境,却在逐渐地被排挤出业务的关键流程中,感到对未来很迷茫。
我只能说,没有充分利用运维的价值,这是他们整个公司的损失,每个业务都是有专职运维的,运维了解运营环境,了解业务架构,了解产品本身,有着丰富的想象力。
而蓝鲸,就是要让运维的想象力爆发出来,并施加到业务上。
蓝鲸,是腾讯游戏的运维们从实战中“总结、提炼、构想、设计、建设”出来的体系,其设计初衷是武装运维,使其能提供更高维度的服务,而不是取代运维,同时迎合了运营、开发、测试等岗位人员的需求。
在所谓的“运维危机”时代,我们更懂得,并成功验证了运维对业务的价值。
蓝鲸曾支撑腾讯游戏走过了不同层级的标准化、自动化时代,当前正在和应用运维一起探索服务化。而我们自己也在慢慢的将各平台逐步产品化,以支持腾讯的投资公司以及自己部署在公有云上的业务和我们的合作伙伴。
希望在经过更多的磨合及历练之后,有一天我们可以和大家一起走的更远。
一个周末写下这些,对于在高效运维群的分享做背景和概要介绍应该足够了,其他更详细的内容和案例,我们本周四(16号)群里见,当然后续我们还会在各地组织蓝鲸沙龙,和业界同行共同探讨应用运维(ARE)的发展方向。
----------------------------------------
另外一篇文章:解读腾讯云蓝鲸平台:运维效率提10倍很简单