结合TKE提供的全套弹性伸缩解决方案: HPA/VPA + Cluster Autoscaler, 自动释放闲置资源,即可利用弹性能力进一步助力成本缩减。
使用成本控制系统的最佳实践文章最后,通过沉淀我们在服务不同行业场景客户的实战经验,我们给出了一些使用本系统以及竞价实例的最佳实践。
从业务场景来看,如果您的业务是无状态业务,比如可横向伸缩的Web站点服务、图像渲染、大数据分析、并行计算、强化学习、AI等,都非常适合使用这套成本控制系统。
此外,我们有一些Tips供您参考,以获得更佳的使用体验:
● 长时间作业拆成细粒度的作业,减少被中断可能性(结合容器场景下的Workload能力)
● 强化学习场景
● 利用Kubernetes原生的Service能力,配合负载均衡,保障业务的高可用。
● 通过合理配置Spot-controller中的不同资源配比,保证负载均衡后端资源的稳定供应。
● 通过tke-spot-agent 监听竞价实例中断情况,优雅终止并迁移业务副本。
● 将计算中间结果放到 COS/CFS/NAS 等持久存储产品上。
● 通过tke-spot-agent 监听竞价实例中断情况,在应用(Pod)中定义优雅退出钩子,保存中间计算结果。
● 定义应用(Pod)中定义启动钩子,当新业务副本成功启动后自动从持久存储中拉取中间结果,继续计算。
当前TKE已经通过节点池集成了竞价实例,您可以直接通过TKE直接创建竞价实例节点池。详细可查看创建节点池。并且可以通过TKE应用市场部署上述Spot Agent应用助力业务优雅终止和平滑迁移。
同时弹性容器服务EKS即将推出竞价类型Pod, 届时您也可以通过弹性容器服务使用更低成本的计算资源。
多数企业上云核心目的之一就是降低成本, 且容器化让成本具备了非常大的优化空间,而真正降低成本需要深度利用云和容器化的弹性能力, 并且容器能够让弹性和稳定性得到了权衡。 腾讯云容器团队将陆续提供上述成本控制系统套件, 如您有任何建议或诉求,请关注微信公众号【腾讯云原生】找到我们。
参考资料竞价实例: https://cloud.tencent.com/document/product/213/17816
创建节点池:https://cloud.tencent.com/document/product/457/43735