以腾讯云为例,中心云通常指的是 IDC 机房,边缘云依次会是 ec、oc、mec 机房,现场设备一般位于数据源附近,比如:家庭网关、交通灯路口、港口/园区/矿山内部。
通常物联设备与边缘端设备之间的时延可以控制在 2 ms内,适合处理实时性要求极高的业务数据,比如工业控制类的业务。
与边缘云之间的时延可以控制在 10ms 内,可以满足实时音视频、ARVR、云游戏的业务场景。
这就是边缘计算的大致架构情况。
带来的挑战下面我们一起看一下边缘计算场景会带来哪些新挑战。
异构严重。在软硬件两方面都有体现,像中心云和边缘云通常采用x86和linux 标准发行版,而边缘资源由于需要考虑成本以及业务的特殊要求很可能是采用成本更便宜或者是定制化的软硬件方案。
规模庞大。根据各种权威机构预测,2025年全球物联设备数量会突破千亿,分布在全球各地。如何去管理这么大规模的设备也是一项很有挑战的任务
环境复杂。位于云机房的设备还好,很多终端设备常常位于恶劣的环境,你比如炼钢厂的很多设备长期处于高温环境、水利监测方面的设备部署环境往往都比较潮湿。设备网络环境也是各种各样,有线的、无线的,无线又有 WIFI、4G5G网络、zigbee等等。
标准不统一。很多地方还处于没有标准,或者是有很多标准但没有一种公认标准,尤其是在管理方式上极其不统一。
这些挑战带来的后果就是:
效率下降。包括研发测试、交付部署、升级运维等等
管理困难。规模很大,各方面环境很复杂,标准也很多,想要管好我们的资源也变得困难重重。
可靠性降低。边缘环境很恶劣,如何在恶劣的环境下保证服务质量也是一个难题
云边端一体化的意义边缘场景有如此多的挑战,带来的影响就是业务落地非常困难,这个问题直接阻碍了行业的发展。为了降低业务落地门槛,促进行业顺利发展,云边端一体化的就显得很有必要。
一体化体现在多个方面:
统一管理。首先,我们要把复杂多变底层资源管理方案统一起来,尽量减少业务对底层细节的不必要感知,比如硬件架构、操作系统、网络环境等等。其次是提供的管理能力要尽可能与中心云保持统一,比如监控告警、发布运维等等各种业务常用的基础能力。
云边协同。在边缘计算场景下,把业务从中心下沉到边缘是很自然的事情,但是还不够。通常都需要让边缘和云协同工作起来,比如:把边缘的有用数据收集到中心进行分析处理,然后继续反馈到边缘也是非常有必要的。以AI场景为例,我们可以把推理放到边缘进行,然后从边缘收集数据在中心进行训练,训练好的模型又下发到边缘。另外,云上的能力也需要形成联动,比如把边缘的有用数据收集上来,在云上做呈现和再加工。
资源调度。边缘计算场景下资源很分散,负载随着时空不同而差异很大,如何根据时空差异对资源做合理有效的调节,使资源使用达到最佳效果也是一件很有意义的事情。合理的资源调度可以让系统变得更高效、稳定、低成本。
超融合平台的使命上面我们一起探讨了边缘计算的挑战和云边端一体化的意义,腾讯云几年前就开始往这方面投入资源,经过多年沉淀逐步建设了囊括方方面面的超融合平台,接下来再和大家分享下腾讯云在超融合平台建设方面的实践。
在建设初期,大家思考得最多的问题就是什么是超融合平台,我们希望超融合平台给业务带来什么样的好处。经过长时间的摸索,我们确定了超融合平台的使命:让边缘资源像中心云资源一样容易管理。
简单来说就是,从平台层面屏蔽底层的复杂性,所有的基础能力尽可能与中心云对齐,从而让业务使用起来感受不到太多差异,业务方可以更加聚焦,把精力集中于具体业务研发,最终让所有的事情都变得简单高效。
如何达成这种效果 方向:
完全自研。从零开始,代价很高;不具有普适性,难以推广。
拥抱云原生。云原生是一种生态,囊括了方方面面的能力,我们可以基于这些能力,而不是重复造轮子,更聚焦于解决边缘场景的特殊性,达到事半功倍的效果。
方案:
使用原生 Kubernetes。并非针对边缘计算场景,直接在边缘使用会有一些问题。
魔改 Kubernetes。门槛高,代价大,兼容性问题不可忽视。
增强 Kubernetes。遵守 Kubernetes 标准,灵活,开放,学习成本低,使用起来容易。
TKE Edge