基于Apache Hudi构建数据湖的典型应用场景介绍 (3)

日期：2021-11-07 栏目：程序人生浏览：次

在很多实时场景中，对时延要求可以是分钟级的，这样可以通过MRS-Hudi和实时计算引擎Flink和Spark-Streaming进行增量计算实现数据的快速处理，端到端实现分钟级延迟。另外MRS-Hudi本身就是湖存储，可以存储海量数据，因此也可以支持批量计算，常用的批处理引擎可以采用Hive和Spark。

方案价值：

数据统一存储，实时数据与批量数据共用相同的存储。

同时支持实时计算与批量计算。相同业务逻辑的处理结果复用。

满足分钟级延时的实时处理能力和海量的批量处理。

5. 总结

传统大数据由于不支持事务等痛点问题，造成T+1时延，虽然能够基于Flink流式计算实现少量数据在简单场景的秒级数据处理能力，但依然缺乏海量复杂场景的实时更新、事务支持能力。现在基于华为云FusionInsight MRS的Hudi可以构建分钟级数据处理方案，实现较大数据量的复杂计算实时处理能力，大大提升数据时效性，让数据价值近在眼前。

原文：华为云社区 https://bbs.huaweicloud.com/blogs/290866

转载注明出处：https://www.heiqu.com/zwwszs.html

基于Apache Hudi构建数据湖的典型应用场景介绍 (3)

相关推荐