Spark RDD深度解析-RDD计算流程 (4)

日期：2021-06-21 栏目：程序人生浏览：次

从对象产生的顺序看，先生成了HadoopRDD，调用两次map方法后依次产生两个MapPartitionsRDD；从执行的角度看，先执行最后一个RDD的compute方法，在计算过程中递归执行父RDD的compute，以生成对应RDD的数据；从数据加载角度看，第一个构造出来的RDD在执行compute时才会将数据载入内存（本例中为HDFS读入内存），然后在这些数据上执行用户传入的方法，依次生成子RDD的内存数据。

共4页:
上一页
1
2
3
4
下一页

转载注明出处：https://www.heiqu.com/zyzfwj.html

Spark RDD深度解析-RDD计算流程 (4)

相关推荐