SparkSQL执行时参数优化(2)

日期：2020-06-02 栏目：程序人生浏览：次

//3.executor能力
set spark.executor.memory; // executor用于缓存数据、代码执行的堆内存以及JVM运行时需要的内存
set spark.yarn.executor.memoryOverhead; //Spark运行还需要一些堆外内存，直接向系统申请，如数据传输时的netty等。
set spark.sql.windowExec.buffer.spill.threshold; //当用户的SQL中包含窗口函数时，并不会把一个窗口中的所有数据全部读进内存，而是维护一个缓存池，当池中的数据条数大于该参数表示的阈值时，spark将数据写到磁盘
set spark.executor.cores; //单个executor上可以同时运行的task数

Linux公社的RSS地址：https://www.linuxidc.com/rssFeed.aspx

共2页:
上一页
1
2
下一页

转载注明出处：https://www.heiqu.com/a0295f22c49f5a6e66d327e441b88663.html

SparkSQL执行时参数优化(2)

相关推荐