(十四--十五)数据库查询优化Part I

日期：2021-05-06 栏目：程序人生浏览：次

如果理解的有问题。欢迎大家指出。这也是我在看课记得笔记。。可能会有很多问题

查询优化的重要性

请记住用户只会告诉DMBS他们想要什么样的结果，而不会告诉他们如何获得结果

不同的查询plan性能上会有非常大的差距。[比如之前的nested join 和 index join]

1. Heuristics / Rules策略

这一策略侧重于重构那些愚蠢的sql语句

注意这里的Logical Plan和Physical Plan是不同的

在第一个阶段我们会重写SQL语句。这里更多的是利用一些启发式的思维，比如列裁剪（过滤掉查询不需要使用到的列）、谓词下推（将过滤尽可能地下沉到数据源端）、常量累加（比如 1 + 2 这种事先计算好）以及常量替换（比如 SELECT * FROM table WHERE i = 5 AND j = i + 3 可以转换成 SELECT * FROM table WHERE i = 5 AND j = 8）等等。

后面会把引用格式转换成内部的标识符，然后构建语法树。至此我们的逻辑计划就大致构建完成。⚠️一个逻辑计划会对应许多的物理计划。

最后Optimizer的作用就是选择代价最小的物理计划。根据代价，将确定从逻辑计划到物理计划的选择

这里需要一点关系代数的只是。但是cmu数据库重点并不是放在这个上面。所以附上一个链接大家看看就好

物理查询的代价估计与选择

1.1 重写sql的优化-->谓词PushDown

这里用几个ppt里的例子看一下。这个操作对于查询的优化