在做教务系统的时候,一个学生(alumni_info)有多个教育经历(alumni_education),使用的数据库是mysql,之前使用左链接查询的,发现数据量才只有几万条时,查询就很慢了,早上想到用子查询in,感觉效率还不是很高,结果想到用exists,效率高了很多。由于是第一次在mysql中使用exists,百度了一番,现将自己的总结如下:
1、exists的返回结果是bool型,只有true或者false
如 SELECT * FROM alumni_info t WHERE EXISTS(SELECT a_id FROM alumni_education e WHERE e.a_id=\'6588\' ),返回的结果跟SELECT * FROM alumni_info t一样(a_id=6588存在),因为select语句先执行where条件后的语句,再筛选字段,当执行完where条件后,若这条结果集存在,则where表达式后面永远都是true,否则为false。也就是说要么查询所有,要么没有数据。那么我只想查校友id,为6588的校友,使用exists该怎么写,经过一番测试,内查询中的id,必须为外查询的id,即SELECT * FROM alumni_info t WHERE EXISTS(SELECT a_id FROM alumni_education e WHERE t.id_=\'6588\' ),ok,完事.
2、如果我想查询所有教育经历的校友,使用exists实现,当然用in实现也一样,不过效率低点
SELECT * FROM alumni_info t WHERE EXISTS(SELECT a_id FROM alumni_education e WHERE e.a_id=t.ID_ )
3、exists的效率比in查询要高,因为IN不走索引,但要看实际情况具体使用,IN适合于外表数据量大而内表数据小的情况;EXISTS适合于外表小而内表大的情况
4、exists与not exists是想对应的。
这条语句适用于a表比b表大的情况
select * from ecs_goods a where cat_id in(select cat_id from ecs_category);
这条语句适用于b表比a表大的情况
select * from ecs_goods a where EXISTS(select cat_id from ecs_category b where a.cat_id = b.cat_id);
在MySQL中 EXISTS 和 IN 的用法有什么关系和区别呢?
假定数据库中有两个表 分别为 表 a 和表 b
create table a
(
a_id int,
a_name varchar(20)
)
create table b
(
b_id int,
b_name varchar(20)
)
那么
select * from a where a_name in (select b_name from b)
这条SQL语句的意义很明显是选取满足where条件下 a 中的所有列的数据 。而where条件就是a_name要是所有b_name的其中的一个。
即 假设 b 中的 b_name 有 {\'john\',\'peter\',\'baron\'} 这些,而a中的某条数据中的a_name恰好是其中一个,那么这行数据就会被选取出来。
而使用EXISTS:
select * from a where exists (select b_id from b where b.b_name=a.a_name)
执行的结果与上面使用 in 返回的结果是一样的。
那么为什么会这样呢,子查询中 返回的列是 b_id ,并没有 name啊。
原因就是exists子句返回的结果并不是从数据库中取出的结果集,而是一个布尔值,如果子句查询到数据,那么返回true,反之返回false。
所以子句中选择的列根本就不重要,而重要的是where 后的条件。如果返回了true,那么相当于直接执行了子句 where 后的部分,即把
a_name 和 b_name 作比较,如果相等则返回这条数据。所以执行的结果和前面使用 in 的返回的结果是一致的。
有趣的是,MySQL内部优化器会把第一条使用 in 的语句转化为第二条使用 exists 的语句执行。执行的结果当然就是一样的了。