前言
都知道事务的可重复读级别实现原理是使用MVCC实现的,那么你对MVCC的底层实现原理知道多少呢?面试高频点,你值得拥有。
一、MVCC到底是什么?MVCC即多版本控制器,其特点就是在同一时间,不同事务可以读取到不同版本的数据,从而去解决脏读和不可重复读的问题。
在这里插入图片描述这样的解释你看了不下几十遍了吧!但是你真的理解什么是多版本控制器吗?
生活案例:搬家
最近小Q跟自己的女朋友搬到新家,由于出小区的时候需要支付当月的物业费。
于是小Q跟自己的女朋友同时登录了小区提供的物业缴费系统。
悲观并发控制
假设小Q正在查当月需要缴纳的费用是多少进行支付的时候,此时小Q查询的这条数据是已经被锁定的。
那么小Q女朋友是无法访问该数据的,直至小Q支付完成或者退出系统将悲观锁释放,小Q的女朋友才可以查询到数据。
悲观锁保证在同一时间只能有一个线程访问,默认数据在访问的时候会产生冲突,然后在整个过程都加上了锁。
这样的系统对于用户来说就是毫无体验感,如果多个人同时需要访问一条信息,只能在一台设备上看喽!
乐观并发控制
在小Q查看物业费欠费情况,并且支付的同时,小Q的女朋友也可以访问到该数据。
乐观锁认为即使在并发环境下,也不会产生冲突问题,所以不会去做加锁操作。
而是在数据提交的时候进行检测,如果发现有冲突则返回冲突信息。
小结
Innodb的MVCC机制就是乐观锁的一种体现,读不加锁,读写不冲突,在不加锁的情况下能让多个事务进行并发读写,并且解决读写冲突问题,极大的提高系统的并发性
二、悲观锁、乐观锁锁按照粒度分为表锁、行锁、页锁。
按照使用方式分为共享锁、排它锁。
根据思想分为乐观锁、悲观锁。
无论是乐观锁、悲观锁都只是一种思想而已,并不是实际的锁机制,这点一定要清楚。
1. 悲观锁(悲观并发控制)悲观锁实际为悲观并发控制,缩写PCC。
悲观锁持消极态度,认为每一次访问数据时,总是会发生冲突,因此,每次访问必须先锁住数据,完成访问后在释放锁。
保证在同一时间只有单个线程可以访问,实现数据的排它性。同时悲观锁使用数据库自身的锁机制实现,可以解决读-写,写-写的冲突。
那么在什么场景下可以使用悲观锁呢!
悲观锁适用于在写多读少的并发环境下使用,虽然并发效率不高,但是保证了数据的安全性。
2. 乐观锁(乐观并发控制)跟悲观锁一样,乐观锁实际为乐观并发控制,缩写为OCC。
乐观锁相对于悲观锁而言,认为即使在并发环境下,外界对数据的操作不会产生冲突,所以不会去加锁,而是会在提交更新的时候才会正式的对数据冲突与否进行检测。
如果发现冲突,要么再重试一次,要么切换为悲观的策略。
乐观并发控制要解决的是数据库并发场景下的写-写冲突,指用无锁的方式去解决
三、MVCC解决了哪些问题在事务并发的情况下会产生以下问题。
脏读:读取其它事务未提交的数据。
不可重复读:一个事务在读取一条数据时,由于另一个事务修改了这条数据并且提交事务,再次读取时导致数据不一致
幻读:一个事务读取了某个范围的数据,同时另一个事务新增了这个范围的数据,再次读取发现俩次得到的结果不一致。
MVCC在Innodb存储引擎的实现主要是为了提高数据库并发能力,用更好的方式去处理读--写冲突,同时做到不加锁、非阻塞并发读写。
mvcc可以解决脏读,不可重复读,mvcc使用快照读解决了部分幻读问题,但是在修改时还是使用当前读,所以还是存在幻读问题,幻读问题最终就是使用间隙锁解决。
四、当前读、快照读在了解MVCC是如何解决事务并发带来的问题之前,需要先明白俩个概念,当前读、快照读。
1. 当前读给读操作加上共享锁、排它锁,DML操作加上排它锁,这些操作就是当前读。
共享锁、排它锁也被称之为读锁、写锁。
共享锁与共享锁是共存的,但是要修改、添加、删除时,必须等到共享锁释放才可进行操作。
因为在Innodb存储引擎中,DML操作都会隐式添加排它锁。
所以说当前读所读取的记录就是最新的记录,读取数据时加上锁,保证其它事务不能修改当前记录。
2. 快照读如果你看到这里就默认你对隔离级别有一定的了解哈!
快照读的前提是隔离级别不是串行级别,串行级别的快照读会退化成当前读。
快照读的出现旨在提高事务并发性,其实现基于本文的主角MVCC即多版本控制器。
MVCC可以认为是行锁的一个变种,但是它在很多情况下避免了加锁操作。
所以说快照读的数据有可能不是最新的,而是之前版本的数据。
为什么要提到快照读呢!因为read-view就是通过快照读生成的,为了防止后文概念模糊,所以在这里进行说明。
3. 如何区分当前读、快照读不加锁的简单的select都属于快照读。
select id name user where id = 1;与之对应的则是当前读,给select加上共享锁、排它锁。
select id name from user where id = 1 lock in share mode;select id name from user where id = 1 for update;
五、MVCC实现三大要素
终于来到本文最重要的部分,前边的叙述都是为了给原理这一块做铺垫。
在这之前需要知道MVCC只在REPEATABLE READ(可重复读) 和 READ COMMITTED(已读提交)这俩种隔离级别下适用。
MVCC实现原理是由俩个隐式字段、undo日志、Read view来实现的。
1. 隐式字段在Innodb存储引擎中,在有聚簇索引的情况下每一行记录中都会隐藏俩个字段,如果没有聚簇索引则还有一个6byte的隐藏主键。
这俩个隐藏列一个记录的是何时被创建的,一个记录的是什么时候被删除。
这里不要理解为是记录的是时间,存储的是事务ID。
俩个隐式字段为DB_TRX_ID,DB_ROLL_PTR,没有聚簇索引还会有DB_ROW_ID这个字段。
DB_TRX_ID:记录创建这条数据上次修改它的事务 ID