懵了!女朋友突然问我MVCC实现原理

前言

都知道事务的可重复读级别实现原理是使用MVCC实现的,那么你对MVCC的底层实现原理知道多少呢?面试高频点,你值得拥有。

一、MVCC到底是什么?

MVCC即多版本控制器,其特点就是在同一时间,不同事务可以读取到不同版本的数据,从而去解决脏读和不可重复读的问题。

在这里插入图片描述

在这里插入图片描述

这样的解释你看了不下几十遍了吧!但是你真的理解什么是多版本控制器吗?

生活案例:搬家

最近小Q跟自己的女朋友搬到新家,由于出小区的时候需要支付当月的物业费。

于是小Q跟自己的女朋友同时登录了小区提供的物业缴费系统。

悲观并发控制

假设小Q正在查当月需要缴纳的费用是多少进行支付的时候,此时小Q查询的这条数据是已经被锁定的。

那么小Q女朋友是无法访问该数据的,直至小Q支付完成或者退出系统将悲观锁释放,小Q的女朋友才可以查询到数据。

悲观锁保证在同一时间只能有一个线程访问,默认数据在访问的时候会产生冲突,然后在整个过程都加上了锁。

这样的系统对于用户来说就是毫无体验感,如果多个人同时需要访问一条信息,只能在一台设备上看喽!

乐观并发控制

在小Q查看物业费欠费情况,并且支付的同时,小Q的女朋友也可以访问到该数据。

乐观锁认为即使在并发环境下,也不会产生冲突问题,所以不会去做加锁操作。

而是在数据提交的时候进行检测,如果发现有冲突则返回冲突信息。

小结

Innodb的MVCC机制就是乐观锁的一种体现,读不加锁,读写不冲突,在不加锁的情况下能让多个事务进行并发读写,并且解决读写冲突问题,极大的提高系统的并发性

二、悲观锁、乐观锁

锁按照粒度分为表锁、行锁、页锁。

按照使用方式分为共享锁、排它锁。

根据思想分为乐观锁、悲观锁。

无论是乐观锁、悲观锁都只是一种思想而已,并不是实际的锁机制,这点一定要清楚。

1. 悲观锁(悲观并发控制)

悲观锁实际为悲观并发控制,缩写PCC。

悲观锁持消极态度,认为每一次访问数据时,总是会发生冲突,因此,每次访问必须先锁住数据,完成访问后在释放锁。

保证在同一时间只有单个线程可以访问,实现数据的排它性。同时悲观锁使用数据库自身的锁机制实现,可以解决读-写,写-写的冲突。

那么在什么场景下可以使用悲观锁呢!

悲观锁适用于在写多读少的并发环境下使用,虽然并发效率不高,但是保证了数据的安全性。

2. 乐观锁(乐观并发控制)

跟悲观锁一样,乐观锁实际为乐观并发控制,缩写为OCC。

乐观锁相对于悲观锁而言,认为即使在并发环境下,外界对数据的操作不会产生冲突,所以不会去加锁,而是会在提交更新的时候才会正式的对数据冲突与否进行检测。

如果发现冲突,要么再重试一次,要么切换为悲观的策略。

乐观并发控制要解决的是数据库并发场景下的写-写冲突,指用无锁的方式去解决

三、MVCC解决了哪些问题

在事务并发的情况下会产生以下问题。

脏读:读取其它事务未提交的数据。

不可重复读:一个事务在读取一条数据时,由于另一个事务修改了这条数据并且提交事务,再次读取时导致数据不一致

幻读:一个事务读取了某个范围的数据,同时另一个事务新增了这个范围的数据,再次读取发现俩次得到的结果不一致。

MVCC在Innodb存储引擎的实现主要是为了提高数据库并发能力,用更好的方式去处理读--写冲突,同时做到不加锁、非阻塞并发读写。

mvcc可以解决脏读,不可重复读,mvcc使用快照读解决了部分幻读问题,但是在修改时还是使用当前读,所以还是存在幻读问题,幻读问题最终就是使用间隙锁解决。

四、当前读、快照读

在了解MVCC是如何解决事务并发带来的问题之前,需要先明白俩个概念,当前读、快照读。

1. 当前读

给读操作加上共享锁、排它锁,DML操作加上排它锁,这些操作就是当前读。

共享锁、排它锁也被称之为读锁、写锁。

共享锁与共享锁是共存的,但是要修改、添加、删除时,必须等到共享锁释放才可进行操作。

因为在Innodb存储引擎中,DML操作都会隐式添加排它锁。

所以说当前读所读取的记录就是最新的记录,读取数据时加上锁,保证其它事务不能修改当前记录。

2. 快照读

如果你看到这里就默认你对隔离级别有一定的了解哈!

快照读的前提是隔离级别不是串行级别,串行级别的快照读会退化成当前读。

快照读的出现旨在提高事务并发性,其实现基于本文的主角MVCC即多版本控制器。

MVCC可以认为是行锁的一个变种,但是它在很多情况下避免了加锁操作。

所以说快照读的数据有可能不是最新的,而是之前版本的数据。

为什么要提到快照读呢!因为read-view就是通过快照读生成的,为了防止后文概念模糊,所以在这里进行说明。

3. 如何区分当前读、快照读

不加锁的简单的select都属于快照读。

select id name user where id = 1;

与之对应的则是当前读,给select加上共享锁、排它锁。

select id name from user where id = 1 lock in share mode;

select id name from user where id = 1 for update;
五、MVCC实现三大要素

终于来到本文最重要的部分,前边的叙述都是为了给原理这一块做铺垫。

在这之前需要知道MVCC只在REPEATABLE READ(可重复读) 和 READ COMMITTED(已读提交)这俩种隔离级别下适用。

MVCC实现原理是由俩个隐式字段、undo日志、Read view来实现的。

1. 隐式字段

在Innodb存储引擎中,在有聚簇索引的情况下每一行记录中都会隐藏俩个字段,如果没有聚簇索引则还有一个6byte的隐藏主键。

这俩个隐藏列一个记录的是何时被创建的,一个记录的是什么时候被删除。

这里不要理解为是记录的是时间,存储的是事务ID。

俩个隐式字段为DB_TRX_ID,DB_ROLL_PTR,没有聚簇索引还会有DB_ROW_ID这个字段。

DB_TRX_ID:记录创建这条数据上次修改它的事务 ID

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wsfjpw.html