MVCC的机制
MVCC是行锁的一种变种,但是他在很多情况下避免了加锁的操作,因此开销更低。不同数据库的实现机制不同,但大都实现了非阻塞的读操作,写操作也只能锁定必要的行。
不仅是MySQL、包括Oracle、PostgresSQl等其他数据库都实现了MVCC,但各自的实现机制不尽相同,因为MVCC没有一个统一的实现标准。
MVCC的实现,是通过保存数据在某个时间点的快照来实现的。也就是说,不管需要执行多长时间,每个事务看到的数据都是一致的。根据事务开始的时间不同,每个事务对同一张表,同一时刻看到的数据可能是不一样的。
InnoDB的MVCC,是通过在每行记录后面保存两个隐藏的列来实现。这两个列一个保存行的创建时间,一个保存行的过期时间(删除时间)。当然存储的并不是实际的时间,而是系统版本号。没开始一个新的事务,系统版本号都会自动递增,事务开始时刻的系统版本号会作为事务的版本号,用来和查询到的每行记录的版本号进行比较。下面的是REPEATABLE READ隔离级别下,MVCC具体是如何操作的。
Select
InnoDB会根据以下两个条件检查每行记录:
1、InnoDB只查找版本早于当前事务版本的数据行(行的版本号小于或等于事务的系统版本号),这样可以确保事务读取的行,要么是在事务开始前已经存在的,要么是事务自身插入或者修改过的。
2、行的删除版本要么未定义,要么大于当前事务版本号。这可以确保事务读取到的行,在事务开始之前未被删除。
INSERT
InnoDB为新插入的每一行保存当前系统版本号作为行版本号。
DELETE
InnoDB为删除的每一行保存当前系统版本号作为删除标识。
UPDATE
InnoDB为插入的一行新纪录,保存当前系统版本号作为行版本号,同时保存当前系统版本号到原来的行作为行删除标识。
保存这两个额外系统版本号,使大多数读操作都可以不用加锁。这样设计使得读数据操作很简单,性能很好,并且也能保证只读到符合标准的行。不足之处是每行记录都需要额外的存储空间,需要做更多的行检查工作。
MVCC只在REPEATABLE READ和READ COMMITE两个隔离级别下工作。其它的两个隔离级别都和MVCC不兼容。