关于MYSQL Innodb 锁行还是锁表
关于mysql的锁行还是锁表,这个问题,今天算是有了一点头绪,mysql 中 innodb是锁行的,但是项目中居然出现了死锁,锁表的情况。为什么呢?先看一下这篇文章。
做项目时由于业务逻辑的需要,必须对数据表的一行或多行加入行锁,举个最简单的例子,图书借阅系统。假设 id=1 的这本书库存为 1 ,但是有 2 个人同时来借这本书,此处的逻辑为
Select restnum from book where id =1 ; -- 如果 restnum 大于 0 ,执行 update Update book set restnum=restnum-1 where id=1 ; Select restnum from book where id =1 ; -- 如果 restnum 大于 0 ,执行 update Update book set restnum=restnum-1 where id=1; |
问题就来了,当 2 个人同时来借的时候,有可能第一个人执行 select 语句的时候,第二个人插了进来,在第一个人没来得及更新 book 表的时候,第二个人查到数据了,其实是脏数据,因为第一个人会把 restnum 值减 1 ,因此第二个人本来应该是查到 id=1 的书 restnum 为 0 了,因此不会执行 update ,而会告诉它 id=1 的书没有库存了,可是数据库哪懂这些,数据库只负责执行一条条 SQL 语句,它才不管中间有没有其他 sql 语句插进来,它也不知道要把一个 session 的 sql 语句执行完再执行另一个 session 的。因此会导致并发的时候 restnum 最后的结果为 -1 ,显然这是不合理的,所以,才出现锁的概念, Mysql 使用 innodb 引擎可以通过索引对数据行加锁。以上借书的语句变为:
Begin ; Select restnum from book where id =1 for Update ; -- 给 id=1 的行加上排它锁且 id 有索引 Update book set restnum=restnum-1 where id=1 ; Commit ; Begin ; Select restnum from book where id =1 for Update ; -- 给 id=1 的行加上排它锁且 id 有索引 Update book set restnum=restnum-1 where id=1 ; Commit ; |
这样,第二个人执行到 select 语句的时候就会处于等待状态直到第一个人执行 commit 。从而保证了第二个人不会读到第一个人修改前的数据。
那这样是不是万无一失了呢,答案是否定的。看下面的例子。
跟我一步一步来,先建立表
CREATE TABLE `book` ( `id` int (11) NOT NULL auto_increment, `num` int (11) default NULL , ` name ` varchar (0) default NULL , PRIMARY KEY (`id`), KEY `asd` (`num`) ) ENGINE=InnoDB default CHARSET=gbk CREATE TABLE `book` ( `id` int (11) NOT NULL auto_increment, `num` int (11) default NULL , ` name ` varchar (0) default NULL , PRIMARY KEY (`id`), KEY `asd` (`num`) ) ENGINE=InnoDB default CHARSET=gbk |
其中 num 字段加了索引
然后插入数据,运行,
insert into book(num) values (11),(11),(11),(11),(11); insert into book(num) values (22),(22),(22),(22),(22); insert into book(num) values (11),(11),(11),(11),(11); insert into book(num) values (22),(22),(22),(22),(22); |
然后打开 2 个 mysql 控制台窗口,其实就是建立 2 个 session 做并发操作
********************************************************************
在第一个 session 里运行:
Begin ; Select * from book where num=11 for Update ; |
出现结果:
+ ----+-----+------+ | id | num | name | + ----+-----+------+ | 11 | 11 | NULL | | 12 | 11 | NULL | | 13 | 11 | NULL | | 14 | 11 | NULL | | 15 | 11 | NULL | + ----+-----+------+ 5 rows in set |
然后在第二个 session 里运行:
Begin ; Select * from book where num=22 for Update ; |
出现结果:
+ ----+-----+------+ | id | num | name | + ----+-----+------+ | 16 | 22 | NULL | | 17 | 22 | NULL | | 18 | 22 | NULL | | 19 | 22 | NULL | | 20 | 22 | NULL | + ----+-----+------+ 5 rows in set |
好了,到这里什么问题都没有,是吧,可是接下来问题就来了,大家请看:
回到第一个 session ,运行:
Update book set name = 'abc' where num=11; |
********************************************************************************************
问题来了, session 竟然处于等待状态 ,可是 num=11 的行不是被第一个 session 自己锁住的么,为什么不能更新呢?好了,打这里大家也许有自己的答案,先别急,再请看一下操作。
把 2 个 session 都关闭,然后运行:
delete from book where num=11 limit 3; delete from book where num=22 limit 3; delete from book where num=11 limit 3; delete from book where num=22 limit 3; |
其实就是把 num=11 和 22 的记录各删去 3 行,
然后重复 “***********************” 之间的操作
竟然发现,运行 update book set name='abc' where num=11; 后,有结果出现了,说明没有被锁住,
这是为什么呢,难道 2 行数据和 5 行数据,对 MySQL 来说,会产生锁行和锁表两种情况吗。经过跟网友讨论和翻阅资料,仔细分析后发现:
在以上实验数据作为测试数据的情况下,由于 num 字段重复率太高,只有 2 个值,分别是 11 和 12. 而数据量相对于这两个值来说却是比较大的,是 10 条, 5 倍的关系。
那么 mysql 在解释 sql 的时候,会忽略索引,因为它的优化器发现:即使使用了索引,还是要做全表扫描,故而放弃了索引,也就没有使用行锁,却使用了表锁。简单的讲,就是 MYSQL 无视了你的索引,它觉得与其行锁,还不如直接表锁,毕竟它觉得表锁所花的代价比行锁来的小。以上问题即便你使用了 force index 强制索引,结果还是一样,永远都是表锁。
所以 mysql 的行锁用起来并不是那么随心所欲的,必须要考虑索引。再看下面的例子。
Select id from items where id in ( Select id from items where id <6) for Update ; --id字段加了索引 Select id from items where id in (1,2,3,4,5) for Update ; Select id from items where id in ( Select id from items where id <6) for Update ; --id字段加了索引 Select id from items where id in (1,2,3,4,5) for Update ; |
大部分会认为结果一样没什么区别,其实差别大了,区别就是第一条 sql 语句会产生表锁,而第二个 sql 语句是行锁,为什么呢?因为第一个 sql 语句用了子查询外围查询故而没使用索引,导致表锁。
好了,回到借书的例子,由于 id 是唯一的,所以没什么问题,但是如果有些表出现了索引有重复值,并且 mysql 会强制使用表锁的情况,那怎么办呢?一般来说只有重新设计表结构和用新的 SQL 语句实现业务逻辑,但是其实上面借书的例子还有一种办法。请看下面代码:
set sql_mode= 'STRICT_TRANS_TABLES,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION' ; Begin ; Select restnum from book where id =1 ; -- 取消排它锁 , 设置 restnum 为 unsigned Update book set restnum=restnum-1 where id=1 ; If( Update 执行成功 ) Commit ; Else rollback ; set sql_mode= 'STRICT_TRANS_TABLES,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION' ; Begin ; Select restnum from book where id =1 ; -- 取消排它锁 , 设置 restnum 为 unsigned Update book set restnum=restnum-1 where id=1 ; If( Update 执行成功 ) Commit ; Else rollback ; |
上面是个小技巧,通过把数据库模式临时设置为严格模式,当 restnum 被更新为 -1 的时候,由于 restnum 是 unsigned 类型的,因此 update 会执行失败,无论第二个 session 做了什么数据库操作,都会被回滚,从而确保了数据的正确性,这个目的只是为了防止并发的时候极小概率出现的 2 个 session 的 sql 语句嵌套执行导致数据脏读。当然最好的办法还是修改表结构和 sql 语句,让 MYSQL 通过索引来加行锁, MySQL 测试版本为 5.0.75-log 和 5.1.36-community
所以,可以总结出。Mysql innodb虽是锁行的,但是如果没有索引,或者索引如上(有嵌套查询,建立索引的字段重复性太大远小于数据量),那就要锁表了。
mysql自动为主键建立索引
MySQL 5.1支持对MyISAM和MEMORY表进行表级锁定,对 BDB 表进行页级锁定,对InnoDB 表进行行级锁定。