关于MYSQL Innodb 锁行还是锁表

关于mysql的锁行还是锁表,这个问题,今天算是有了一点头绪,mysql 中 innodb是锁行的,但是项目中居然出现了死锁,锁表的情况。为什么呢?先看一下这篇文章。

做项目时由于业务逻辑的需要,必须对数据表的一行或多行加入行锁,举个最简单的例子,图书借阅系统。假设 id=1 的这本书库存为 1 ,但是有 2 个人同时来借这本书,此处的逻辑为

Select   restnum from book where id =1 ;    
-- 如果 restnum 大于 0 ,执行 update 
Update   book set restnum=restnum-1 where id=1 ; 
Select   restnum from book where id =1 ;  
-- 如果 restnum 大于 0 ,执行 update
Update   book set restnum=restnum-1 where id=1;

问题就来了,当 2 个人同时来借的时候,有可能第一个人执行 select 语句的时候,第二个人插了进来,在第一个人没来得及更新 book 表的时候,第二个人查到数据了,其实是脏数据,因为第一个人会把 restnum 值减 1 ,因此第二个人本来应该是查到 id=1 的书 restnum 为 0 了,因此不会执行 update ,而会告诉它 id=1 的书没有库存了,可是数据库哪懂这些,数据库只负责执行一条条 SQL 语句,它才不管中间有没有其他 sql 语句插进来,它也不知道要把一个 session 的 sql 语句执行完再执行另一个 session 的。因此会导致并发的时候 restnum 最后的结果为 -1 ,显然这是不合理的,所以,才出现锁的概念, Mysql 使用 innodb 引擎可以通过索引对数据行加锁。以上借书的语句变为:

Begin
Select   restnum from book where id =1 for   Update 
-- 给 id=1 的行加上排它锁且 id 有索引 
Update   book set restnum=restnum-1 where id=1 ; 
Commit
Begin;
Select   restnum from book where id =1 for   Update ;
-- 给 id=1 的行加上排它锁且 id 有索引
Update   book set restnum=restnum-1 where id=1 ;
Commit;

这样,第二个人执行到 select 语句的时候就会处于等待状态直到第一个人执行 commit 。从而保证了第二个人不会读到第一个人修改前的数据。

那这样是不是万无一失了呢,答案是否定的。看下面的例子。

跟我一步一步来,先建立表

CREATE TABLE `book` (  
`id` int(11) NOT NULL auto_increment,  
`num` int(11) default NULL,  
`name` varchar(0) default NULL,  
PRIMARY KEY (`id`),  
KEY `asd` (`num`)  
) ENGINE=InnoDB default CHARSET=gbk 
CREATE TABLE `book` (
`id` int(11) NOT NULL auto_increment,
`num` int(11) default NULL,
`name` varchar(0) default NULL,
PRIMARY KEY (`id`),
KEY `asd` (`num`)
) ENGINE=InnoDB default CHARSET=gbk

其中 num 字段加了索引

然后插入数据,运行,

insert into book(num) values(11),(11),(11),(11),(11);  
insert into book(num) values(22),(22),(22),(22),(22); 
insert into book(num) values(11),(11),(11),(11),(11);
insert into book(num) values(22),(22),(22),(22),(22);


然后打开 2 个 mysql 控制台窗口,其实就是建立 2 个 session 做并发操作

********************************************************************
在第一个 session 里运行:

Begin;
Select * from book where num=11 for Update;

出现结果:

+----+-----+------+
| id | num | name |
+----+-----+------+
| 11 | 11 | NULL |
| 12 | 11 | NULL |
| 13 | 11 | NULL |
| 14 | 11 | NULL |
| 15 | 11 | NULL |
+----+-----+------+
5 rows in set

然后在第二个 session 里运行:

Begin;
Select * from book where num=22 for Update;

出现结果:

+----+-----+------+
| id | num | name |
+----+-----+------+
| 16 | 22 | NULL |
| 17 | 22 | NULL |
| 18 | 22 | NULL |
| 19 | 22 | NULL |
| 20 | 22 | NULL |
+----+-----+------+
5 rows in set

好了,到这里什么问题都没有,是吧,可是接下来问题就来了,大家请看:
回到第一个 session ,运行:

Update book set name='abc' where num=11;

********************************************************************************************
问题来了, session 竟然处于等待状态 ,可是 num=11 的行不是被第一个 session 自己锁住的么,为什么不能更新呢?好了,打这里大家也许有自己的答案,先别急,再请看一下操作。

把 2 个 session 都关闭,然后运行:

delete from book where num=11 limit 3;  
delete from book where num=22 limit 3; 
delete from book where num=11 limit 3;
delete from book where num=22 limit 3;

其实就是把 num=11 和 22 的记录各删去 3 行,
然后重复 “***********************” 之间的操作
竟然发现,运行 update book set name='abc' where num=11; 后,有结果出现了,说明没有被锁住,
这是为什么呢,难道 2 行数据和 5 行数据,对 MySQL 来说,会产生锁行和锁表两种情况吗。经过跟网友讨论和翻阅资料,仔细分析后发现:

在以上实验数据作为测试数据的情况下,由于 num 字段重复率太高,只有 2 个值,分别是 11 和 12. 而数据量相对于这两个值来说却是比较大的,是 10 条, 5 倍的关系。
那么 mysql 在解释 sql 的时候,会忽略索引,因为它的优化器发现:即使使用了索引,还是要做全表扫描,故而放弃了索引,也就没有使用行锁,却使用了表锁。简单的讲,就是 MYSQL 无视了你的索引,它觉得与其行锁,还不如直接表锁,毕竟它觉得表锁所花的代价比行锁来的小。以上问题即便你使用了 force index 强制索引,结果还是一样,永远都是表锁。

所以 mysql 的行锁用起来并不是那么随心所欲的,必须要考虑索引。再看下面的例子。

Select id from items where id in (Select id from items where id <6) for Update;   
--id字段加了索引 
Select id from items where id in (1,2,3,4,5) for Update;
Select id from items where id in (Select id from items where id <6) for Update;
--id字段加了索引
Select id from items where id in (1,2,3,4,5) for Update;

大部分会认为结果一样没什么区别,其实差别大了,区别就是第一条 sql 语句会产生表锁,而第二个 sql 语句是行锁,为什么呢?因为第一个 sql 语句用了子查询外围查询故而没使用索引,导致表锁。

好了,回到借书的例子,由于 id 是唯一的,所以没什么问题,但是如果有些表出现了索引有重复值,并且 mysql 会强制使用表锁的情况,那怎么办呢?一般来说只有重新设计表结构和用新的 SQL 语句实现业务逻辑,但是其实上面借书的例子还有一种办法。请看下面代码:

set   sql_mode= 
'STRICT_TRANS_TABLES,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION'
Begin
Select restnum from book where id =1   ; -- 取消排它锁 , 设置 restnum 为 unsigned 
Update   book set restnum=restnum-1 where id=1 ; 
If(Update 执行成功 ) Commit
Else   rollback
set   sql_mode=
'STRICT_TRANS_TABLES,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION';
Begin;
Select restnum from book where id =1   ; -- 取消排它锁 , 设置 restnum 为 unsigned
Update   book set restnum=restnum-1 where id=1 ;
If(Update 执行成功 ) Commit;
Else   rollback;


上面是个小技巧,通过把数据库模式临时设置为严格模式,当 restnum 被更新为 -1 的时候,由于 restnum 是 unsigned 类型的,因此 update 会执行失败,无论第二个 session 做了什么数据库操作,都会被回滚,从而确保了数据的正确性,这个目的只是为了防止并发的时候极小概率出现的 2 个 session 的 sql 语句嵌套执行导致数据脏读。当然最好的办法还是修改表结构和 sql 语句,让 MYSQL 通过索引来加行锁, MySQL 测试版本为 5.0.75-log 和 5.1.36-community

所以,可以总结出。Mysql innodb虽是锁行的,但是如果没有索引,或者索引如上(有嵌套查询,建立索引的字段重复性太大远小于数据量),那就要锁表了。

mysql自动为主键建立索引

MySQL 5.1支持对MyISAM和MEMORY表进行表级锁定,对 BDB 表进行页级锁定,对InnoDB 表进行行级锁定。