MySQL普通索引和唯一索引的深入讲解

凤朝飞

2019-04-17

关注关注

场景

1、维护一个市民系统，有一个字段为身份证号

2、业务代码能保证不会写入两个重复的身份证号（如果业务无法保证，可以依赖数据库的唯一索引来进行约束）

3、常用SQL查询语句：SELECT name FROM CUser WHERE id_card = 'XXX'

4、建立索引

身份证号比较大，不建议设置为主键
从性能角度出发，选择普通索引还是唯一索引？

假设字段k上的值都不重复

MySQL普通索引和唯一索引的深入讲解

查询过程

1、查询语句：SELECT id FROM T WHERE k=5

2、查询过程

通过B+树从树根开始，按层搜索到叶子节点，即上图中右下角的数据页
在数据页内部通过二分法来定位具体的记录

3、针对普通索引

查找满足条件的第一个记录(5,500)，然后查找下一个记录，直到找到第一个不满足k=5的记录

4、针对唯一索引

由于索引定义了唯一性，查找到第一个满足条件的记录后，就会停止继续查找

性能差异

1、性能差异：微乎其微

2、InnoDB的数据是按照数据页为单位进行读写的，默认为16KB

3、当需要读取一条记录时，并不是将这个记录本身从磁盘读出来，而是以数据页为单位进行读取的

4、当找到k=5的记录时，它所在的数据页都已经在内存里了

5、对于普通索引而言，只需要多一次指针寻找和多一次计算 C CPU消耗很低

如果k=5这个记录恰好是所在数据页的最后一个记录，那么如果要取下一个记录，就需要读取下一个数据页
概率很低：对于整型字段索引，一个数据页（16KB，compact格式）可以存放大概745个值

change buffer

1、当需要更新一个数据页时，如果数据页在内存中就直接更新

2、如果这个数据页不在内存中，在不影响数据一致性的前提下

InnoDB会将这些更新操作缓存在change buffer
不需要从磁盘读入这个数据页（随机读）
在下次查询需要访问这个数据页的时候，将数据页读入内存
然后执行change buffer中与这个数据页有关的操作（merge）

3、change buffer是可以持久化的数据，在内存中有拷贝，也会被写入到磁盘上

4、将更新操作先记录在channge buffer，减少随机读磁盘，提升语句的执行速度

5、另外数据页读入内存需要占用buffer pool，使用channge buffer能避免占用内存，提高内存利用率

6、change buffer用到是buffer pool里的内存，不能无限增大，控制参数innodb_change_buffer_max_size

# 默认25，最大50
mysql> SHOW VARIABLES LIKE '%innodb_change_buffer_max_size%';
+-------------------------------+-------+
| Variable_name   | Value |
+-------------------------------+-------+
| innodb_change_buffer_max_size | 25 |
+-------------------------------+-------+

merge

1、merge：将change buffer中的操作应用到原数据页

2、merge的执行过程

从磁盘读入数据页到内存（老版本的数据页）
从change buffer里找出这个数据页的change buffer记录（可能多个）
然后依次执行，得到新版本的数据页
写入redolog，包含内容：数据页的表更+change buffer的变更

3、merge执行完后，内存中的数据页和change buffer所对应的磁盘页都还没修改，属于脏页

通过其他机制，脏页会被刷新到对应的物理磁盘页

4、触发时机

访问这个数据页
系统后台线程定期merge
数据库正常关闭

使用条件

1、对于唯一索引来说，所有的更新操作需要先判断这个操作是否违反唯一性约束

2、唯一索引的更新无法使用change buffer，只有普通索引可以使用change buffer

主键也是无法使用change buffer的
例如要插入(4,400)，必须先判断表中是否存在k=4的记录，这个判断的前提是将数据页读入内存
既然数据页已经读入到了内存，直接更新内存中的数据页就好，无需再写change buffer

使用场景

1、一个数据页在merge之前，change buffer记录关于这个数据页的变更越多，收益越大

2、对于写多读少的业务，页面在写完后马上被访问的概率极低，此时change buffer的使用效果最好

例如账单类、日志类的系统

3、如果一个业务的更新模式为：写入之后马上会做查询

虽然更新操作被记录到change buffer，但之后马上查询，又会从磁盘读取数据页，触发merge过程
没有减少随机读，反而增加了维护change buffer的代价

更新过程

插入(4,400)

目标页在内存中

对于唯一索引来说，找到3~5之间的位置，判断没有冲突，插入这个值
对于普通索引来说，找到3~5之间的位置，插入这个值
性能差异：微乎其微

目标页不在内存中

1、对于唯一索引来说，需要将数据页读入内存，判断没有冲突，插入这个值

磁盘随机读，成本很高

对于普通索引来说，将更新操作记录在change buffer即可

减少了磁盘随机读，性能提升明显

索引选择

1、普通索引与唯一索引，在查询性能上并没有太大差异，主要考虑的是更新性能，推荐选择普通索引

2、建议关闭change buffer的场景

如果所有的更新后面，都伴随着对这个记录的查询
控制参数innodb_change_buffering

mysql> SHOW VARIABLES LIKE '%innodb_change_buffering%';
+-------------------------+-------+
| Variable_name   | Value |
+-------------------------+-------+
| innodb_change_buffering | all |
+-------------------------+-------+

# Valid Values (>= 5.5.4)
none / inserts / deletes / changes / purges / all

# Valid Values (<= 5.5.3)
none / inserts

# change buffer的前身是insert buffer，只能对insert操作进行优化

change buffer + redolog

更新过程

当前k树的状态：找到对应的位置后，k1所在的数据页Page 1在内存中，k2所在的数据页Page 2不在内存中

INSERT INTO t(id,k) VALUES (id1,k1),(id2,k2);

MySQL普通索引和唯一索引的深入讲解

# 内存：buffer pool
# redolog：ib_logfileX
# 数据表空间：t.ibd
# 系统表空间：ibdata1

1、Page 1在内存中，直接更新内存

2、Page 2不在内存中，在changer buffer中记录：add (id2,k2) to Page 2

3、上述两个动作计入redolog（磁盘顺序写）

4、至此事务完成，执行更新语句的成本很低

写两次内存+一次磁盘

5、由于在事务提交时，会把change buffer的操作记录也记录到redolog

因此可以在崩溃恢复时，恢复change buffer

虚线为后台操作，不影响更新操作的响应时间

读过程

假设：读语句发生在更新语句后不久，内存中的数据都还在，与系统表空间（ibdata1）和redolog（ib_logfileX）无关

SELECT * FROM t WHERE k IN (k1,k2);

MySQL普通索引和唯一索引的深入讲解

1、读Page 1，直接从内存返回（此时Page 1有可能还是脏页，并未真正落盘）

2、读Page 2，通过磁盘随机读将数据页读入内存，然后应用change buffer里面的操作日志（merge）

生成一个正确的版本并返回

提升更新性能

1、redolog：节省随机写磁盘的IO消耗（顺序写）

2、change buffer：节省随机读磁盘的IO消耗

参考资料

《MySQL实战45讲》

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对安科网的支持。

唯一索引 mysql 索引 mysql索引 ul

凤朝飞

0 关注 0 粉丝 0 动态

关注关注

唯一索引和普通索引怎么选择

前段时间还在忙，终于又出点空更新了，虽然不是所有的付出都有收获，很多时候需要我们先付出才可以看到希望。这时候，如果来了一个查询动作，刚好要查这条数据的情况下，Mysql 会从磁盘上读取这个数据页，然后发现 change buffer 有修改了这个数据页，会

gululululu 2020-05-21

MySQL基础之?表连接、约束、外键、分组、分页、排序、唯一索引

　　　　tinyint 255　　　　int 65535　　　　bigint 42亿　　　　decimal 十进制小数，实际是字符串保存，有精度的小数。　　　　float 浮点型保留有限位小数　　　　double 双精度保留双倍有限位小数。　　　　ch

mycosmos 2020-01-11

MySQL索引与事务详解

上一章我们讲解了MySQL的手工编译安装流程以及相关的数据库操作命令，本文将要详细介绍MySQL索引与事务的概念及原理，并初步了解MySQL数据库视图概念，简述数据库的存储过程。从专业术语上解释其含义就是“代表记录的引用指针”。加快查询速度，提高工作效率；

adsadadaddadasda 2020-01-07

Mysql唯一索引线上故障记录

Mysql插入一条数据时，未指定自增键的值却报错：自增键重复，无法插入！`id` int NOT NULL COMMENT '主键',`name` varchar CHARACTER SET utf8mb4 COLLATE utf8mb4_general_

cyhgogogo 2020-01-06

MongoDB指南---13、索引类型、索引管理

上一篇文章：MongoDB指南---12、使用explain()和hint()、何时不应该使用索引下一篇文章：MongoDB指南---14、特殊的索引和集合：固定集合、TTL索引、全文本索引。创建索引时可以指定一些选项，使用不同选项建立的索引会有不同的行为

mjperhuo 2019-11-17

MySQL 创建唯一索引忽略对已经重复数据的检查

azhou 2019-11-01

MySQL批量插入与唯一索引问题解决

在开发项目时，因为有一些旧系统的基础数据需要提前导入，所以我在导入时做了批量导入操作 ,但是因为MySQL中的一次可接受的SQL语句大小受限制所以我每次批量虽然只有500条，但依然无法插入，这个时候代码报错如下：。You can change this v

shouen 2019-04-02

MySQL批量插入和唯一索引问题的解决方法

飞轩亭 2019-09-03

Solr DataImport数据和实际数据相差很多【uniqueKey】

今天将 oracle 数据库中的一份表 235万条数据 dataImport 进 solr4.4 进行索引。solr提示数据全部导入成功，但是query时候只有 70万条数据。一直傻傻的闷了半天。。。。。。原来是 schema.xml 的<uniq

wenchanter 2013-08-09

sql修改索引上字段长度报错

使用ALTER TABLE uc_users MODIFY user_id varchar NOT NULL;其实，问题不是重复key的原因，主要是因为我多加了一个NOT NULL，因为该字段里有空值，所以会报错

bowei0 2013-05-08

你真的了解SQL的索引吗？

最近突然想起前一阵和一朋友的聊天，当时他问我的问题是一个非常普通的问题：说说SQL聚集索引和非聚集索引的区别。聚集索引一个表只能有一个，而非聚集索引一个表可以存在多个，这个跟没问题没差别，一般人都知道。聚集索引存储记录是物理上连续存在，而非聚集索引是逻辑上

zry 2012-05-31

Spring data mongodb 唯一索引（@Indexed）单元测试注意事项

}而Spring data mongodb 只会执行一次createIndex操作一旦已经执行过了之后就不会再执行了于是之后的测试方法执行的时候 collection是没有索引存在的故会报错

wangxingg 2019-07-01

关于MongoDB唯一索引(Unique)的那些事

关于什么是索引以及唯一索引这里就不做说明了，不清楚的可以自行谷歌或者百度。是什么引起我写这篇文章呢，这来自于之前项目中的一个问题。我们用的是MongoDB数据存储用户信息，用户表中曾经用户注册是通过手机号注册的，所以很理所当然的给手机号加上了唯一索引，这是

tanyhuan 2019-06-30

MySQL死锁套路之唯一索引下批量插入顺序不一致

死锁的本质是资源竞争，批量插入如果顺序不一致很容易导致死锁，我们来分析一下这个情况。为了方便演示，把批量插入改写为了多条 insert。t1 t2 begin; begin; insert ignor

zbz0 2019-06-13

SQLServer之创建唯一非聚集索引

在创建 PRIMARY KEY 约束时，如果不存在该表的聚集索引且未指定唯一非聚集索引，则将自动对一列或多列创建唯一聚集索引。主键列不允许空值。在创建 UNIQUE 约束时，默认情况下将创建唯一非聚集索引，以便强制 UNIQUE 约束。有关详细信息，请参阅

Supercell 2019-06-28

hibernate 注解一对多唯一索引

今天被hibernate和mysql整了一下，切身感受到索引的重要性。如果没有这句，则数据库中生成的库表user_followby中，其followby_id 字段会建立相应的唯一索引，然而，这样很有可能会导致元素无法插入。当“user_followby”

cnzou 2011-04-16

通过唯一索引S锁与X锁来了解MySQL死锁套路

在初学者从源码理解MySQL死锁问题中介绍了使用调试 MySQL 源码的方式来查看死锁的过程，这篇文章来讲讲一个常见的案例。这次我们讲一段唯一索引 S 锁与 X 锁的爱恨情仇。update t1 set level = 1 where name = &qu

hejunbinfendou 2019-05-22

MySQL Infobright-数据仓库笔记[转]

BRIGHTHOUSE存储引擎建表时不能有AUTO_INCREMENT自增、unsigned无符号、unique唯一、主键PRIMARYKEY、索引KEY

蚂蚁爱吃糖 2011-09-26

旧数据库王者--SQL Server索引的原理深入解析

概述学数据库一定要对其中索引是怎么设计去做个探讨，由一个点逐步深入学习，下面以索引为入口探讨下sqlserver数据库。书中的目录是一个字词以及各字词所在的页码列表，数据库中的索引是表中的值以及各值存储位置的列表。所以合理的使用索引能加速数据的查询。但是索

zhuzhufxz 2019-05-27

Oracle最常用的B树索引的5种访问方法

今天我们讨论下Oracle数据库中最常用的B树索引，首先我们先来看一下Oracle数据库里B树索引的结构。从图中我们可以看出，Oracle数据库里的B树索引就好像一颗倒长的树，它包含两种类型的数据块。对于唯一性B树索引而言，ROWID是存储在索引行的行头，

lirenkai000 2015-04-13

MySQL普通索引和唯一索引的深入讲解

相关推荐