数据库sql优化总结之百万级数据库优化方案+案例分析

njstexcellence

2018-07-15

关注关注

项目背景

有三张百万级数据表

知识点表（ex_subject_point）9,316条数据

试题表（ex_question_junior）2,159,519条数据有45个字段

知识点试题关系表（ex_question_r_knowledge）3,156,155条数据

测试数据库为：mysql （5.7）

1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。

案例分析：

SELECT ex_question_junior.QUESTION_ID
FROM ex_question_junior
WHERE ex_question_junior.GRADE_ID=1

执行时间：17.609s （多次执行，在17s左右徘徊）

优化后：给GRADE_ID字段添加索引后

执行时间为：11.377s（多次执行，在11s左右徘徊）

备注：我们一般在什么字段上建索引？

这是一个非常复杂的话题，需要对业务及数据充分分析后再能得出结果。主键及外键通常都要有索引，其它需要建索引的字段应满足以下条件：

a、字段出现在查询条件中，并且查询条件可以使用索引；

b、语句执行频率高，一天会有几千次以上；

c、通过字段条件可筛选的记录集很小，那数据筛选比例是多少才适合？

这个没有固定值，需要根据表数据量来评估，以下是经验公式，可用于快速评估：

小表(记录数小于10000行的表)：筛选比例<10%；

大表：(筛选返回记录数)<(表总记录数*单条记录长度)/10000/16

单条记录长度≈字段平均内容长度之和+字段数*2

以下是一些字段是否需要建B-TREE索引的经验分类：

数据库sql优化总结之百万级数据库优化方案+案例分析

2、应尽量避免在 where 子句中对字段进行 null 值判断，否则将导致引擎放弃使用索引而进行全表扫描

select id from t where num is null

最好不要给数据库留NULL，尽可能的使用 NOT NULL填充数据库.

备注、描述、评论之类的可以设置为 NULL，其他的，最好不要使用NULL。

不要以为 NULL 不需要空间，比如：char(100) 型，在字段建立时，空间就固定了，不管是否插入值（NULL也包含在内），都是占用 100个字符的空间的，如果是varchar这样的变长字段， null 不占用空间。

可以在num上设置默认值0，确保表中num列没有null值，然后这样查询：

select id from t where num = 0

案例分析：

在mysql数据库中对字段进行null值判断，是不会放弃使用索引而进行全表扫描的。

SELECT ex_question_junior.QUESTION_ID
FROM ex_question_junior
WHERE IS_USE is NULL

执行时间是：11.729s

SELECT ex_question_junior.QUESTION_ID
FROM ex_question_junior
WHERE IS_USE =0

执行时间是12.253s

时间几乎一样。

3、应尽量避免在 where 子句中使用 != 或 <> 操作符，否则将引擎放弃使用索引而进行全表扫描。

案例分析：

在mysql数据库中where 子句中使用 != 或 <> 操作符，引擎不会放弃使用索引。

EXPLAIN
SELECT ex_question_junior.QUESTION_ID
FROM ex_question_junior
WHERE ex_question_junior.GRADE_ID !=15

数据库sql优化总结之百万级数据库优化方案+案例分析

执行时间是：17.579s

数据库sql优化总结之百万级数据库优化方案+案例分析

执行时间是：16.966s

4.应尽量避免在 where 子句中使用 or 来连接条件，如果一个字段有索引，一个字段没有索引，将导致引擎放弃使用索引而进行全表扫描

案例分析：

GRADE_ID字段有索引，QUESTION_TYPE没索引

数据库sql优化总结之百万级数据库优化方案+案例分析

执行时间是：11.661s

优化方案：

通过union all 方式，把有索引字段和非索引字段分开。索引字段就有效果了

数据库sql优化总结之百万级数据库优化方案+案例分析

执行时间是：11.811s

但是，非索引字段依然查询速度会很慢，所以查询条件，能加索引的尽量加索引

5.in 和 not in 也要慎用，否则会导致全表扫描

案例分析

注：在mysql数据库中where 子句中对索引字段使用 in 和 not in操作符，引擎不会放弃使用索引。

数据库sql优化总结之百万级数据库优化方案+案例分析

注：在mysql数据库中where 子句中对不是索引字段使用 in 和 not in操作符，会导致全表扫描。

数据库sql优化总结之百万级数据库优化方案+案例分析

案例分析2：

用between和in的区别

SELECT ex_question_junior.QUESTION_ID
FROM ex_question_junior
WHERE ex_question_junior.QUESTION_TYPE IN(1,2,3,4)

执行时间为1.082s

SELECT ex_question_junior.QUESTION_ID
FROM ex_question_junior
WHERE ex_question_junior.QUESTION_TYPE between 1 and 4

执行时间为0.924s

时间上是相差不多的

案例分析3：

用exists 和 in区别：结论1. in()适合B表比A表数据大的情况2. exists()适合B表比A表数据小的情况当A表数据与B表数据一样大时,in与exists效率差不多,可任选一个使用.语法

select * from A

where id in(select id from B)

ex_question_r_knowledge表数据量大，ex_subject_point表数据量小

****************************************************************************

SELECT *
FROM ex_question_r_knowledge
WHERE ex_question_r_knowledge.SUBJECT_POINT_ID IN
(
SELECT ex_subject_point.SUBJECT_POINT_ID
FROM ex_subject_point
WHERE ex_subject_point.SUBJECT_ID=7
)

SELECT *
FROM ex_question_r_knowledge
WHERE exists
(
SELECT 1
FROM ex_subject_point
WHERE ex_subject_point.SUBJECT_ID=7
AND ex_subject_point.SUBJECT_POINT_ID = ex_question_r_knowledge.SUBJECT_POINT_ID
)

SELECT *

FROM ex_question_r_knowledge

WHERE exists

(

SELECT 1

FROM ex_subject_point

WHERE ex_subject_point.SUBJECT_ID=7

AND ex_subject_point.SUBJECT_POINT_ID = ex_question_r_knowledge.SUBJECT_POINT_ID

)

执行时间是：13.537s

*************************************************************************

用in适合

SELECT *
FROM ex_subject_point
WHERE
ex_subject_point.SUBJECT_POINT_ID IN( SELECT
ex_question_r_knowledge.SUBJECT_POINT_ID FROM
ex_question_r_knowledge WHERE
ex_question_r_knowledge.GRADE_TYPE=2 )

SELECT * FROM ex_subject_point WHERE

ex_subject_point.SUBJECT_POINT_ID IN( SELECT

ex_question_r_knowledge.SUBJECT_POINT_ID FROM

ex_question_r_knowledge WHERE

ex_question_r_knowledge.GRADE_TYPE=2 )

执行时间是：1.554s

SELECT *

FROM ex_subject_point

WHERE exists(

SELECT ex_question_r_knowledge.SUBJECT_POINT_ID

FROM ex_question_r_knowledge

WHERE ex_question_r_knowledge.GRADE_TYPE=2

AND ex_question_r_knowledge.SUBJECT_POINT_ID= ex_subject_point.SUBJECT_POINT_ID

)

执行时间是：11.978s

6、like模糊全匹配也将导致全表扫描

案例分析

EXPLAIN
SELECT *
FROM ex_subject_point
WHERE ex_subject_point.path like "%/11/%"

数据库sql优化总结之百万级数据库优化方案+案例分析

若要提高效率，可以考虑全文检索。lucene了解一下。或者其他可以提供全文索引的nosql数据库，比如tt server或MongoDB

还会陆续更新，还有几个小节。

昨天晚上突发奇想，like 模糊全匹配，会导致全表扫描，那模糊后匹配和模糊前匹配也会是全表扫描吗？

今天开电脑，做了下测试。结果如下：

like模糊后匹配，不会导致全表扫描

like模糊前匹配，会导致全表扫描

MY SQL的原理就是这样的，LIKE模糊全匹配会导致索引失效，进行全表扫描；LIKE模糊前匹配也会导致索引失效，进行全表扫描；但是LIKE模糊后匹配，索引就会有效果。

限于本人水平，如果文章和代码有表述不当之处，还请不吝赐教。

sql优化 mysql索引优化数据库索引数据库优化 select sql数据库

njstexcellence

0 关注 0 粉丝 0 动态

关注关注

导致MySQL索引失效的一些常见写法总结

最近一直忙着处理原来老项目遗留的一些SQL优化问题，由于当初表的设计以及字段设计的问题，随着业务的增长，出现了大量的慢SQL，导致MySQL的CPU资源飙升，基于此，给大家简单分享下这些比较使用的易于学习和使用的经验。这次的话简单说下如何防止你的索引失效。

liuweiq 2020-09-09

MySQL索引的各种类型

索引是数据库存储引擎用于快速查找到指定数据的一种数据结构。可以用新华字典做类比：如果新华字典中对每个字的详细解释是数据库中表的记录，那么按部首或拼音等排序的目录就是索引，使用它可以让我们快速查找的某一个字详细解释的位置。在MySQL中，存储引擎也是用了类似

silencehgt 2020-09-07

MySQL索引原理

　　1.B+树的叶子节点包含了所有的数据；　　2.叶子节点可以直接访问其他叶子节点，不需要回到根节点；　　操作系统中，默认的是每一页是4KB；而InnoDB存储引擎，默认每一页是16KB；　　UserRecord（行记录）区域，保存的是真正的数据，会包含多

bluetears 2020-07-05

MySql索引失效的十大杂症

最近生产爆出一条慢sql，原因是用了or和!于是，总结了索引失效的十大杂症，希望对大家有帮助，加油。如果它一开始就走全表扫描，直接一遍扫描就完事。mysql是有优化器的，处于效率与成本考虑，遇到or条件，让索引失效，看起来也合情合理嘛。在联合索引中，查询条

minggehenhao 2020-07-04

MySQL优化之索引篇: Explain工具

explain专门用来做SQL语句的调优的，在select语句前面加一个explain可以把SELECT的执行过程都列出来，包括哪些用了索引，哪些没用索引，哪些查询是全表查询，哪些是索引查询等 . 使用效果如下图 :. 执行编号，标识select所属的行。

minggehenhao 2020-06-21

MySQL 索引失效

mysql 再使用不等于(!=或者<>)的时候无法使用索引会导致全表扫描。全列匹配我最爱，最左前缀要遵守；带头大哥不能死，中间兄弟不能断；索引列上少计算，范围之后全失效；LIKE百分写最右，覆盖索引不写星；不等空值还有or，索引失效要少用；

Iamready 2020-06-14

MySQL索引介绍

索引类似大学图书馆建书目索引，可以提高数据检索的效率，降低数据库的IO成本。MySQL在300万条记录左右性能开始逐渐下降，虽然官方文档说500~800w记录，所以大数据量建立索引是非常有必要的。MySQL提供了Explain，用于显示SQL执行的详细信息

variab 2020-06-14

MySQL 数据库如何解决高并发问题

我们都知道初创公司一开始都是以单体应用为首要架构，一般都是单体单库的形式。但是版本以及版本的迭代，数据库需要承受更多的高并发已经成了架构设计需要考虑的点。高并发的情况下，可以将多个请求的查询合在一次进行，以减少对数据库的访问速度。我们都知道，只要数据库

sunnyxuebuhui 2020-09-07

MySQL数据类型优化原则

MySQL支持的数据类型很多，选择正确的数据类型对于高性能至关重要。下面几个简单的原则都有助于做出更好的选择。应该尽量使用可以正确储存数据的最小数据类型。如果无法确定哪个数据类型时最好的，就选择你认为不会超过范围的最小类型。比如用MySQ内建的类型而不是使

ribavnu 2020-11-16

MySQL 千万级数据量如何快速分页

后端开发中为了防止一次性加载太多数据导致内存、磁盘IO都开销过大，经常需要分页展示，这个时候就需要用到MySQL的LIMIT关键字。但你以为LIMIT分页就万事大吉了么，Too young,too simple啊，LIMIT在数据量大的时候极可能造成的一个

西瓜皮儿的皮儿 2020-09-07

MySQL数据库查询性能优化策略

Explain 用来分析 SELECT 查询语句，开发人员可以通过分析 Explain 结果来优化查询语句。MySQL可以为多个字段创建索引,一个索引可以包括16个字段,只有查询条件中使用这些字段中的第一个字段时,索引才会被使用.子查询虽然可以使查询语句更

houdaxiami 2020-08-15

关于mysql自增id，你需要知道的

本篇文章将以问答的形式讲述关于自增id的一切。这就要求同一个叶子节点内的各条数据记录按主键顺序存放，因此每当有一条新的记录插入时，MySQL会根据其主键将其插入适当的节点和位置，如果页面达到装载因子，则开辟一个新的页（节点）。自增id是增长的不一定连续。

抱抱熊 2020-08-15

mysql高级（查询截取分析）

　　2）最佳左前缀法则：如果索引了多列，要遵守最左前缀法则，即查询where子句从索引的最左前列开始并且不跳过索引中的列。　　3）不在索引列上做任何操作，因为这样会导致索引失效而转向全表扫描。　　6）mysql在使用不等于（!　　8）like 以 ‘%xx

adsadadaddadasda 2020-07-19

mysql的sort by学习

学习了mysql的next-key-lock后，现在正式进入sort by的学习阶段。我也听说sort by有可能会对mysql造成压力，所以要学习一下sort by的过程，从而才能深刻的了解自己的sort by语句对mysql的压力，避免线上性能低下或者

ztyzly00 2020-07-18

mysql使用记录

根据业务需求，发现以前的同事在设计表的时候，很多字段都没有设置默认值。在mysql5.7版本之后，没有设定默认值的字段，在严格模式下是很容易报错的，所以我这边需要先给每个字段加上一个默认值。对于常见的int类型，默认值为0就好，但是对于varchar类型呢

sofast 2020-07-08

sql优化的几种方式

= 或 <> 操作符不会使用索引，而对于 < 、 <= 、 = 、 > 、 >= 、 BETWEEN AND，数据库才会使用索引。因此对于上面的查询，正确写法应该是：select name from table wher

明月清风精进不止 2020-07-05

SQL语句优化的理解

然后是某一条SQL 语句一直执行的很慢，可能的原因有没有用到索引，例如该字段没有索引；由于对字段进行运算、函数操作导致无法用索引，或者是数据库选错了索引。这种情况是我们要关心的，需要进行SQL语句的优化，简单来说就是该用索引就要用索引，避免全表扫描。

URML 2020-07-04

MYSQL 优化常用方法

这个技术可以使用SELECT语句来创建一个单列的查询结果，然后把这个结果作为过滤条件用在另一个查询中。在客户端的查询会话结束的时候，临时表会被自动删除，从而保证数据库整齐、高效。换句话说，就是可以保持数据库中数据的一致性和完整性。事物以BEGIN 关键字开

FORYAOSHUYUN 2020-07-05

高并发系统设计（七）：【Mysql数据库的优化】主从读写分离、分库分表

主从复制的原理这里不再阐述，本人博客里有关于Mysql主从的配置文章，当然里面也介绍了原理。如主库发不完信息把信息同时写入缓存，读的时候直接从缓存取数据；比如关键数据的信息不仅仅把ID写入队列或者缓存，也可以避免查库；再比如直接主库拿；

CharlesYooSky 2020-06-25

详解 MySQL中count函数的正确使用方法

当搞清楚count函数的运行原理后，相信上面几个问题的答案就会了然于胸。为了解决上述的问题，我创建了一张 user 表，它有两个字段：主键id和name，后者可以为null，建表语句如下。`id` int NOT NULL AUTO_INCREMENT C

vitasfly 2020-11-12

mysql中group by优化

如果需要对关联查询做分组，并且按照关联表中的某个列进行分组，那么通常采用关联表的标识列分组的效率比其他列更高：。select actor.first_name,actor.last_name,count(*) from film_actor inner j

gsmfan 2020-07-26

安科网

数据库sql优化总结之百万级数据库优化方案+案例分析

njstexcellence

项目背景

1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。

2、应尽量避免在 where 子句中对字段进行 null 值判断，否则将导致引擎放弃使用索引而进行全表扫描

3、应尽量避免在 where 子句中使用 != 或 <> 操作符，否则将引擎放弃使用索引而进行全表扫描。

4.应尽量避免在 where 子句中使用 or 来连接条件，如果一个字段有索引，一个字段没有索引，将导致引擎放弃使用索引而进行全表扫描

5.in 和 not in 也要慎用，否则会导致全表扫描

6、like模糊全匹配也将导致全表扫描

njstexcellence

相关推荐

导致MySQL索引失效的一些常见写法总结

MySQL索引的各种类型

MySQL索引原理

MySql索引失效的十大杂症

MySQL优化之索引篇: Explain工具

MySQL 索引失效

MySQL索引介绍

MySQL 数据库如何解决高并发问题

MySQL数据类型优化原则

MySQL 千万级数据量如何快速分页

MySQL数据库查询性能优化策略

关于mysql自增id，你需要知道的

mysql高级（查询截取分析）

mysql的sort by学习

mysql使用记录

sql优化的几种方式

SQL语句优化的理解

MYSQL 优化常用方法

高并发系统设计（七）：【Mysql数据库的优化】主从读写分离、分库分表

详解 MySQL中count函数的正确使用方法

mysql中group by优化

njstexcellence

数据库sql优化总结之百万级数据库优化方案+案例分析

项目背景

1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。

2、应尽量避免在 where 子句中对字段进行 null 值判断，否则将导致引擎放弃使用索引而进行全表扫描

3、应尽量避免在 where 子句中使用 != 或 &lt;&gt; 操作符，否则将引擎放弃使用索引而进行全表扫描。

4.应尽量避免在 where 子句中使用 or 来连接条件，如果一个字段有索引，一个字段没有索引，将导致引擎放弃使用索引而进行全表扫描

5.in 和 not in 也要慎用，否则会导致全表扫描

6、like模糊全匹配也将导致全表扫描

相关推荐

3、应尽量避免在 where 子句中使用 != 或 <> 操作符，否则将引擎放弃使用索引而进行全表扫描。