实战分享：一次非常有意思的SQL优化经历：从30248.271s到0.001s

HuangRam

2019-05-31

本文为译文，翻译来自csdn博客：Java我人生来源：http://suo.im/55fJmT

场景

我用的数据库是mysql5.6，下面简单的介绍下场景

课程表

create table Course(
c_id int PRIMARY KEY,
name varchar(10)
)

数据100条

学生表:

create table Student(
id int PRIMARY KEY,
name varchar(10)
)

数据70000条

学生成绩表SC

CREATE table SC(
sc_id int PRIMARY KEY,
s_id int,
c_id int,
score int
)

数据70w条

查询目的：

查找语文考100分的考生

查询语句：

select s.* from Student s where s.s_id in (select s_id from SC sc where sc.c_id = 0 and sc.score = 100 )

执行时间：30248.271s

晕,为什么这么慢，先来查看下查询计划：

EXPLAIN

select s.* from Student s where s.s_id in (select s_id from SC sc where sc.c_id = 0 and sc.score = 100 )

实战分享：一次非常有意思的SQL优化经历：从30248.271s到0.001s

发现没有用到索引，type全是ALL，那么首先想到的就是建立一个索引，建立索引的字段当然是在where条件的字段。

先给sc表的c_id和score建个索引

CREATE index sc_c_id_index on SC(c_id);
CREATE index sc_score_index on SC(score);

再次执行上述查询语句，时间为: 1.054s

快了3w多倍，大大缩短了查询时间，看来索引能极大程度的提高查询效率，看来建索引很有必要，很多时候都忘记建

索引了，数据量小的的时候压根没感觉，这优化感觉挺爽。

但是1s的时间还是太长了，还能进行优化吗，仔细看执行计划：

实战分享：一次非常有意思的SQL优化经历：从30248.271s到0.001s

查看优化后的sql:

SELECT
`YSB`.`s`.`s_id` AS `s_id`,
`YSB`.`s`.`name` AS `name`
FROM
`YSB`.`Student` `s`
WHERE
&lt; in_optimizer &gt; (
`YSB`.`s`.`s_id` ,&lt; EXISTS &gt; (
SELECT
1
FROM
`YSB`.`SC` `sc`
WHERE
(
(`YSB`.`sc`.`c_id` = 0)
AND (`YSB`.`sc`.`score` = 100)
AND (
&lt; CACHE &gt; (`YSB`.`s`.`s_id`) = `YSB`.`sc`.`s_id`
)
)
)
)

补充：这里有网友问怎么查看优化后的语句

方法如下：

在命令窗口执行

实战分享：一次非常有意思的SQL优化经历：从30248.271s到0.001s

有type=all

按照我之前的想法，该sql的执行的顺序应该是先执行子查询

select s_id from SC sc where sc.c_id = 0 and sc.score = 100

耗时：0.001s

得到如下结果：

实战分享：一次非常有意思的SQL优化经历：从30248.271s到0.001s

然后再执行

select s.* from Student s where s.s_id in(7,29,5000)

耗时：0.001s

这样就是相当快了啊，Mysql竟然不是先执行里层的查询，而是将sql优化成了exists子句，并出现了EPENDENT SUBQUERY，

mysql是先执行外层查询，再执行里层的查询，这样就要循环70007*11=770077次。

那么改用连接查询呢？

SELECT s.* from
Student s
INNER JOIN SC sc
on sc.s_id = s.s_id
where sc.c_id=0 and sc.score=100

这里为了重新分析连接查询的情况，先暂时删除索引sc_c_id_index，sc_score_index

执行时间是：0.057s

效率有所提高，看看执行计划：

实战分享：一次非常有意思的SQL优化经历：从30248.271s到0.001s

这里有连表的情况出现，我猜想是不是要给sc表的s_id建立个索引

CREATE index sc_s_id_index on SC(s_id);
show index from SC

实战分享：一次非常有意思的SQL优化经历：从30248.271s到0.001s

在执行连接查询

时间: 1.076s，竟然时间还变长了，什么原因？查看执行计划：

实战分享：一次非常有意思的SQL优化经历：从30248.271s到0.001s

优化后的查询语句为：

SELECT
`YSB`.`s`.`s_id` AS `s_id`,
`YSB`.`s`.`name` AS `name`
FROM
`YSB`.`Student` `s`
JOIN `YSB`.`SC` `sc`
WHERE
(
(
`YSB`.`sc`.`s_id` = `YSB`.`s`.`s_id`
)
AND (`YSB`.`sc`.`score` = 100)
AND (`YSB`.`sc`.`c_id` = 0)
)

貌似是先做的连接查询，再执行的where过滤

回到前面的执行计划：

实战分享：一次非常有意思的SQL优化经历：从30248.271s到0.001s

这里是先做的where过滤，再做连表，执行计划还不是固定的，那么我们先看下标准的sql执行顺序：

实战分享：一次非常有意思的SQL优化经历：从30248.271s到0.001s

正常情况下是先join再where过滤，但是我们这里的情况，如果先join，将会有70w条数据发送join做操，因此先执行where

过滤是明智方案，现在为了排除mysql的查询优化，我自己写一条优化后的sql

SELECT
s.*
FROM
(
SELECT
*
FROM
SC sc
WHERE
sc.c_id = 0
AND sc.score = 100
) t
INNER JOIN Student s ON t.s_id = s.s_id

即先执行sc表的过滤，再进行表连接，执行时间为：0.054s

和之前没有建s_id索引的时间差不多

查看执行计划：

实战分享：一次非常有意思的SQL优化经历：从30248.271s到0.001s

先提取sc再连表，这样效率就高多了，现在的问题是提取sc的时候出现了扫描表，那么现在可以明确需要建立相关索引

CREATE index sc_c_id_index on SC(c_id);
CREATE index sc_score_index on SC(score);

再执行查询：

SELECT
s.*
FROM
(
SELECT
*
FROM
SC sc
WHERE
sc.c_id = 0
AND sc.score = 100
) t
INNER JOIN Student s ON t.s_id = s.s_id

执行时间为：0.001s，这个时间相当靠谱，快了50倍

执行计划：

实战分享：一次非常有意思的SQL优化经历：从30248.271s到0.001s

我们会看到，先提取sc，再连表，都用到了索引。

那么再来执行下sql

SELECT s.* from
Student s
INNER JOIN SC sc
on sc.s_id = s.s_id
where sc.c_id=0 and sc.score=100

执行时间0.001s

执行计划：

实战分享：一次非常有意思的SQL优化经历：从30248.271s到0.001s

这里是mysql进行了查询语句优化，先执行了where过滤，再执行连接操作，且都用到了索引。

总结：

1.mysql嵌套子查询效率确实比较低

2.可以将其优化成连接查询

3.建立合适的索引

4.学会分析sql执行计划，mysql会对sql进行优化，所以分析执行计划很重要

sql优化

HuangRam

0 关注 0 粉丝 0 动态

关注关注

MySQL数据类型优化原则

MySQL支持的数据类型很多，选择正确的数据类型对于高性能至关重要。下面几个简单的原则都有助于做出更好的选择。应该尽量使用可以正确储存数据的最小数据类型。如果无法确定哪个数据类型时最好的，就选择你认为不会超过范围的最小类型。比如用MySQ内建的类型而不是使

ribavnu 2020-11-16

MySQL中使用binlog时格式该如何选择

每一条会修改数据的sql都会记录到master的bin-log中。slave在复制的时候sql进程会解析成和原来master端执行过的相同的sql来再次执行。另外就是,由于mysql现在发展比较快，很多的新功能加入，使mysql的复制遇到了不小的挑战,自然

要啥自行车一把梭 2020-11-12

详解 MySQL中count函数的正确使用方法

当搞清楚count函数的运行原理后，相信上面几个问题的答案就会了然于胸。为了解决上述的问题，我创建了一张 user 表，它有两个字段：主键id和name，后者可以为null，建表语句如下。`id` int NOT NULL AUTO_INCREMENT C

vitasfly 2020-11-12

sql优化实战把full join改为left join +union all(从5分钟降为10秒)

今天收到一个需求，要改写一个报表的逻辑，当改完之后，再次运行，发现运行超时。因为特殊原因，无法访问客户的服务器，没办法查看sql的执行计划、没办法知道表中的索引情况，所以，尝试从语句的改写上来优化。但是考虑到第2段代码中并没有prod_id这个字段，所以这

ILVNMM 2020-09-19

SQL Server 开窗函数 Over()代替游标的使用详解

今天在优化工作中遇到的sql慢的问题，发现以前用了挺多游标来处理数据，这样就导致在数据量多的情况下，需要一行一行去遍历从而计算需要的数据，这样处理的结果就是数据慢，容易卡死。第一行表示标题；第二行表示客户，是一行空行；第三行是期初余额，只显示期末余额的数据

zycchun 2020-10-16

Mysql临时表及分区表区别详解

内存表，指的是使用Memory引擎的表，建表语法是create table …这种表的数据都保存在内存，系统重启的时候会被清空，但是表结构还在。除这两个特性看上去比较“奇怪”外，从其他的特征上看，它就是一个正常的表。如果是使用InnoDB引擎或者MyI

康慧欣 2020-09-10

导致MySQL索引失效的一些常见写法总结

最近一直忙着处理原来老项目遗留的一些SQL优化问题，由于当初表的设计以及字段设计的问题，随着业务的增长，出现了大量的慢SQL，导致MySQL的CPU资源飙升，基于此，给大家简单分享下这些比较使用的易于学习和使用的经验。这次的话简单说下如何防止你的索引失效。

liuweiq 2020-09-09

MySQL索引的各种类型

索引是数据库存储引擎用于快速查找到指定数据的一种数据结构。可以用新华字典做类比：如果新华字典中对每个字的详细解释是数据库中表的记录，那么按部首或拼音等排序的目录就是索引，使用它可以让我们快速查找的某一个字详细解释的位置。在MySQL中，存储引擎也是用了类似

silencehgt 2020-09-07

MySQL 数据库如何解决高并发问题

我们都知道初创公司一开始都是以单体应用为首要架构，一般都是单体单库的形式。但是版本以及版本的迭代，数据库需要承受更多的高并发已经成了架构设计需要考虑的点。高并发的情况下，可以将多个请求的查询合在一次进行，以减少对数据库的访问速度。我们都知道，只要数据库

sunnyxuebuhui 2020-09-07

MySQL 千万级数据量如何快速分页

后端开发中为了防止一次性加载太多数据导致内存、磁盘IO都开销过大，经常需要分页展示，这个时候就需要用到MySQL的LIMIT关键字。但你以为LIMIT分页就万事大吉了么，Too young,too simple啊，LIMIT在数据量大的时候极可能造成的一个

西瓜皮儿的皮儿 2020-09-07

分区表场景下的 SQL 优化

有个表做了分区，每天一个分区。该表上有个查询，经常只查询表中某一天数据，但每次都几乎要扫描整个分区的所有数据，有什么办法进行优化吗？有一个大表，每天产生的数据量约100万，所以就采用表分区方案，每天一个分区。`tst` timestamp NOT NULL

李轮清 2020-09-15

mysql性能分析篇

数据库查询快慢是影响项目性能的一大因素，对于数据库，我们除了要优化SQL，更重要的是得先找到需要优化的SQL， MYSQL数据库又一个慢查询日志功能，用来记录查询时间超过某个设定值的SQL语句，这将极大程序帮助我们快速定位到问题，以便对症下药。

lifeison 2020-08-18

不得不会的mysql架构，让你更懂她！

Connection Pool**: 连接池a. 管理缓冲用户连接，线程处理等需要缓存的需求。c. 而连接线程的主要工作就是负责 MySQL Server 与客户端的通信，接受客户端的命令请求，传递 Server 端的结果信息等。包括线程的创建，线程的 c

cyhgogogo 2020-08-18

MySQL优化SQL语句的技巧

在面对不够优化、或者性能极差的SQL语句时，我们通常的想法是将重构这个SQL语句，让其查询的结果集和原来保持一样，并且希望SQL性能得以提升。而在重构SQL时，一般都有一定方法技巧可供参考，本文将介绍如何通过这些技巧方法来重构SQL。有时候对于一个复杂SQ

minerk 2020-08-15

MySQL如何优化查询速度

前面章节我们介绍了如何选择优化的数据类型、如何高效的使用索引，这些对于高性能的MySQL来说是必不可少的。但这些还完全不够，还需要合理的设计查询。如果查询写的很糟糕，即使表结构再合理、索引再合适，也是无法实现高性能的。谈到MySQL性能优化，查询优化作为优

webliyang 2020-08-15

MySQL数据库查询性能优化策略

Explain 用来分析 SELECT 查询语句，开发人员可以通过分析 Explain 结果来优化查询语句。MySQL可以为多个字段创建索引,一个索引可以包括16个字段,只有查询条件中使用这些字段中的第一个字段时,索引才会被使用.子查询虽然可以使查询语句更

houdaxiami 2020-08-15

关于mysql自增id，你需要知道的

本篇文章将以问答的形式讲述关于自增id的一切。这就要求同一个叶子节点内的各条数据记录按主键顺序存放，因此每当有一条新的记录插入时，MySQL会根据其主键将其插入适当的节点和位置，如果页面达到装载因子，则开辟一个新的页（节点）。自增id是增长的不一定连续。

抱抱熊 2020-08-15

详解MySQL分区表

分区是一种表的设计模式，通俗地讲表分区是将一大表，根据条件分割成若干个小表。但是对于应用程序来讲，分区的表和没有分区的表是一样的。换句话来讲，分区对于应用是透明的，只是数据库对于数据的重新整理。本篇文章给大家带来的内容是关于MySQL中分区表的介绍及使用场

caodayong 2020-08-15

Centos7 安装 Mysql8教程

首先，您需要在MySQL提供的系统中启用MySQL yum存储库。根据您的操作系统版本执行以下命令之一，这里我们选择CentOS 7 / RHEL 7的源。因此，首先禁用mysql repo文件中的所有存储库。安装MySQL 8.0后，将为MySQL根用户

徐悦TechBlog 2020-08-15

Mysql中Sleep进程连接数过多问题解决

连接数查看进入MySQL命令行，输入“show processlist;”命令后，Command列出现一大堆Sleep睡眠状态的连接进程。超过配置的最大连接数，新的客户端连接将无法连接，mysql将无法提供服务，Web系统无法访问、崩塌。造成连接数过多原因

hevenue 2020-07-30

安科网

实战分享：一次非常有意思的SQL优化经历：从30248.271s到0.001s

HuangRam

HuangRam

相关推荐

MySQL数据类型优化原则

MySQL中使用binlog时格式该如何选择

详解 MySQL中count函数的正确使用方法

sql优化实战把full join改为left join +union all(从5分钟降为10秒)

SQL Server 开窗函数 Over()代替游标的使用详解

Mysql临时表及分区表区别详解

导致MySQL索引失效的一些常见写法总结

MySQL索引的各种类型

MySQL 数据库如何解决高并发问题

MySQL 千万级数据量如何快速分页

分区表场景下的 SQL 优化

mysql性能分析篇

不得不会的mysql架构，让你更懂她！

MySQL优化SQL语句的技巧

MySQL如何优化查询速度

MySQL数据库查询性能优化策略

关于mysql自增id，你需要知道的

详解MySQL分区表

Centos7 安装 Mysql8教程

Mysql中Sleep进程连接数过多问题解决

HuangRam