Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

shimly00

2019-07-25

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

1、LIMIT 语句

分页查询是最常用的场景之一，但也通常也是最容易出问题的地方。比如对于下面简单的语句，一般 DBA 想到的办法是在 type, name, create_time 字段上加组合索引。这样条件排序都能有效的利用到索引，性能迅速提升。

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

好吧，可能90%以上的 DBA 解决该问题就到此为止。但当 LIMIT 子句变成 “LIMIT 1000000,10” 时，程序员仍然会抱怨：我只取10条记录为什么还是慢?

要知道数据库也并不知道第1000000条记录从什么地方开始，即使有索引也需要从头计算一次。出现这种性能问题，多数情形下是程序员偷懒了。

在前端数据浏览翻页，或者大数据分批导出等场景下，是可以将上一页的最大值当成参数作为查询条件的。SQL 重新设计如下：

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

在新设计下查询时间基本固定，不会随着数据量的增长而发生变化。

2、隐式转换

SQL语句中查询变量和字段定义类型不匹配是另一个常见的错误。比如下面的语句：

mysql> explain extended SELECT *

> FROM my_balance b

> WHERE b.bpn = 14000000123

> AND b.isverified IS NULL ;

mysql> show warnings;

| Warning | 1739 | Cannot use ref access on index'bpn'due totypeor collation conversion on field'bpn'

其中字段 bpn 的定义为 varchar(20)，MySQL 的策略是将字符串转换为数字之后再比较。函数作用于表字段，索引失效。

上述情况可能是应用程序框架自动填入的参数，而不是程序员的原意。现在应用框架很多很繁杂，使用方便的同时也小心它可能给自己挖坑。

3、关联更新、删除

虽然 MySQL5.6 引入了物化特性，但需要特别注意它目前仅仅针对查询语句的优化。对于更新或删除需要手工重写成 JOIN。

比如下面 UPDATE 语句，MySQL 实际执行的是循环/嵌套子查询(DEPENDENT SUBQUERY)，其执行时间可想而知。

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

执行计划：

+----+--------------------+-------+-------+---------------+---------+---------+-------+------+-----------------------------------------------------+

| id | select_type | table |type| possible_keys | key | key_len | ref | rows | Extra |

+----+--------------------+-------+-------+---------------+---------+---------+-------+------+-----------------------------------------------------+

| 1 | PRIMARY | o | index | | PRIMARY | 8 | | 24 | Usingwhere; Using temporary |

| 2 | DEPENDENT SUBQUERY | | | | | | | | Impossible WHERE noticed after reading const tables |

| 3 | DERIVED | o | ref | idx_2,idx_5 | idx_5 | 8 | const | 1 | Usingwhere; Using filesort |

+----+--------------------+-------+-------+---------------+---------+---------+-------+------+-----------------------------------------------------+

重写为 JOIN 之后，子查询的选择模式从 DEPENDENT SUBQUERY 变成 DERIVED，执行速度大大加快，从7秒降低到2毫秒。

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

执行计划简化为：

+----+-------------+-------+------+---------------+-------+---------+-------+------+-----------------------------------------------------+

| id | select_type | table |type| possible_keys | key | key_len | ref | rows | Extra |

+----+-------------+-------+------+---------------+-------+---------+-------+------+-----------------------------------------------------+

| 1 | PRIMARY | | | | | | | | Impossible WHERE noticed after reading const tables |

| 2 | DERIVED | o | ref | idx_2,idx_5 | idx_5 | 8 | const | 1 | Usingwhere; Using filesort |

+----+-------------+-------+------+---------------+-------+---------+-------+------+-----------------------------------------------------+

4、混合排序

MySQL 不能利用索引进行混合排序。但在某些场景，还是有机会使用特殊方法提升性能的。

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

执行计划显示为全表扫描：

+----+-------------+-------+--------+-------------+---------+---------+---------------+---------+-+

| id | select_type | table |type| possible_keys | key | key_len | ref | rows | Extra

+----+-------------+-------+--------+-------------+---------+---------+---------------+---------+-+

| 1 | SIMPLE | a | ALL | idx_orderid | NULL | NULL | NULL | 1967647 | Using filesort |

| 1 | SIMPLE | o | eq_ref | PRIMARY | PRIMARY | 122 | a.orderid | 1 | NULL |

+----+-------------+-------+--------+---------+---------+---------+-----------------+---------+-+

由于 is_reply 只有0和1两种状态，我们按照下面的方法重写后，执行时间从1.58秒降低到2毫秒。

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

5、EXISTS语句

MySQL 对待 EXISTS 子句时，仍然采用嵌套子查询的执行方式。如下面的 SQL 语句：

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

执行计划为：

+----+--------------------+-------+------+-----+------------------------------------------+---------+-------+---------+ -----+

| id | select_type | table |type| possible_keys | key | key_len | ref | rows | Extra |

+----+--------------------+-------+------+ -----+------------------------------------------+---------+-------+---------+ -----+

| 1 | PRIMARY | n | ALL | | NULL | NULL | NULL | 1086041 | Usingwhere|

| 1 | PRIMARY | sra | ref | | idx_user_id | 123 | const | 1 | Usingwhere|

| 2 | DEPENDENT SUBQUERY | m | ref | | idx_message_info | 122 | const | 1 | Using index condition; Usingwhere|

+----+--------------------+-------+------+ -----+------------------------------------------+---------+----

去掉 exists 更改为 join，能够避免嵌套子查询，将执行时间从1.93秒降低为1毫秒。

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

新的执行计划：

+----+-------------+-------+--------+ -----+------------------------------------------+---------+ -----+------+ -----+

| id | select_type | table |type| possible_keys | key | key_len | ref | rows | Extra |

+----+-------------+-------+--------+ -----+------------------------------------------+---------+ -----+------+ -----+

| 1 | SIMPLE | m | ref | | idx_message_info | 122 | const | 1 | Using index condition |

| 1 | SIMPLE | n | eq_ref | | PRIMARY | 122 | ighbor_id | 1 | Usingwhere|

| 1 | SIMPLE | sra | ref | | idx_user_id | 123 | const | 1 | Usingwhere|

+----+-------------+-------+--------+ -----+------------------------------------------+---------+ -----+

6、条件下推

外部查询条件不能够下推到复杂的视图或子查询的情况有：

聚合子查询;

含有 LIMIT 的子查询;

UNION 或 UNION ALL 子查询;

输出字段中的子查询;

如下面的语句，从执行计划可以看出其条件作用于聚合子查询之后：

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

确定从语义上查询条件可以直接下推后，重写如下：

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

执行计划变为：

+----+-------------+-----------+------+---------------+-------+---------+-------+------+--------------------+

| id | select_type | table |type| possible_keys | key | key_len | ref | rows | Extra |

+----+-------------+-----------+------+---------------+-------+---------+-------+------+--------------------+

| 1 | SIMPLE | operation | ref | idx_4 | idx_4 | 514 | const | 1 | Usingwhere; Using index |

+----+-------------+-----------+------+---------------+-------+---------+-------+------+--------------------+

7、提前缩小范围

先上初始 SQL 语句：

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

该SQL语句原意是：先做一系列的左连接，然后排序取前15条记录。从执行计划也可以看出，最后一步估算排序记录数为90万，时间消耗为12秒。

+----+-------------+-------+--------+---------------+---------+---------+-----------------+--------+----------------------------------------------------+

| id | select_type | table |type| possible_keys | key | key_len | ref | rows | Extra |

+----+-------------+-------+--------+---------------+---------+---------+-----------------+--------+----------------------------------------------------+

| 1 | SIMPLE | o | ALL | NULL | NULL | NULL | NULL | 909119 | Usingwhere; Using temporary; Using filesort |

| 1 | SIMPLE | u | eq_ref | PRIMARY | PRIMARY | 4 | o.uid | 1 | NULL |

| 1 | SIMPLE | p | ALL | PRIMARY | NULL | NULL | NULL | 6 | Usingwhere; Using join buffer (Block Nested Loop) |

+----+-------------+-------+--------+---------------+---------+---------+-----------------+--------+----------------------------------------------------+

由于最后 WHERE 条件以及排序均针对最左主表，因此可以先对 my_order 排序提前缩小数据量再做左连接。SQL 重写后如下，执行时间缩小为1毫秒左右。

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

再检查执行计划：子查询物化后(select_type=DERIVED)参与 JOIN。虽然估算行扫描仍然为90万，但是利用了索引以及 LIMIT 子句后，实际执行时间变得很小。复制代码

+----+-------------+------------+--------+---------------+---------+---------+-------+--------+----------------------------------------------------+

| id | select_type | table |type| possible_keys | key | key_len | ref | rows | Extra |

+----+-------------+------------+--------+---------------+---------+---------+-------+--------+----------------------------------------------------+

| 1 | PRIMARY | | ALL | NULL | NULL | NULL | NULL | 15 | Using temporary; Using filesort |

| 1 | PRIMARY | u | eq_ref | PRIMARY | PRIMARY | 4 | o.uid | 1 | NULL |

| 1 | PRIMARY | p | ALL | PRIMARY | NULL | NULL | NULL | 6 | Usingwhere; Using join buffer (Block Nested Loop) |

| 2 | DERIVED | o | index | NULL | idx_1 | 5 | NULL | 909112 | Usingwhere|

+----+-------------+------------+--------+---------------+---------+---------+-------+--------+----------------------------------------------------+

8、中间结果集下推

再来看下面这个已经初步优化过的例子(左连接中的主表优先作用查询条件)：

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

那么该语句还存在其它问题吗?不难看出子查询 c 是全表聚合查询，在表数量特别大的情况下会导致整个语句的性能下降。

其实对于子查询 c，左连接最后结果集只关心能和主表 resourceid 能匹配的数据。因此我们可以重写语句如下，执行时间从原来的2秒下降到2毫秒。

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

但是子查询 a 在我们的SQL语句中出现了多次。这种写法不仅存在额外的开销，还使得整个语句显的繁杂。使用 WITH 语句再次重写：

Java架构师笔记丨常见的错误 SQL 用法，你中招了吗？

总结

数据库编译器产生执行计划，决定着SQL的实际执行方式。但是编译器只是尽力服务，所有数据库的编译器都不是尽善尽美的。

上述提到的多数场景，在其它数据库中也存在性能问题。了解数据库编译器的特性，才能避规其短处，写出高性能的SQL语句。

sql优化架构师

shimly00

0 关注 0 粉丝 0 动态

相关推荐

MySQL数据类型优化原则

MySQL支持的数据类型很多，选择正确的数据类型对于高性能至关重要。下面几个简单的原则都有助于做出更好的选择。应该尽量使用可以正确储存数据的最小数据类型。如果无法确定哪个数据类型时最好的，就选择你认为不会超过范围的最小类型。比如用MySQ内建的类型而不是使

ribavnu 2020-11-16

MySQL中使用binlog时格式该如何选择

每一条会修改数据的sql都会记录到master的bin-log中。slave在复制的时候sql进程会解析成和原来master端执行过的相同的sql来再次执行。另外就是,由于mysql现在发展比较快，很多的新功能加入，使mysql的复制遇到了不小的挑战,自然

要啥自行车一把梭 2020-11-12

详解 MySQL中count函数的正确使用方法

当搞清楚count函数的运行原理后，相信上面几个问题的答案就会了然于胸。为了解决上述的问题，我创建了一张 user 表，它有两个字段：主键id和name，后者可以为null，建表语句如下。`id` int NOT NULL AUTO_INCREMENT C

vitasfly 2020-11-12

sql优化实战把full join改为left join +union all(从5分钟降为10秒)

今天收到一个需求，要改写一个报表的逻辑，当改完之后，再次运行，发现运行超时。因为特殊原因，无法访问客户的服务器，没办法查看sql的执行计划、没办法知道表中的索引情况，所以，尝试从语句的改写上来优化。但是考虑到第2段代码中并没有prod_id这个字段，所以这

ILVNMM 2020-09-19

SQL Server 开窗函数 Over()代替游标的使用详解

今天在优化工作中遇到的sql慢的问题，发现以前用了挺多游标来处理数据，这样就导致在数据量多的情况下，需要一行一行去遍历从而计算需要的数据，这样处理的结果就是数据慢，容易卡死。第一行表示标题；第二行表示客户，是一行空行；第三行是期初余额，只显示期末余额的数据

zycchun 2020-10-16

Mysql临时表及分区表区别详解

内存表，指的是使用Memory引擎的表，建表语法是create table …这种表的数据都保存在内存，系统重启的时候会被清空，但是表结构还在。除这两个特性看上去比较“奇怪”外，从其他的特征上看，它就是一个正常的表。如果是使用InnoDB引擎或者MyI

康慧欣 2020-09-10

导致MySQL索引失效的一些常见写法总结

最近一直忙着处理原来老项目遗留的一些SQL优化问题，由于当初表的设计以及字段设计的问题，随着业务的增长，出现了大量的慢SQL，导致MySQL的CPU资源飙升，基于此，给大家简单分享下这些比较使用的易于学习和使用的经验。这次的话简单说下如何防止你的索引失效。

liuweiq 2020-09-09

MySQL索引的各种类型

索引是数据库存储引擎用于快速查找到指定数据的一种数据结构。可以用新华字典做类比：如果新华字典中对每个字的详细解释是数据库中表的记录，那么按部首或拼音等排序的目录就是索引，使用它可以让我们快速查找的某一个字详细解释的位置。在MySQL中，存储引擎也是用了类似

silencehgt 2020-09-07

MySQL 数据库如何解决高并发问题

我们都知道初创公司一开始都是以单体应用为首要架构，一般都是单体单库的形式。但是版本以及版本的迭代，数据库需要承受更多的高并发已经成了架构设计需要考虑的点。高并发的情况下，可以将多个请求的查询合在一次进行，以减少对数据库的访问速度。我们都知道，只要数据库

sunnyxuebuhui 2020-09-07

MySQL 千万级数据量如何快速分页

后端开发中为了防止一次性加载太多数据导致内存、磁盘IO都开销过大，经常需要分页展示，这个时候就需要用到MySQL的LIMIT关键字。但你以为LIMIT分页就万事大吉了么，Too young,too simple啊，LIMIT在数据量大的时候极可能造成的一个

西瓜皮儿的皮儿 2020-09-07

分区表场景下的 SQL 优化

有个表做了分区，每天一个分区。该表上有个查询，经常只查询表中某一天数据，但每次都几乎要扫描整个分区的所有数据，有什么办法进行优化吗？有一个大表，每天产生的数据量约100万，所以就采用表分区方案，每天一个分区。`tst` timestamp NOT NULL

李轮清 2020-09-15

mysql性能分析篇

数据库查询快慢是影响项目性能的一大因素，对于数据库，我们除了要优化SQL，更重要的是得先找到需要优化的SQL， MYSQL数据库又一个慢查询日志功能，用来记录查询时间超过某个设定值的SQL语句，这将极大程序帮助我们快速定位到问题，以便对症下药。

lifeison 2020-08-18

不得不会的mysql架构，让你更懂她！

Connection Pool**: 连接池a. 管理缓冲用户连接，线程处理等需要缓存的需求。c. 而连接线程的主要工作就是负责 MySQL Server 与客户端的通信，接受客户端的命令请求，传递 Server 端的结果信息等。包括线程的创建，线程的 c

cyhgogogo 2020-08-18

MySQL优化SQL语句的技巧

在面对不够优化、或者性能极差的SQL语句时，我们通常的想法是将重构这个SQL语句，让其查询的结果集和原来保持一样，并且希望SQL性能得以提升。而在重构SQL时，一般都有一定方法技巧可供参考，本文将介绍如何通过这些技巧方法来重构SQL。有时候对于一个复杂SQ

minerk 2020-08-15

MySQL如何优化查询速度

前面章节我们介绍了如何选择优化的数据类型、如何高效的使用索引，这些对于高性能的MySQL来说是必不可少的。但这些还完全不够，还需要合理的设计查询。如果查询写的很糟糕，即使表结构再合理、索引再合适，也是无法实现高性能的。谈到MySQL性能优化，查询优化作为优

webliyang 2020-08-15

MySQL数据库查询性能优化策略

Explain 用来分析 SELECT 查询语句，开发人员可以通过分析 Explain 结果来优化查询语句。MySQL可以为多个字段创建索引,一个索引可以包括16个字段,只有查询条件中使用这些字段中的第一个字段时,索引才会被使用.子查询虽然可以使查询语句更

houdaxiami 2020-08-15

关于mysql自增id，你需要知道的

本篇文章将以问答的形式讲述关于自增id的一切。这就要求同一个叶子节点内的各条数据记录按主键顺序存放，因此每当有一条新的记录插入时，MySQL会根据其主键将其插入适当的节点和位置，如果页面达到装载因子，则开辟一个新的页（节点）。自增id是增长的不一定连续。

抱抱熊 2020-08-15

详解MySQL分区表

分区是一种表的设计模式，通俗地讲表分区是将一大表，根据条件分割成若干个小表。但是对于应用程序来讲，分区的表和没有分区的表是一样的。换句话来讲，分区对于应用是透明的，只是数据库对于数据的重新整理。本篇文章给大家带来的内容是关于MySQL中分区表的介绍及使用场

caodayong 2020-08-15

Centos7 安装 Mysql8教程

首先，您需要在MySQL提供的系统中启用MySQL yum存储库。根据您的操作系统版本执行以下命令之一，这里我们选择CentOS 7 / RHEL 7的源。因此，首先禁用mysql repo文件中的所有存储库。安装MySQL 8.0后，将为MySQL根用户

徐悦TechBlog 2020-08-15

Mysql中Sleep进程连接数过多问题解决

连接数查看进入MySQL命令行，输入“show processlist;”命令后，Command列出现一大堆Sleep睡眠状态的连接进程。超过配置的最大连接数，新的客户端连接将无法连接，mysql将无法提供服务，Web系统无法访问、崩塌。造成连接数过多原因

hevenue 2020-07-30

shimly00

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号