惊了：《记一次数据库CPU使用率100%排查》

YangSunshine

2019-07-08

关注关注

1.背景：

在监控线上数据库的运行是否安全、正常的过程中，cpu 使用率是一个重要的指标，一旦cpu使用率飙升至90%+甚至达到100%，必然会对数据库的正常工作产生影响。

在排查数据库的cpu 飙升的问题前，我们先看下cpu 飙升的原因有哪些。

2.cpu使用率飙升的原因

首先直观的，cpu使用率过高可能和流量和慢查询有一定的关系

进一步查阅相关资料，得到公式：单位时间 CPU 资源 = 查询执行的平均成本 x 单位时间执行的查询数量

显然，cpu使用率与【查询执行的平均成本】和【单位时间执行的查询数量】线性相关，而这两项就是我们常说的慢sql以及数据库QPS。

所以：一般而言，cpu使用率飙升可归纳为以下两点：

大量的慢sql占用了cpu资源，拖垮了数据库，这类的慢sql常常表现为：查询的数据量过大，全表扫描、锁抢占甚至死锁、复杂查询等
QPS过高，本质上是数据库的承载的流量过大

3.如何解决

3.1 定位问题

定位是否为qps原因:

例如以下案例：

首先，查看当前cpu曲线：

惊了：《记一次数据库CPU使用率100%排查》

发现此时的cpu已经解决100%在运行，再查看此时的qps曲线，

惊了：《记一次数据库CPU使用率100%排查》

会发现此时的qps曲线基本和cpu曲线保持一致，此时我们可断定cpu飙升必然存在qps过高的原因。为了验证是否有慢sql的存在，再查看慢sql曲线：

惊了：《记一次数据库CPU使用率100%排查》

发现此案例中完全不存在慢sql。因此责任可100%归为qps过高，如果我们对该库所在实例开通的sql审计的功能，我们可查看过去一个月的qps记录，判断是由哪台机器发出的高频请求，以及请求的Top调用量的sql。

如果我们没开通sql审计功能的话，阿里云也可查看当前对库的实时请求记录，或者我们可以以root用户登陆数据库，执行‘SHOW PROCESSLIST’命令查看。

最后定位了具体sql或者接口后就可以针对性的解决问题：降级或者限流。

定位是否为慢sql原因

案例1 CPU峰刺

例如以下案例：

首先，查看当前cpu和qps曲线：

惊了：《记一次数据库CPU使用率100%排查》

从上图我们可看出，cpu和qps的整体的整体走势是基本一致的，但是上图中相对qps曲线，cpu有好几次的抖动，甚至峰值达到80%，我们需要排查出这些峰刺点。

由于此时的cpu抖动和qps曲线不一致，可推测是慢sql引起的，观察下图抖动时间段内的慢sql，确定是否有慢sql，以及慢sql的具体信息。

惊了：《记一次数据库CPU使用率100%排查》

观察上图发现该时间段内一些慢sql在库上使得cpu曲线发生了抖动，此时可采取kill+id的方法定制该sql的执行。

案例2 CPU明显飙升

有时，我们会发现cpu和qps的曲线不够吻合，此时我们有较大的把握推测出原因就是慢sql引起的。如以下情况：

惊了：《记一次数据库CPU使用率100%排查》

红框内的cpu使用率在上升，但qps却在下降，观察以下慢sql监听：

惊了：《记一次数据库CPU使用率100%排查》

说明这段时间内的异常是100%是由慢sql引起的，可采取kill+id的方法定制该sql的执行。

4 总结

4.1 慢sql优化思路

慢sql的优化思路较多，本文不打算赘述，仅提供以下几个方面优化思路。

1.扫描数据库记录数较多。

考虑表是否设置了合理的索引，表字段是否设置了合理的数据类型，sql是否有效的利用了索引等。

2.sql中是否有做了大量的聚合、计算？

考虑将sql简化，把逻辑操作上浮到业务中去做。

3.sql返回的记录数过多。
考虑分页实现，通过limit将一次请求转为多次请求。
4.表中是否冗余字段过多？
表若为宽表，包含大量冗余字段，可考虑分表。
5.库中是否有很多张表？
此时可考虑将表拆分到多个库中，分库。
6.若库的读写较多，锁争抢激励，甚至死锁。
可考虑多库做读写分离。
7.机器的本身性能较低，不符合业务需求。
可考虑机器升级了。

4.2 qps过高优化思路。

1.qps过高时，考虑是否可以使用缓存。
2.使用批量操作，将多个操作合并为一次请求，但此种方式需要考虑是否可以一次批量的数据有多大，避免造成慢sql。
3.考虑分库、读写分离，减少对一个机器的访问压力。
4.机器升级，没什么是钱解决不了的。

关注作者：JAVA高级程序员

我会不定期在微头条发放：（Java工程化、分布式架构、高并发、高性能、深入浅出、微服务架构、Spring、MyBatis、Netty、源码分析）等技术学习资料，以及Java进阶学习路线图。

数据库 cpu时间 cpu使用率 sql数据库

YangSunshine

0 关注 0 粉丝 0 动态

关注关注

SQL SERVER迁移之更换磁盘文件夹的完整步骤

默认情况下SQL SERVER的安装路径与数据库的默认存放路径是在C盘的--这就很尴尬。平时又不注意，有天发现C盘的剩余空间比较吃紧了，于是着手想办法迁移文件夹。避免突发情况，以防万一！因为迁移的时候用的SA用户，所以数据库文件的权限变了，因此变为只读状态

一片荷叶 11评论 2020-10-28

sql注入 --显错注入

jiong 2020-09-17

Golang操作MySql数据库的完整步骤记录

MySQL是业界常用的关系型数据库，在平时开发中会经常与MySql数据库打交道，所以在接下来将介绍怎么使用Go语言操作MySql数据库。Go语言中的database/sql包提供了保证SQL或类SQL数据库的泛用接口，并不提供具体的数据库驱动。我们常用的数

CoderToy 5评论 2020-11-16

golang常用库之操作数据库的orm框架-gorm基本使用详解

golang常用库：gorilla/mux-http路由库使用golang常用库：配置文件解析库-viper使用golang常用库：操作数据库的orm框架-gorm基本使用。UserId int64 `gorm:"index"` //设

技术之博大精深 10评论 2020-10-16

MySQL主从复制原理以及需要注意的地方

最近在写Mycat专题，由于不少小伙伴最近要出去面试，问我能不能简单写下MySQL的主从复制原理和注意事项，因为在之前的面试中被问到了这些问题。 Master 将数据改变记录到二进制日志中，也就是配置文件 log-bin 指定的文件，这些记录叫做二进制日

emmm00 28评论 2020-11-17

专业级的MySQL开发设计规范及SQL编写规范

在团队开发过程中为了项目的稳定，代码的高效，管理的便捷制定内部种开发设计规范是必不可少的，命名规范的对象是指数据库SCHEMA、表TABLE、索引INDEX、约束CONSTRAINTS等的命名约定。数据库创建时必须添加默认字符集和校对规则子句。设计应至少满

bianruifeng 5评论 2020-11-16

MySQL ddl语句的使用

数据定义语言create、drop、alter语句。定义对数据库记录的增、删、改操作。定义对数据库、表、字段、用户的访问权限和安全级别。这小节主要了解下数据定义语言DDL。我们用它对数据库、表进行一些管理操作，比如：建库、删库、建表、修改表、删除表、对字

云中舞步 2020-11-12

MySQL用truncate命令快速清空一个数据库中的所有表

用文本编辑器把每条truncate语句前后的“|”替换为空字符，方便后面一次复制多条执行。truncate与drop是DDL语句，执行后无法回滚；delete是DML语句，可回滚。truncate会清空表中的所有行，但表结构及其约束、索引等保持不变；dro

世樹 4评论 2020-11-11

MySQL 8.0.15配置MGR单主多从的方法

MySQL Group Replication字面意思是mysql组复制的意思,但其实他是一个高可用的集群架构,暂时只支持mysql5.7和mysql8.0版本.也是mysql官方基于组复制概念并充分参考MariaDB Galera Cluster和Per

暗夜之城 5评论 2020-11-11

Docker如何给Springboot项目动态传参的实现方法

最近有些初学Docker的朋友问到，想通过docker-compose.yml来动态给微服务传参，而不是每次都要在项目配置文件硬编码，然后构建服务镜像，最后打包发布经过一些列流程才能更新配置，那能不能直接通过docker-compose.yml里把一些配置

张荣珍 2020-11-12

详解Navicat Premium基本使用

Navicat是一套数据库管理工具，专为简化数据库的管理及降低系统管理成本而设。Navicat 是以直觉化的图形用户界面而建的，可以安全和简单地创建、组织、访问并共用信息。Navicat Premium 是 Navicat 的产品成员之一，能简单并快速地在

amienshxq 2020-11-14

使用 Navicat 创建数据库并用JDBC连接的操作方法

昨天学习 Java 的数据库部分，就试着写了一下 JDBC 连接的代码，并尝试与数据库进行连接。中间也是遇到了一些问题，解决之后，在这里分享一下，也算做个记录。这个就不多说了，需要的自己百度教程；输入连接名称，用户名、密码，然后 OK 就可以创建新的连接了

ASoc 2020-11-14

一款免费开源的通用数据库工具DBeaver

在制作《SQL 入门教程》时，接触到了这款非常强大易用的数据库管理和开发工具：DBeaver，也就是上面这个可爱的小河狸。DBeaver 是一个基于 Java 开发，免费开源的通用数据库管理和开发工具，使用非常友好的 ASL 协议。可以通过官方网站或者 G

yungpheng 2020-10-19

使用DataGrip的详细教程

DataGrip是一款连接数据库的可视化软件，就跟Navicat似的。DataGrip是JetBrains公司出品的，就是开发了IntelliJ IDEA的那家公司。基本上我认识的人都在用Navicat，Navicat确实非常好用。但DataGrip真的真

loveyouluobin 2020-09-29

datagrip如何找到数据库和表

用习惯了navicat，一直喜欢如下界面，可以方便查看数据库及表的信息。但是不知道为什么navicat总是无法连接oracle，因此转战datagrip。第一次使用datagrip，用户体验可谓是相当差了（大佬莫喷，对于我的使用习惯来说，这款软件用户体验真

尘封飞扬 2020-09-29

从零开始用DataGrip的安装及使用教程

在path加上mysql路径。例如，我的安装路径是C:\Users\skywf\mysql-8.0.19-winx64，那么我就要像下图一样配置环境变量。输入mysqld --initialize-insecure --user=mysql，我这里先配置无

Coder技术文摘 5评论 2020-09-29

分布式文档存储数据库之MongoDB访问控制的操作方法

　　什么是访问控制？

fengzhongdengdai 13评论 2020-11-17

分布式文档存储数据库之MongoDB备份与恢复的实践详解

　　为什么要备份？　　备份的目的是对数据做冗余的一种方式，它能够让我们在某种情况下保证最少数据的丢失；之前我们对mongodb做副本集也是对数据做冗余，但是这种在副本集上做数据冗余仅仅是针对系统故障或服务异常等一些非人为的故障发生时，保证数据服务的可用性；

lbyd0 2020-11-17

Pycharm连接MongoDB数据库安装教程详解

BigYellow 5评论 2020-11-16

分布式文档存储数据库之MongoDB分片集群的问题

　　1、什么是分片？比如用户要查询年龄大于30的用户，该怎么查询呢？而年龄大于30的用户的数据，可能server1上有一部分数据，server2上有部分数据，我们怎么才能够把所有满足条件的数据全部查询到呢？

sushuanglei 5评论 2020-11-12

安科网

惊了：《记一次数据库CPU使用率100%排查》

YangSunshine

YangSunshine

相关推荐

SQL SERVER迁移之更换磁盘文件夹的完整步骤

sql注入 --显错注入

Golang操作MySql数据库的完整步骤记录

golang常用库之操作数据库的orm框架-gorm基本使用详解

MySQL主从复制原理以及需要注意的地方

专业级的MySQL开发设计规范及SQL编写规范

MySQL ddl语句的使用

MySQL用truncate命令快速清空一个数据库中的所有表

MySQL 8.0.15配置MGR单主多从的方法

Docker如何给Springboot项目动态传参的实现方法

详解Navicat Premium基本使用

使用 Navicat 创建数据库并用JDBC连接的操作方法

一款免费开源的通用数据库工具DBeaver

使用DataGrip的详细教程

datagrip如何找到数据库和表

从零开始用DataGrip的安装及使用教程

分布式文档存储数据库之MongoDB访问控制的操作方法

分布式文档存储数据库之MongoDB备份与恢复的实践详解

Pycharm连接MongoDB数据库安装教程详解

分布式文档存储数据库之MongoDB分片集群的问题

YangSunshine