MySQL中聚合函数count的使用和性能优化技巧

MySQLHD

2019-04-17

关注关注

本文的环境是Windows 10，MySQL版本是5.7.12-log

一、基本使用

count的基本作用是有两个：

统计某个列的数据的数量；
统计结果集的行数；

用来获取满足条件的数据的数量。但是其中有一些与使用中印象不同的情况，比如当count作用一列、多列、以及使用*来表达整行产生的效果是不同的。

示例表如下：

CREATE TABLE `NewTable` (
`id` int(11) NULL DEFAULT NULL ,
`name` varchar(30) NULL DEFAULT NULL ,
`country` varchar(50) NULL DEFAULT NULL ,
`province` varchar(30) NULL DEFAULT NULL ,
`city` varchar(30) NULL DEFAULT NULL 
)ENGINE=InnoDB

MySQL中聚合函数count的使用和性能优化技巧

1.1 不计算NULL的值

如果有NULL值，在返回的结果中会被过滤掉

select count(country) from person;

返回结果如下：

MySQL中聚合函数count的使用和性能优化技巧

如果满足条件的数据项不存在，则结构返回0，经常通过这种方式判断是否有满足条件的数据存在；返回的数据类型是bigint。

1.2 对count(*)的处理

count(*)的处理是有点不同的，它会返回所有数据的数量，但是不会过滤其中的NULL值，它也并不是相当于展开成所有的列，而是直接会忽略所有的列而直接统计所有的行数。语句如下：

select count(*) from person;

返回结果如下：

MySQL中聚合函数count的使用和性能优化技巧

当想要返回所有的数据的数量的时候，但是又不想包括全部是NULL的列，使用count(*)是不可能做到的，但是在1.1中说到count作用于列的时候会过滤NULL，那么直接这么写是不是对？

select count(id, `name`, country, province, city) from person;

那就错了，count只能作用于单列，不能作用于多列，所以上面的写法是错误的。

另外针对count(*)语句，在MyISAM存储引擎中做了优化，每个表的数据行数都会存储在存储引擎中，可以很快拿到；但是在事务性的存储引擎中，比如InnoDB中，因为会涉及到多个事务；

1.3 对count(distinct …)的处理

count(distinct …)会返回彼此不同但是非NULL的数据的行数。这一点和只使用distinct是有区别的，因为distinct是不过滤NULL值的，详见MySQL中distinct的使用方法。

- 如果没有符合条件的数据则返回0；
- 该语句可以作用于多列，是当各个列之间有一个不同，就认为整行数据不同，与distinct作用于多列时效果相同；

select count(DISTINCT country) from person;

返回结果如下：

MySQL中聚合函数count的使用和性能优化技巧

但是对于count(*)和count(distinct )两者的结合，如下：

select count(DISTINCT *) from person;

该语句是错误的，无法执行，因此与select count(DISTINCT *) from person 还是有区别的。

二、性能优化

通常情况下，count(*)操作需要大量扫描数据表中的行，如果避免扫描大量的数据就成为优化该语句的关键所在。针对这个问题可以从如下两个角度考虑。

2.1 在数据库的层次上优化

2.1.1 针对count(*)

在MySQL内部已经针对count(*)进行了优化，使用explain查询如下：

EXPLAIN select count(*) from person;

MySQL中聚合函数count的使用和性能优化技巧

从中可以看出该查询没有使用全表扫描也没有使用索引，甚至不需要查询数据表，在上面的示例数据库中得知，该库的存储引擎是InnoDB ，而且其中既没有主键也没有索引。

2.2 针对单个列进行count

查询如下：

EXPLAIN select count(country) from person where id > 2;

MySQL中聚合函数count的使用和性能优化技巧

发现在没有主键和索引的情况下，对全表进行了扫描。在数据中避免大量扫描数据行，一个最直接的方法使用索引：

当对id设置为一般索引：INDEX abc (id) USING BTREE 。

执行查询如下：

EXPLAIN select count(country) from person where id > 2;

结果如下：

MySQL中聚合函数count的使用和性能优化技巧

此时发现并没有使用索引，仍然进行的是全表扫描，当执行如下时：

EXPLAIN select count(country) from person where id > 4;

结果如下：

MySQL中聚合函数count的使用和性能优化技巧

这是使用了索引进行了范围查询，显然比上面的要好。

但是问题来了，为什么有时候使用索引，有时候不用索引？在上面的第一次查询中已经能够检测出可能的key但是并没有使用？如果有知道的大神给解读一下！

对id设置为主键，执行查询如下：

EXPLAIN select count(country) from person where id > 2;

结果如下：

MySQL中聚合函数count的使用和性能优化技巧

2.2 在应用的层次上优化

在应用的层次上优化，可以考虑在系统架构中引入缓存子系统，比如在过去中常用的Memcached，或者现在非常流行的Redis，但是这样会增加系统的复杂性。

mysql group by与聚合函数(sum,count等)实例

首先我们先来了解一下mysql聚合函数

mysql中一种特殊的函数:聚合函数，SUM, COUNT, MAX, MIN, AVG等。这些函数和其它函数的根本区别就是它们一般作用在多条记录上。例如：

SELECT SUM(score) FROM table

这个sql的意思是查询表table里面所有score列的总和。

接着我们通过一个实例来讲解group by语句中如何使用聚合函数。

book表如下：

id	first_name	last_name	city
1	Jason	Martin	Toronto
2	Alison	Mathews	Vancouver
3	James	Mathews	Vancouver
4	Celia	Rice	Vancouver
5	David	Larry	New York

现在我们要对city进行分组查询，并获取每个分组有多少条数据，我们需要count聚合函数。

SELECT *,count(*) FROM book GROUP BY city

结果为：

id	first_name	last_name	city	count(*)
1	Jason	Martin	Toronto	1
2	Alison	Mathews	Vancouver	3
5	David	Larry	New York	1

先以city把返回记录分成多个组，这就是GROUP BY的字面含义。分完组后，然后用聚合函数对每组中的不同字段(一或多条记录)作运算。

聚合函数性能优化 mysql sql优化

MySQLHD

0 关注 0 粉丝 0 动态

关注关注

MySQL约束

分别查询男、女同学的平均分,人数要求：分数低于70分的人，不参与分组,分组之后。

好记忆也需烂 2020-08-15

[LeetCode]1084. 销售分析III（Mysql，having+聚合函数）

product_id 是 Product 表的外键.编写一个SQL查询，报告2019年春季才售出的产品。即仅在2019-01-01至2019-03-31（含）之间出售的商品。著作权归领扣网络所有。having min>= ‘2019-01-01‘ a

ztyzly00 2020-06-12

SQL中的开窗函数详解可代替聚合函数使用

如果要想更具体了解开窗函数，请看书《程序员的SQL金典》，开窗函数在mysql不能使用。开窗函数与聚合函数一样，都是对行的集合组进行聚合计算。它用于为行定义一个窗口，它对一组值进行操作，不需要使用group by语句对数据进行分组，能够在同一行中同时返回基

zycchun 2020-03-15

Django学习路17_聚合函数(Avg平均值,Count数量,Max最大,Min最小,Sum求和)基本使用

创建消费者数据表 Customer. 不要忘记在 urls.py 中进行注册。此时获取姓名即可,不用获取价格。from django.db.models import Max, Min, Sum, Count, Avg

Lius 2020-05-11

数据库（学习整理）Oracle多表查询，三种join连接

group by 执行之后才会执行having 、select中没有使用聚合函数的字段名必须写在这里。having 语句可以写在group by 之前，不会报错，但是实际上执行的顺序还是先执行group by 后执行having子句。from 表1

wenjieyatou 2020-05-08

MYSQL查询--聚合函数查询

聚合函数的最大特点是它们根据一组数据求出一个值。聚合函数的结果值只根据选定行中非NULL的值进行计算，NULL值被忽略。COUNT()函数，对于除“*”以外的任何参数，返回所选择集合中非NULL值的行的数目；对于参数“*”，返回选择集合中所有行的数目，包含

xuanlvhaoshao 2020-02-20

elasticsearch之聚合函数

如果我们只想看平均值 my_avg 的结果怎么做？需求: 查询所有人的年龄段，并且按照15-20，20--25，25-30 分组，并计算每组的平均年龄

李玉志 2020-02-02

MySQL之分组查询（GROUP BY）

在 MySQL SELECT 语句中，允许使用 GROUP BY 子句，将结果集中的数据行根据选择列的值进行逻辑分组，以便能汇总表内容的子集，实现对每个组而不是对整个结果集进行整合。可以指定多个列，彼此间用逗号分隔。GROUP BY 子句可以包含任意数目的

ztyzly00 2020-01-12

pandas rolling对象的自定义聚合函数

利用自定义的聚合函数, 把它应用到pandas的滚动窗长对象上,upvar = sum /nSD #计算上行波动率。downvar= sum/nSD #计算下行波动率

jiahaohappy 2019-12-29

mysql group by 的用法解析

group by的常规用法是配合聚合函数，利用分组信息进行统计，常见的是配合max等聚合函数筛选数据后分析，以及配合having进行筛选后过滤。这条sql的含义很明确，将数据按照grade字段分组，查询每组最大的user_id以及当前组内容。第一条数据id

herohope 2019-12-22

mysql课外积累

BLOB是一个二进制对象，可以容纳可变数量的数据。BLOB和TEXT类型之间的唯一区别在于对BLOB值进行排序和比较时区分大小写，对TEXT值不区分大小写。指出MySQL能使用哪个索引在表中找到行，查询涉及到的字段上若存在索引，则该索引将被列出，但不一定被

阿亮 2019-10-31

TiDB 源码阅读系列文章（二十一）基于规则的优化 II

聚合消除聚合消除会检查 SQL 查询中 Group By 语句所使用的列是否具有唯一性属性，如果满足，则会将执行计划中相应的 LogicalAggregation 算子替换为 LogicalProjection 算子。下面举一些具体的例子。

落地窗前梦残夜 2019-06-29

django开发-聚合函数的使用

在django开发中，获取一些统计数据时，需要用到model中的聚合函数；下面就聊一下django中跟统计、聚合有关的方法。SELECT `orders_detail`.`food_id`, COUNT AS `order__count` FROM `or

tuxlcsdn 2019-06-28

写一个“特殊”的查询构造器 - (五、聚合函数、分组、排序、分页)

Depth 2019-06-27

浅谈sql语句中GROUP BY 和 HAVING的使用方法

在介绍GROUP BY 和 HAVING 子句前，我们必需先讲讲sql语言中一种特殊的函数：聚合函数，例如SUM, COUNT, MAX, AVG等。这些函数和其它函数的根本区别就是它们一般作用在多条记录上。这里的SUM作用在所有返回记录的populati

世樹 2019-05-22

mongoDB中聚合函数java处理示例详解

最近在做项目的时候碰到一个对mongoDB的数据处理，从MongoDB中拿到内嵌文档的时间排序的list。一开始考虑到直接对mongoDB中的属性排序，后面发现属性存在内嵌文档中，所以处理中需要用到聚合函数。而不是像以前一样，解决问题了就万事大吉，抛之脑后

LinoHngJie 2019-04-16

SQL中WHERE和HAVING子句的区别？

WHERE和HAVING子句之间的主要区别在于与GROUP BY子句一起使用时，在这种情况下，WHERE用于在分组之前过滤行，HAVING用于在分组后排除记录。这是最重要的区别，如果你还记得这个，它将帮助你编写更好的SQL查询。这也是要理解的重要SQL概念

programmerv 2019-06-20

oracle常用分析函数与聚合函数的用法

今天是2019年第一天，在此祝大家新年快乐，梦想还在路上，让我们继续加油！应之前的计划，今天完成这篇记录，也借此记录自己的成长。rank() 是排名的函数，该函数组内排序后会进行跳号，分数相同的作为并列。row_number() 可以通过over 根据某字

异道 2019-01-07

MySQL之Where和Having的区别

对于使用where和having，相信很多人都有过困扰，今天就来讲一下我对where和having的认识：。Where是一个约束声明，在查询数据库的结果返回之前对数据库中的查询条件进行约束，即在结果返回之前起作用，且where后面不能使用聚合函数。所谓聚合

mrandy 2019-02-10

Hive OLAP多维聚合函数

Hive OLAP多维聚合函数是增强版的Group By语句。一般和Group By同时使用，用来进行多维分析。本文总结Hive三种常用的多维聚合函数:With Cube 任意维度聚合、Grouping Sets 指定维度聚合、With Rollup 层级

Jinnan 2018-09-24

安科网

MySQL中聚合函数count的使用和性能优化技巧

MySQLHD

MySQLHD

相关推荐

MySQL约束

[LeetCode]1084. 销售分析III（Mysql，having+聚合函数）

SQL中的开窗函数详解可代替聚合函数使用

Django学习路17_聚合函数(Avg平均值,Count数量,Max最大,Min最小,Sum求和)基本使用

数据库（学习整理）Oracle多表查询，三种join连接

MYSQL查询--聚合函数查询

elasticsearch之聚合函数

MySQL之分组查询（GROUP BY）

pandas rolling对象的自定义聚合函数

mysql group by 的用法解析

mysql课外积累

TiDB 源码阅读系列文章（二十一）基于规则的优化 II

django开发-聚合函数的使用

写一个“特殊”的查询构造器 - (五、聚合函数、分组、排序、分页)

浅谈sql语句中GROUP BY 和 HAVING的使用方法

mongoDB中聚合函数java处理示例详解

SQL中WHERE和HAVING子句的区别？

oracle常用分析函数与聚合函数的用法

MySQL之Where和Having的区别

Hive OLAP多维聚合函数

MySQLHD