统计数据的需要在咱们日常开发中是非常容易遇到了,MySQL 也反对多种的计算的函数,
接下来咱们来看一看他们之间有什么区别,以及他们是否存在一些坑。
count(*)、count(1)、count(id) 的区别
count 的含意:count() 是一个聚合函数,对于返回的后果集,一行行地判断,如果 count 函数的参数不是 NULL,累计值就加 1,否则不加。最初返回累计值。
count(字段)比拟非凡,则示意返回满足条件的数据行外面,参数“字段”不为 NULL 的总个数
剖析性能差异准则
server 层要什么就给什么;
InnoDB 只给必要的值;
当初的优化器只优化了 count(*) 的语义为“取行数”,其余“不言而喻”的优化并没有做
例子:
count(主键 id) 来说,InnoDB 引擎会遍历整张表,把每一行的 id 值都取出来,返回给 server 层。server 层拿到 id 后,判断是不可能为空的,就按行累加。
count(1) 来说,InnoDB 引擎遍历整张表,但不取值。server 层对于返回的每一行,放一个数字“1”进去,判断是不可能为空的,按行累加。
count(字段),server 要字段,就返回字段,如果字段为空,就不做统计,字段的值过大,都会造成效率低下。
效率排序
count(字段)<count(主键 id)<count(1)≈count(*)
为什么 count(*) 最快?
优化器做了工作,找到最小的数来遍历。
InnoDB 是索引组织表,主键索引树的叶子节点是数据,而一般索引树的叶子节点是主键值。所以,一般索引树比主键索引树小很多。对于 count(*) 这样的操作,遍历哪个索引树失去的后果逻辑上都是一样的。因而,MySQL 优化器会找到最小的那棵树来遍历。在保障逻辑正确的前提下,尽量减少扫描的数据量,是数据库系统设计的通用法令之一。
对于 NULL 的几个坑
// 数据中存在 null 值数据 select count(*) from audit_log a; 后果:1
select count(id) from audit_log a; 后果:0
咱们看到 count 的后果不统一,记录数应该是 1,count(id) 却等于 0
这是因为 count(字段) 是不统计,字段值为 null 的值
所以在字段为非空字段的状况下,须要应用 count(*) 来解决这个问题。