编程知识 cdmana.com

MySQL实战45讲 学习笔记(七)

count(*) 速度问题

  1. MyISAM 引擎把一个表的总行数存在了磁盘上,因此执行 count() 的时候会直接返回这个数
  2. InnoDB 引擎执行 count() 的时候,需要把数据一行一行地从引擎里面读出来,然后累积计数
    innodb由于多版本并发控制(MVCC)的原因,多个事务count的行数不同,所以不能保存总行数。
    但count(*)做了优化,引擎会选择最小的普通索引树,来计数。而不是直接统计聚集索引树。

提高count性能

用缓存系统保存计数

缺点:

  1. 缓存会丢失
  2. 缓存不准确,因为缓存计数和插入数据不是原子操作,有可能在中间过程,其他事务读取了数据。

在数据库中计数

可以解决一致性视图问题

不同count用法

  1. 对于 count(主键 id) 来说,InnoDB 引擎会遍历整张表,把每一行的 id 值都取出来,返回 server 层。server 层拿到 id 后,判断是不可能为空的,就按行累加。
  2. 对于 count(1) 来说,InnoDB 引擎遍历整张表,但不取值。server 层对于返回的每一行,放一个数字“1”进去,判断是不可能为空的,按行累加。
    count(1) 执行得要比 count(主键 id) 快。从引擎返回 id 会涉及到解析数据行,以及拷贝字段值的操作
  3. 对于 count(字段) 来说:
    如果这个“字段”是定义为 not null 的话,一行行地从记录里面读出这个字段,判断不能为 null,按行累加;
    如果这个“字段”定义允许为 null,那么执行的时候,判断到有可能是 null,还要把值取出来再判断一下,不是 null 才累加。
  4. count(),并不会把全部字段取出来,而是专门做了优化,不取值。count() 肯定不是 null,按行累加
    按照效率排序的话,count(字段)<count(主键 id<count(1)≈count(),所以建议尽量使用 count()。

版权声明
本文为[ordinaryBlog]所创,转载请带上原文链接,感谢
https://blog.csdn.net/kang2411212/article/details/120814797

Scroll to Top