sql 优化的一般策略:索引优化,sql 改写,参数优化,优化器
索引优化
以select * from vvshop_order.vv_order where receive_phone='151011324532';
为例分析
explain select * from vv_order where order_no=23;
结果:
分析:可以看到该 sql 扫描全表 30 多万记录,可以通过添加索引优化
alter table vv_order add index orderno_idx(order_no);
注意点:
- 当传入的数据类型和库表数据类型不一致时,索引会失效
- 不要为每个查询字段建立单独的索引,应该根据实际需要建立单列索引或者组合索引
- 通过 explain+extended 检查 sql 的执行计划,是否使用索引,是否发生隐式转换
- 避免在查询条件中使用函数
sql 改写
分页优化
原 sql select * from buyer where sellerid=100 limit 100000,5000
, limit M, N 写法中,M 越大,性能越差,可以改写为
select t1.* from buyer t1,
(select id from buyer sellerid=100 limit 100000,5000) t2
where t1.id=t2.id;
子查询优化
-
查询数量较多时,in 改为 exist,或者优化为如下的形式
SELECT first_name FROM employees emp, (SELECT emp_no FROM salaries_2000 WHERE salary = 5000) sal WHERE emp.emp_no = sal.emp_no;
- 避免查询返回所有字段,只返回需要的字段数据
不使用 select *
or 改写为 in
or 的效率事 n,in 的效率是 log(n),控制 in 数量在 200 以内
不使用函数和触发器,通过应用程序实现
少用 join,保证字段类型一直再 join 或比较
连续数值 使用 between
参数优化
优化器
其他
影响 in 是否生效的因素
-
eq_range_index_dive_limit
参数默认为 10
eq_range_index_dive_limit = 0 只能使用 index dive
0 < eq_range_index_dive_limit <= N 使用 index statistics
eq_range_index_dive_limit > N 只能使用 index dive
字段
- 根据实际使用情况设置字段类型
- 单表不要有太多字段,建议 20 以内
- 避免使用 null 字段,优化较难且额外占用索引空间
- 用整型来存 IP
系统参数调优
基准测试工具
- sysbench:模块化,跨平台以及多线程的性能测试工具
- iibench-mysql:基于 java 的插入性能测试工具
- tpcc-mysql:Percona 开发的 TPC-C 测试工具
这里介绍一些比较重要的参数:
back_log
backlog 值指出在 MySQL 暂时停止回答新请求之前的短时间内多少个请求可以被存在堆栈中。也就是说,如果 MySql 的连接数据达到 maxconnections 时,新来的请求将会被存在堆栈中,以等待某一连接释放资源,该堆栈的数量即 backlog,如果等待连接的数量超过 backlog,将不被授予连接资源。可以从默认的 50 升至 500
wait_timeout
数据库连接闲置时间,闲置连接会占用内存资源。可以从默认的 8 小时减到半小时
maxuserconnection
最大连接数,默认为 0 无上限,最好设一个合理上限 thread_concurrency:并发线程数,设为 CPU 核数的两倍
skipnameresolve
禁止对外部连接进行 DNS 解析,消除 DNS 解析时间,但需要所有远程主机用 IP 访问
keybuffersize
索引块的缓存大小,增加会提升索引处理速度,对 MyISAM 表性能影响最大。对于内存 4G 左右,可设为 256M 或 384M,通过查询 show status like’keyread%’,保证 keyreads / keyreadrequests 在 0.1% 以下最好
innodbbufferpool_size
缓存数据块和索引块,对 InnoDB 表性能影响最大。通过查询 show status like ‘Innodbbufferpoolread%’,保证 (Innodbbufferpoolreadrequests – Innodbbufferpoolreads)/ Innodbbufferpoolreadrequests 越高越好
innodbadditionalmempoolsize
InnoDB 存储引擎用来存放数据字典信息以及一些内部数据结构的内存空间大小,当数据库对象非常多的时候,适当调整该参数的大小以确保所有数据都能存放在内存中提高访问效率,当过小的时候,MySQL 会记录 Warning 信息到数据库的错误日志中,这时就需要该调整这个参数大小
innodblogbuffer_size
InnoDB 存储引擎的事务日志所使用的缓冲区,一般来说不建议超过 32MB
querycachesize
缓存 MySQL 中的 ResultSet,也就是一条 SQL 语句执行的结果集,所以仅仅只能针对 select 语句。当某个表的数据有任何任何变化,都会导致所有引用了该表的 select 语句在 Query Cache 中的缓存数据失效。所以,当我们的数据变化非常频繁的情况下,使用 Query Cache 可能会得不偿失。根据命中率 (Qcachehits/(Qcachehits+Qcache_inserts)*100)) 进行调整,一般不建议太大,256MB 可能已经差不多了,大型的配置型静态数据可适当调大.
可以通过命令 show status like ‘Qcache_%’ 查看目前系统 Query catch 使用大小
readbuffersize
MySql 读入缓冲区大小。对表进行顺序扫描的请求将分配一个读入缓冲区,MySql 会为它分配一段内存缓冲区。如果对表的顺序扫描请求非常频繁,可以通过增加该变量值以及内存缓冲区大小提高其性能
sortbuffersize
MySql 执行排序使用的缓冲大小。如果想要增加 ORDER BY 的速度,首先看是否可以让 MySQL 使用索引而不是额外的排序阶段。如果不能,可以尝试增加 sortbuffersize 变量的大小
readrndbuffer_size
MySql 的随机读缓冲区大小。当按任意顺序读取行时(例如,按照排序顺序),将分配一个随机读缓存区。进行排序查询时,MySql 会首先扫描一遍该缓冲,以避免磁盘搜索,提高查询速度,如果需要排序大量数据,可适当调高该值。但 MySql 会为每个客户连接发放该缓冲空间,所以应尽量适当设置该值,以避免内存开销过大。
record_buffer
每个进行一个顺序扫描的线程为其扫描的每张表分配这个大小的一个缓冲区。如果你做很多顺序扫描,可能想要增加该值
threadcachesize
保存当前没有与连接关联但是准备为后面新的连接服务的线程,可以快速响应连接的线程请求而无需创建新的
table_cache
类似于 threadcachesize,但用来缓存表文件,对 InnoDB 效果不大,主要用于 MyISAM
References
阿里云慢 SQL 优化挑战大赛分析
SQL 优化器原理 – 查询优化器综述
MYSQL 查询 SQL 语句性能优化方法
MySQL–eq_range_index_dive_limit 参数学习
MySQL SQL 优化之 in 与 range 查询【转】
本文由 歧途老农 创作,采用 CC BY 4.0 CN 协议 进行许可。可自由转载、引用,但需署名作者且注明文章出处。如转载至微信公众号,请在文末添加作者公众号二维码。