关于mysql:MySQL配置再学习

简介

之前这篇文章MySQL配置根底简要阐明了MySQL的配置根底，包含配置文件的地位、配置项的分段、配置变量的失效、以及配置变量和状态变量的查看，对MySQL的配置有了一个根底。
当初则会进一步理解更多底层原理，搞清楚更多配置的含意和作用。

本文为《高性能MySQL》读书笔记，配合文档查阅更佳： https://dev.mysql.com/doc/refman/5.7/en/server-system-variables.html

InnoDB IO配置

InnoDB 事务日志：

InnoDB在每个事务提交的时候，不会把缓冲池的内容立刻刷到磁盘。而是从缓冲池将事务记录到事务日志中，输入日志(长久化)，再由事务日志实现写磁盘的操作。
事务日志会把数据文件的随机I/O转换成简直程序的I/O，而且把刷新到磁盘的操作转移到后盾，从而让查问更快。
事务日志有固定的大小，采纳环形形式写（写到开端时跳转到结尾持续写）。定期将缓冲池传来的事务通过日志形式长久化，再将脏数据刷到磁盘中。

缓冲池 <--> 事务日志 <--> 磁盘

先将事务变成日志，写入磁盘(长久化)，再缓缓依据日志内容写入磁盘。

事务日志的配置：

事务日志依赖innodb_log_file_size和innodb_log_files_in_groups这两个变量。前者申明每个日志文件的大小，后者申明日志文件的个数。
InnoDB会应用多个日志文件作为循环日志（1号文件写完了写2号，2号写完了写1号）

默认是50M，2个文件。共100M。倡议增大单个文件的大小，依然应用2个文件。(本文应用MySQL 8.0.21 不同版本默认参数可能不统一)

mysql> show variables where variable_name like "%inno%log_file%";+---------------------------+----------+| Variable_name             | Value    |+---------------------------+----------+| innodb_log_file_size      | 52428800 || innodb_log_files_in_group | 2        |+---------------------------+----------+

事务日志自身的写入缓存：

事务日志，将事务写入日志文件的时候，也并不是间接写入的，而是应用写入缓存。先写入缓存中，再由缓存定期写入文件。由innodb_log_buffer_size 参数决定应用写入缓存大小。
以下3个条件，满足任一条件就会刷新缓存到日志文件中。

每隔1秒
写入缓存满
有事务提交

MySQL 8.0.21 默认大小为16M。因为最长每1秒会刷新一次写入缓存，所以这个参数不必设置的过大，只须要超过每秒产生的事务量即可。

mysql> show variables where variable_name like "%inno%log_b%";+------------------------+----------+| Variable_name          | Value    |+------------------------+----------+| innodb_log_buffer_size | 16777216 |+------------------------+----------+

InnoDB和文件系统的交互方式

InnoDB和磁盘的读写交互都通过innodb_flush_method来抉择。次要有如下几种：

fdatasync
O_DIRECT
O_DSYNC

1、fdatasync()：和fsync()相似，然而只刷新文件数据自身，不包含元数据。而且，这个选项会应用应用双重缓冲（包含操作系统这一层的缓存）
2、O_DIRECT：仍然应用fsync()来刷新文件到磁盘，然而会敞开操作系统缓存，告知操作系统不要缓存且不要预读。（所有读写都间接达到存储设备，防止双重缓冲）

这个设置只会影响操作系统，不会影响RAID卡的预读。
如果应用这个选项，最好应用带预读的RAID卡，且关上写回(write_back)

3、O_DSYNC
这个选项会使所有写同步，或者说，只有数据确切写到磁盘后，写操作才会返回。
每个write()或pwrite()操作都会函数实现前将数据同步到磁盘，且这个过程是阻塞的。[而fsync()容许积攒写操作到缓存，再一次性刷新数据。]

https://dev.mysql.com/doc/refman/5.7/en/innodb-parameters.html#sysvar_innodb_flush_method

更多可参考：https://www.cnblogs.com/CNty/p/10943626.html
InnoDB I/O配置文档：https://dev.mysql.com/doc/refman/5.7/en/optimizing-innodb-diskio.html

InnoDB 表空间配置【施工中】

双写缓冲(DoubleWrite)配置【施工中】

MySQL 高并发【施工中】

呈现高并发时，如何发现问题？

呈现高并发时，如何取得更好的性能？

线程进入内核阶段-并发瓶颈；

innodb_thread_concurrency：限度一次性能够有多少线程进入内核。（0示意不限度

推荐值：并发值 = CPU 数量 * 磁盘数量 * 2【理论倡议设置稍小的值，再行调整

两段解决：

如果已进入内核的线程过多，则新线程无奈进入内核。会应用两段解决：

两段解决能够缩小操作系统导致的上下文切换。

1、如果未能进入内核，则开始第一次休眠，工夫为：innodb_thread_sleep_delay。休眠完结后重试。

2、如果仍未进入内核，则将这个线程退出一个期待线程队列，让操作系统解决。

【如果有很多小查问，innodb_thread_sleep_delay能够思考适当减小。这相当于10毫秒的查问延时。

提交阶段-并发瓶颈：
innodb_commit_concurrency：同一时间提交的线程的数量下限。
线程池？

平安和稳固配置

expire_logs_days：如果应用Binlog就应该关上，保留二进制日志的天数。清理过期的日志。依据理论状况，在保障备份的状况上来配置。（被动申明的意义在于，防止二进制日志打满磁盘，如果有须要，能够增长保留工夫）
max_allowed_packet：禁止服务器收发过大的数据包。
max_connect_errors：如果某个主机间断x个连贯失败，则会被BAN掉。一旦被BAN，只能命令刷新缓存能力解除。不倡议设置的过小，免得呈现所有应用程序被BAN的状况。
https://dev.mysql.com/doc/refman/5.7/en/server-system-variables.html#sysvar_max_connect_errors
skip_name_resolve：敞开DNS查找。MySQL在连贯时，会正向/反向查DNS，确认连贯主机的主机名，依据理论状况判断是否敞开。

备库相干配置

read_only：备库强烈建议开启只读，只承受从主库传输过去的变更。
skip_slave_start：阻止MySQL主动启动复制，如果备库呈现问题重启，相对不能主动复制，要手动确认查看后才可。
slave_net_timeout：备库连贯主库失败时，重连前等待时间.默认60分钟太长了，倡议改为1分钟或者更短。

备库日志同步写磁盘相干：
【这3个变量都是动静变量，一旦设置，会立刻对所有备库失效。】

sync_master_info：每有x个事件产生，就将 master.info 向磁盘同步写一次。【应用fdatasync() 】
https://dev.mysql.com/doc/refman/5.7/en/replication-options-replica.html#sysvar_sync_master_info
sync_relay_log：每有x个事件被写入relay log，就将 relay log 向磁盘同步写一次。【应用fdatasync() 】
https://dev.mysql.com/doc/refman/5.7/en/replication-options-replica.html#sysvar_sync_relay_log
sync_relay_log_info：与上一个相似，每x个事件产生后，就将 relay-log.info 向磁盘同步写一次。
https://dev.mysql.com/doc/refman/5.7/en/replication-options-replica.html#sysvar_sync_relay_log_info

其余常见配置

tmp_table_size和max_heap_table_size:
如果隐式内存长期表超过这两个设置，则会转换为硬盘表。须要关注Created_tmp_disk_tables和Created_tmp_tables，这两个磁盘长期表状态，来确认。
这两个参数能够简略的配置为一样的大小，不倡议设置的过大。如果长期表过大，应用磁盘比应用硬盘好，省得内存溢出。
max_connections
更像是紧急刹车，保障数据库不会因为应用程序连接数突增导致本身不堪重负。（爱护数据库自身）当呈现问题，导致新建过多新连贯时，把多余的谬误链接回绝掉，是一种疾速、低代价的失败形式。
这个参数应该设置的足够高（能够解决失常状况下的负载，服务失常运行），其次也要足够平安（保障能够登录上服务器，进行保护操作）
比方，失常状况下有300连接数，那么这个值必然不能低于300（保障服务失常运行），能够思考400~500.
Max_used_connections：这个状态是最高连接数的值。同时还有一个Max_used_connections_time，申明工夫。
你能够分明的晓得，连接数的峰值在什么时候。
thread_cache_size
线程缓存要依据理论状态来制订。比方Threads_connected、Threads_created、Threads_cached。
能够依据正在连接中的线程数来估测缓存大小。如果每秒创立的线程数很多或者每秒创立的线程越来越多，那么就须要增大缓存。有时候，也须要依据曾经缓存了的线程数来判断缓存大小是否适合。
table_cache_size
表缓存倡议配置的足够大，防止须要常常从新关上、从新解析表定义。（如果表不是很多，齐全能够配置一个大的表缓存，把所有表构造都缓存了。
相干状态：Opened_tables，如果已关上的表始终在增长，倡议适当增大表缓存。
值举荐：1、不倡议这个值超过10 000。2、倡议从连接数的10倍开始调整。