故障分析-一次因为超过最大连接数的登陆限制

1次阅读

共计 1982 个字符,预计需要花费 5 分钟才能阅读完成。

作者:王翔飞
爱可生研发团队测试成员,负责数据库治理平台的测试工作。
本文起源:原创投稿
* 爱可生开源社区出品,原创内容未经受权不得随便应用,转载请分割小编并注明起源。


本文关键字:最大连接数、TCP 协定、MySQL 协定、参数配置

景象

在测试某性能时,将 mysql 的最大连接数设置为 120,应用 sysbench 并发 200 插入数据,

上述谬误是预期内的后果,因为 sysbench 的 200 个并发超过了 mysql 实例最大连接数;

随后,批改 sysbench 并发数为 100(小于最大连接数),再次插入数据,失败报错,并发数曾经小于最大连接数了,为什么还报错,报错信息如下:

应用用户 test 独自登录实例,和下面报一样的谬误:

之前失常的能够登录的用户 test,当初无奈登录了。

起因和解决办法

起初,并不理解是什么起因造成的登录失败。查问官网文档理解到,是用户的谬误的连接数超过了设置的最大值,这个最大值参数是 max_connect_errors。

解决办法很简略:执行 flush hosts

官网解释:https://dev.mysql.com/doc/ref…

剖析

对于这个参数 max_connect_errors 之前并不理解,查阅网上文档提到,应用谬误明码屡次登录并不能模仿失败连贯。尝试将此参数批改为 2,而后应用谬误明码登录 2 次,后续再登录仍然胜利。看来应用谬误明码的确不能模仿失败连贯。

查阅官网文档理解到,在 Performance Schema 库表 host_cache 里会保留客户端的连贯信息,其中字段 SUM_CONNECT_ERRORS 就是记录连贯的谬误次数,一旦 SUM_CONNECT_ERRORS 的值达到 max_connect_errors 设定的值,来自此客户端的连贯就会被阻止。SUM_CONNECT_ERRORS 的官网形容:The number of connection errors that are deemed“blocking”(assessed against the max_connect_errors system variable). Only protocol handshake errors are counted, and only for hosts that passed validation (HOST_VALIDATED = YES).

能够看到这里指的是协定握手谬误的次数。

官网链接:
https://dev.mysql.com/doc/ref…

上面应用 telnet 来模仿协定的握手谬误次数:

配置最大谬误连贯谬误数为 2,查看库表 Performance Schema.host_cache 的 SUM_CONNECT_ERRORS

这里 SUM_CONNECT_ERRORS 初始值为 0;

注:另一个参数 count_authentication_errors 是尝试谬误明码登录的次数(这里的 2 就是之前尝试谬误明码登录的次数)。

在客户端主机上应用 telnet 尝试 2 次端口探测,

再次查看该主机的 SUM_CONNECT_ERRORS 变成了 2。

此时问题复现,客户端登录实例被回绝,因为谬误连贯次数达到了最大值 2。

回到本文最开始的问题,sysbench 并发 200 超过最大连接数 max_connections=120 时,

因为 max_connect_errors 的缺省值是 100,sysbench 并发 200 造成了 109 个谬误连贯,这就超过了谬误连贯的最大值,所以后续连贯就报错了。

另外,为什么谬误连接数 SUM_CONNECT_ERRORS 是 109,是因为此环境实例曾经存在来自其余客户端的 11 个失常连贯(通过 show processlist 可见),那么只剩下 120-11=109 个可用连贯,sysbench 的 200 个并发,只承受了 109 个而后就协定握手失败,所以造成了 109 个谬误连贯。

延长

官网提到谬误连贯指的是协定的握手失败次数,并未明确阐明是哪个协定,是 TCP/IP 还是应用层的 MySQL 协定?

对于 TCP/IP 通信,首先是 TCP 协定的三次握手,因为客户端曾经胜利收到了服务端返回的报错:error 1040: Too many connections,TCP 握手曾经胜利实现了,所以这里的协定应该指的是 MySQL 的握手协定。

这里能够通过抓包来验证:

上述前三个包是残缺的 TCP 握手协定包,曾经实现了 TCP 的握手协定,前面 MySQL 协定服务端发送完 HandShake 信息之后单方就敞开了连贯,客户端并未持续发送登录认证包,造成 MySQL 的协定握手失败。所以这里指的是 MySQL 的协定握手失败次数。

针对下面利用 telnet 来模仿协定握手失败的例子,因为 telnet 只是发送了 TCP 的握手包,并不会发送 MySQL 登录认证包,服务器端期待 10 秒(mysql 的 connect_timeout=10)就敞开了连贯,所以才造成 MySQL 的握手失败。

正文完
 0