故障分析 | 一次因为超过最大连接数的登陆限制

故障分析 | 一次因为超过最大连接数的登陆限制,第1张

在测试某功能时,将 mysql 的最大连接数设置为 120,使用 sysbench 并发 200 插入数据,

上述错误是预期内的结果,因为 sysbench 的 200 个并发超过了 mysql 实例最大连接数;

随后,修改 sysbench 并发数为 100(小于最大连接数),再次插入数据,失败报错,并发数已经小于最大连接数了,为什么还报错,报错信息如下:

使用用户 test 单独登录实例,和上面报一样的错误:

之前正常的可以登录的用户 test,现在无法登录了。

起初,并不了解是什么原因造成的登录失败。查询官网文档了解到,是用户的错误的连接数超过了设置的最大值,这个最大值参数是 max_connect_errors。

解决方法很简单:执行 flush hosts

对于这个参数 max_connect_errors 之前并不了解,查阅网上文档提到,使用错误密码多次登录并不能模拟失败连接。尝试将此参数修改为 2,然后使用错误密码登录 2 次,后续再登录依然成功。看来使用错误密码确实不能模拟失败连接。

查阅官网文档了解到,在 Performance Schema 库表 host_cache 里会保存客户端的连接信息,其中字段 SUM_CONNECT_ERRORS 就是记录连接的错误次数,一旦 SUM_CONNECT_ERRORS 的值达到 max_connect_errors 设定的值,来自此客户端的连接就会被阻止。SUM_CONNECT_ERRORS 的官网描述:The number of connection errors that are deemed “blocking” (assessed against the max_connect_errors system variable). Only protocol handshake errors are counted, and only for hosts that passed validation (HOST_VALIDATED = YES).

可以看到这里指的是协议握手错误的次数。

下面使用 telnet 来模拟协议的握手错误次数:

配置最大错误连接错误数为 2,查看库表 Performance Schema.host_cache 的 SUM_CONNECT_ERRORS

这里 SUM_CONNECT_ERRORS 初始值为 0;

注:另一个参数 count_authentication_errors 是尝试错误密码登录的次数(这里的 2 就是之前尝试错误密码登录的次数)。

在客户端主机上使用 telnet 尝试 2 次端口探测,

再次查看该主机的 SUM_CONNECT_ERRORS 变成了 2。

此时问题复现,客户端登录实例被拒绝,因为错误连接次数达到了最大值 2。

回到本文最开始的问题,sysbench 并发 200 超过最大连接数 max_connections=120 时,

由于 max_connect_errors 的缺省值是 100,sysbench 并发 200 造成了 109 个错误连接,这就超过了错误连接的最大值,所以后续连接就报错了。

另外,为什么错误连接数 SUM_CONNECT_ERRORS 是 109,是因为此环境实例已经存在来自其他客户端的 11 个正常连接(通过 show processlist 可见),那么只剩下 120-11=109 个可用连接,sysbench 的 200 个并发,只接受了 109 个然后就协议握手失败,所以造成了 109 个错误连接。

官网提到错误连接指的是协议的握手失败次数,并未明确说明是哪个协议,是 TCP/IP 还是应用层的 MySQL 协议?

对于 TCP/IP 通信,首先是 TCP 协议的三次握手,因为客户端已经成功收到了服务端返回的报错:error 1040: Too many connections,TCP 握手已经成功完成了,所以这里的协议应该指的是 MySQL 的握手协议。

这里可以通过抓包来验证:

上述前三个包是完整的 TCP 握手协议包,已经完成了 TCP 的握手协议,后面 MySQL 协议服务端发送完 HandShake 信息之后双方就关闭了连接,客户端并未继续发送登录认证包,造成 MySQL 的协议握手失败。所以这里指的是 MySQL 的协议握手失败次数。

针对上面利用 telnet 来模拟协议握手失败的例子,由于 telnet 只是发送了 TCP 的握手包,并不会发送 MySQL 登录认证包,服务器端等待 10 秒(mysql 的 connect_timeout=10)就关闭了连接,所以才造成 MySQL 的握手失败。

如果你能确定,它只对IP限制的话,这事儿好办。

PPOE拨号,每次拨号都会获取一个新的IP地址。但有的运营商不分配公网的IP,这你要根据你当地的情况来看。

你可以试一下。

用session的话,除非你把session做成常驻内存的,没有过期时间,session是有生命周期的!!!

如果你的服务器有redis那就采用redis,如果没有就用数据库来存储


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/6143210.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-16
下一篇 2023-03-16

发表评论

登录后才能评论

评论列表(0条)

保存