解决k8s MysqlCluster 无故重启问题

解决k8s MysqlCluster 无故重启问题,第1张

使用 bitpoke的mysql-operator 作为k8s的mysql服务,使用的版本v0.4.0,

github地址:https://github.com/bitpoke/mysql-operator

MysqlCluster operator主要支持如下功能

建立的mysql服务每隔一段时间就重启,事件的报错信息如下

为什么心跳不通过?

貌似心跳机制不通过,查看pod信息

心跳默认20秒不通过,就重启,看源码也没有心跳配置项,坑啊,不过这只是表象,到底是什么导致心跳不通过?

mysqlCluster启动时,会启动4个容器metrices-exporter, mysql, pt-heartbeat, sidecar。看这4个容器的cpu, 内存使用情况,发现mysql内存超过,如下:

看最后状态,OOMKilled,而且当前内存使用率3.9G 接近limit 4G的设置。 找到产生的问题原因了,是因为内存超了,被容器杀掉,导致心跳不通过报错重启

为什么内存使用这么高?

思考mysql使用内存高,可能跟mysql自身缓存有关系,查内存相关参数

看到 innodb_buffer_pool_size 设置得值特别大,这个参数设置只有主要缓存innodb表的索引,数据,插入数据时的缓冲,但默认是8M。

为什么 innodb_buffer_pool_size 设置变得这么大?

翻翻mysqlCluster源码,跟innodb_buffer_pool_size 有关代码

default.go

问题就在这里,为了保证资源独占,mysql设置时是request = limit,因为自动计算导致 innodb-buffer-pool-size过大,最终导致oom,需要手动设置innodb-buffer-pool-size,就手动设置2G吧

设置 innodb-buffer-pool-size 不生效?

设置后,pod不重启? 参数没有生效设置。设另一个512M就生效了。尝试加入引号,作为字符串处理,配置开始生效。难道跟类型有关系? 继续看相关源码

default.go

看这个类型定义cluster.Spec.MysqlConf

MysqlClusterSpec

intstr

如果设置成数字,则整数是int32位

看int32位的长度

int32 the set of all signed 32-bit integers (-2147483648 to 2147483647)

至此内存使用过大的问题,解决了,内存使用也降下来了

1.MySQL Cluster的技术复杂度太高,毕竟是Share-Nothing的分布式数据库产品,支持分布式事务,以及完全透明等;

2.MySQL Cluster的索引数据必须基于内存,元数据也是7.2版本才推出基于列的模式允许存储在磁盘上,这个功能其实没啥意义,要是能做到基于行的模式依据冷热,那就完全不一样;

3.MySQL Cluster的业务场景限制,最大的优点也是最致命的缺点,比如跨节点的JOIN,所以一直在提升这方面的算法和数据同步,对网络环境要求太高;

4.MySQL Cluster同NoSQL产品比较,以及去做NoSQL产品的事情,是一种自我定位失败;

5.国内非常缺乏这方面的技术人才,也缺乏实战的业务场景,故必须先对这些研究透彻和丰富解决方案才可行,以及需要有这方面的第三方公司,毕竟甲骨文在国内是没有任何技术服务团队的

1.MySQL Cluster的技术复杂度太高,毕竟是Share-Nothing的分布式数据库产品,支持分布式事务,以及完全透明等; 2.MySQL Cluster的索引数据必须基于内存,元数据也是7.2版本才推出基于列的模式允许存储在磁盘上,这个功能其实没啥意义,要是能做


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/8782399.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-21
下一篇 2023-04-21

发表评论

登录后才能评论

评论列表(0条)

保存