-
- 需求
- 现有方案
- 进展
- 实现
- 验证
查看K8S集群被探针检测重启的pod什么时间段,因为什么重启了,把所有的pod状态持久化到ES服务。
现有方案如果环境中只有一种探针方式(HTTP),可以通过Prometheus+grafana来监控pod的可用状态数量,来达到pod什么时间被重启了,原因当然就HTTP方式检测状态码失败导致的。
如果环境中存在多种探针方式(HTTPS、HTTP、TCP),再加上kubernetes目前events事件保留一个小时,超时后就查不到events事件了,我们可以把events做到持久化数据,进阶需求可以做一个企业微信通知
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)