曾经做过几次大规模服务器监控,下面推荐几款监控软件和辅助软件。
1zabbix一款老牌经典的监控软件。是一个企业级的分布式开源监控方案。能够实时监控从成千上万台服务器、虚拟机和网络设备中收集到的数以百万计的指标。
提供图形 *** 作界面,可以方便的添加监控指标、告警指标。支持邮件、微信等的告警通知。
2Prometheus,近些年监控方面的当红炸子鸡,Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB)。Prometheus使用Go语言开发,是GoogleBorgMon监控系统的开源版本。
其优点是轻量级,配置简易,上手简单,丰富的告警模板。
以上是两款监控软件,下面推荐几款监控辅助软件。
1grafana监控展示界面,在我们获取到监控数据后,可能需要把数据展示出来,给领导们邀功。grafana就是这样一款软件,开源免费,模板丰富。可直接对接zabbixprometheus和mysql数据库等。
2钉钉机器人。服务器出现告警怎么办,当然是发消息通知运维人员啊。钉钉机器人就提供这么一个功能。在钉钉群里面直接创建机器人,会给我们一个restfull的接口,我们就可以直接发送post请求。原生linux就直接用curl发送,Prometheus提供插件可以直接对接。
1 支持监控10台Windows、Linux服务器和网络设备,或者50个PING和URL;2 监控内容包括:CPU、内存、磁盘、网卡、进程、端口、目录、文件、日志、端口up/down、流量、带宽、丢包率、错包率、网络可用性、URL下载时间、网页防篡改等上百个指标参数;
3 支持邮件、短消息、声音和远程声音告警;
4 支持健康报告、指标报告、对比报告等多种报告;
5 支持状态统计、我的仪表盘、管理对象和监测点等多种视图显示。
我们公司用的是SUM服务器监控软件,现在公司有上百台服务器,各种品牌和型号都有,就用的这个。
可以监控CPU、内存、磁盘、应用程序、数据库、中间件等等,所有监控的项目都可以根据需要设置报警策略,有异常就会收到短信和邮件报警信息,我们还弄了个大屏幕来显示,一目了然,感觉蛮好用的。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)