1.cactio
实际上cacti不是监控工具,而是个依赖于SNMP的数据采集和数据呈现的工具。但是很多人喜欢用来当监控(因为其功能可以很好的完成这个工作)
功能:数据采集、 保存数据[SQL, txt].
数据展示(rrdtool 绘图)。
数据分析和报警(很一般)。
2. nagios。
功能:数据报警(报警功能是Nagios的特色功能) [ 故障触发,故障恢复都可以。
依赖分析报警(能自动的识别到关键设备的故障,关联设备不会报警)。
数据采集(采集的数据是弱项,他只关心警戒位,只关心正常与否的状态,状态转换时可以实现报警,所以它采集的数据不需要保存),当然也有插件弥补这个不足,如PNP4Nagios。
3. zabbix (php)(推荐)
Nagiostcacti整合互相弥补不足!I
nagios和 cacti不适合超大规模的监控、由于大规模的带宽和网络限制,会导致监控的延迟等问题,所以有很多是 nagios+ cacti整合,但是依然不适合在大规模的环境中,不适合分布式部署, Nagios在大规模中就会出现延迟,失
去 Nagios本事的特色。
那么 zabbix同时整合了 cacti和 Nagios特点的工具,而且还具有了前两者不具有的工具,支持分布式等等。
4. 补充工具:
netdata:托管在github上的一款类型zabbix的开源监控工具https:/
/github. com/firehol/netdata
open- falcon:小米公司开源的企业级监控工具(python)(推荐)
Ganglia类似于 zabbix,大型分布式监控系统
开源监控工具对比http://www.oschina.net/news/67525/monitoring-tools
5. 监控软件数据采集的方式
SNMP 协议。
agent 代理的方式去采集数据。
shell 脚本api 接口
6. 数据展示方式
php html app
7. 数据告警
mail,msm,微信,电话,钉钉机器人
玩弄OpenFalcon的时候,在 fe 页面点击“监控趋势图”选项的时候,莫明跳转。报7070端口拒绝访问。表示很是诧异,本人小白,但是在安装过程中,印象里没有出现7070端口。于是收集了,单机版OpenFalcon的各个端口的端口号,以及对应的程序名称。以下端口号和名称并不是完全匹配,也不完全具有普适性可以自己修改为适合自己的。
端口号可以自己修改,0.1.0的端口号,在我个人的安装过程中默认的前后是不匹配的。需要自己修改匹配,比如我的 fe 的访问端口号目前就是8080。
Open-Falcon是从内部版本衍生的,去掉了对小米内部其他系统的依赖,本身组件还是比较多,部分组件使用Python开发,给软件分发造成不小的麻烦,如果对整个架构不熟悉,不知如何troubleshooting,安装过程很难一帆风顺。*安全性考虑不到位
Dashboard、AlarmDash不用登陆直接就可以查看数据,如果被扫描,还有可能被写入脏数据,被删除数据。Falcon在小米内部因为有网络隔离,外网访问不了,但是一些稍小的公司,直接将Dashboard、AlarmDash放在公网上,就麻烦了
*没有通盘考虑的权限设计
所有的 *** 作理应都有相应权限控制,API的调用也应有相应控制,现在做得还是比较乱,比较弱
*策略表达式易用性不够
现在的策略表达式中只能配置一条规则,此处应该支持配置多条,任何一条触发,就要发报警,不同规则之间应该支持覆盖
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)