是一个集群监控软件,可以监视和显示集群中的节点的各种状态信息,比如:CPU、mem、硬盘利用率、I/O负载、网络流量情况等,同时可以将历史数据以曲线方式通过php页面呈现,此软件主要是用来监控系统性能的软件,通过曲线可以很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用。
它是分布式的监控系统,有两个Daemon,是一个Linux下图形化监控系统运行性能的软件,界面美观、丰富,功能强大。
RRDtool是系统存放和显示time-series (即网络带宽、温度、人数、服务器负载等) 。并且它提出有用的图表由处理数据强制执行有些数据密度。
2、Cacti
是一套基于PHP、MySQL、SNMP及RRDTool开发的网络流量监测图形分析工具,通过snmpget来获取数据,使用RRDTool绘画图形,提供了非常强大的数据和用户管理功能,可以指定每一个用户能查看树状结 构、host以及任何一张图,还可以与LDAP结合进行用户验证,同时也能自己增加模板,功能非常强大完善。
cacti是用php语言实现的一个软件,它的主要功能是用snmp服务获取数据,然后用rrdtool储存和更新数据,当用户需要查看数据的时候用rrdtool生成图表呈现给用户。因此,snmp和rrdtool是cacti的关键。
3、Zenoss
是一款智能监控软件,允许IT管理员依靠单一的WEB控制台来监控网络架构的状态和健康度。Zenoss Core同时也是开源的网络与系统管理软件。
Zenoss提供功能丰富的产品,以监测整个IT基础设施:
网络 -路由器,交换机,防火墙,接入点
服务器 -微软的Windows , Linux , Unix系统,惠普, NetApp,戴尔
虚拟化 -完整虚拟机虚拟化基础架构( VI3 )管理, XenSource监测
应用领域 -Process(程序),Port,网络应用服务, Web服务,数据库,中间件,商业企业应用方案
4、Argus
是一个网络连接监控器,可以利用它来定制监控网络中符合某种条件的计算机,例如网络空闲、断开等。
5、Monit
是一款功能非常丰富的进程、文件、目录和设备的监测软件,用于UNIX平台,可以自动修复那些已经停止运行的程序,适合处理那些由于多种原因导致的软件错误。
6、Nagios
是一个监视系统运行状态和网络信息的监视系统,能监视所指定的本地或远程主机以及服务,同时提供异常通知功能等Nagios可运行在Linux/Unix平台之上,同时提供一个可选的基于浏览器的WEB界面以方便系统管理人员查看网络状态,各种系统问题,以及日志等等。
Nagios的主要功能特点:
监视网络服务(SMTP、POP3、HTTP、NNTP、PING等)
监视主机资源(进程、磁盘等)
简单的插件设计可以轻松扩展Nagios的监视功能
服务等监视的并发处理
错误通知功能(通过email、pager或其他用户自定义的方法)。
Zenoss升级新版本满足大型企业IT环境监视需求明尼苏达州,安那波利斯2008年6月18日消息:zenoss今日宣布发布Zenoss企业版2.2,该版本被设计用于大中型企业,该版本将使客户轻松扩展至对数万台服务器或者网络设备的监视,同时还提供高可用性配置和增强的Microsoft Windows监视功能。
该公司CEO及合伙人Bill Karpovich指出:“来自大企业的业务增长最快,目前已经有数百家大型IT公司认识到了zenoss解决方案快速、灵活以及经济的优点。最新版Zenoss的发布提供了一个比其它专有IT监视解决方案更有竞争力的可替代解决方案。“
Zenoss企业版是一个集成的网络、服务器以及应用程序管理软件产品,该产品功能包括了自动发现、设备资产库管理、配置跟踪、可用性监视、性能管理、事件/日志管理、告警和报告管理功能,所有这些功能都通过一个单一的门户界面展示。Zenoss企业版能够对企业的整个IT基础设施进行监视,其中包括虚拟机(比如 VMware and Xen)、服务器、Microsoft Windows, Linux, Unix,网络设备,web服务器,进程,应用程序等等。
Zenoss 企业版的2.2版本的新特征包括:
分布式配置管理器
* 对zenoss分层架构进行了增强,用以简化分布式采集器的部署,加强采集器的安全性。
* 分布式配置管理器使用户能够直接通过GUI来创建、配置和监视分布式采集器。
* 可扩展至队数万台设备的监视。
分布式采集器安装包
* 为分布式采集专门编译的软件包以及硬件服务器。
* 进一步简化分布式部署方式。
高可用性安装包
* 提供标准的高可用性部署环境。
* 适用于对人物要求极为苛刻的环境。
增强的Microsoft Windows监视
*增强的无代理监视 Microsoft Windows功能。
* 除了监视 Windows性能计数器 ,用户能够通过WMI自动生成一个视图用于集中监视系统的软硬件以及服务。
新增加的设备监视器
*新提供的ZenPacks,可用于监视 BigIP, Brocade, Cisco (IPSLA, Load Balancers), Juniper, Netscreen (Firewalls), NetApp, Nortel, SugarCRM等等。.
即点即装功能
* 为包括 Redhat Enterprise Linux, Novell Suse Enterprise Linux等在内的平台提供新的安装包。
我更喜欢用“系统管理”来形容“运维”这项工作。运维听起来是偏执行的一项工作。python在系统管理上的优势在与强大的开发能力和完整的工具链。python的工程开发能力强大,远强于各种shell和perl。易读易写,兼具面向对象和函数式风格,还有不错元编程能力。通过系统化的将各种管理工具结合,对上述的各类工具进行二次开发,形成统一的服务器管理系统。和python类似的ruby也很适合编写系统管理软件,但是在相关库和工具上,比python差太多。
举个栗子: 某牛人,精通 bash,python,perl,ruby ,在工作中写了数百个单一功能的脚本(任何语言)来进行日常 *** 作,涵盖了监控,部署,网络配置,日志分析,安全检测 等等许许多多的方面,无所不包。他所作的,只是 *** 作,并没有把系统管理这项工作做好。再多的脚本,也只是把“ *** 作”这个行为做到极致。写再多的脚本,也不能转化为公司在系统管理上的宝贵资产。
让系统易于管理,是一个工程。只有像puppet(ruby),saltstack(python) 这样的自动化管理工具,才能完整的描述整个系统,并且让系统管理的方方面面纳入统一的体系,而不是一堆脚本。
python在服务器管理工具上非常丰富,配置管理(saltstack) 批量执行( fabric, saltstack) 监控(Zenoss, nagios 插件) 虚拟化管理( python-libvirt) 进程管理 (supervisor) 云计算(openstack) ...... 还有大部分系统C库都有python绑定。
对于流程确定的事情,最终一定是纳入系统管理的体系,写成程序,成为系统的一部分。而不是无法复用游离与整体的各种脚本。
随着云计算时代的来临,中小型公司,不需要运维了。大型公司,没有工程开发能力的运维,是没有竞争力的。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)