几十台到几千台服务器的运维监控该怎么做?需要注意什么?

几十台到几千台服务器的运维监控该怎么做?需要注意什么?,第1张

随着市场竞争力不断增大,各个企业除了要增加自身产品的竞争力之外,也越来越重视消费者的服务,毕竟大家的生活质量在提高,每个产品也都相差不大,而服务就变成了用户最值得考虑的一个因素,也更好的体现了品牌的价值。这就要求公司进入了几十台到几千台服务器的运维监控阶段,无论数量如何增加,保持服务器的稳定才是重中之重,在服务器数量少于200台的时候,主要考虑简单使用、稳定运行、报警这三个方面,一旦大于这个数量,就需要相应的提升技术手段了。

基本上200台以下的服务器运营监控就是小白级 *** 作了,如果出现一些异常系统可以第一时间进行报警,并且帮助用户解决问题,这也是最基础的要求,基本上哪怕是新手适当的进行学习就可以 *** 作成功。而当服务器数量从200增加到1000这个阶段,这意味着用户的需求也在变复杂,那么技术人员就需要将监控内容进行统一,实现全覆盖式的监控管理,确保每一个用户出现问题时,都没有漏报的现象。

而当服务器超过1000台以上时,监控的数量越来越多,消费者的告警信息也会急速增长,每天都会收到成百上千的用户需要解决问题的消息,如果系统不进行相关的整理的话,很容易忽略到消费者的消息,从而带来非常不好的体验,这个时候就需要及时对报警信息进行相应的整理,尽量的化繁为简,减少出现重复报警的情况。并且对于内存使用率、CPU使用率等模块进行独立的设置,做到权责分明、快速定位、及时处理。

综上所述,每个公司的业务不同,那么对于服务器的要求也不太同,不论发生怎么样的变化,基本上只要有了相关的监控数据,就能够通过技术来分析出想要的结果,想要随着时代一起进步,就需要不断的更新维护、高效运维。

最简单的实现方法:配一台宽带路由器,拨号交给路由器,录像机全部接入该路由器,对路由器进行必要的设置(主要是端口映射设置)即可实现远程监看。如果你的公网IP是动态的(传统的ADSL或是小区宽带均为动态IP),还需要申请动态域名解析服务(如:“花生壳”),如果不明白这东东,上网了解下。
如果需要管理的客户端人数较多,设备较多而且需要统一管理,才需要配置服务器(硬件配置较高的普通兼容机即可),在该计算机上布暑管理平台,实现用户、设备集中管理,媒体转发(解决多用户同时访问相同数据时占用大量带宽的问题)等等功能。
单纯就远程监控来说,各种功能实现起来不复杂。但对网络带宽要求相当高,同时由于你目前手里只有录像机厂家的配套软件,这类软件适合局域网内分控,对于广域网环境下多台设备,多个用户的集中管理束手无策。如果你的系统的确需要对用户及设备统一管理,需要付费购买监控平台软件。
如果确实存在同时访问人数较多的情况,即使你不需要对设备及用户集中管理或是不愿意搭建平台,配一台计算机用做媒体转发还是有必要的,媒体转发软件可向录像机厂家索取,如果厂家有的话,通常免费。

曾经做过几次大规模服务器监控,下面推荐几款监控软件和辅助软件。

1zabbix一款老牌经典的监控软件。是一个企业级的分布式开源监控方案。能够实时监控从成千上万台服务器、虚拟机和网络设备中收集到的数以百万计的指标。

提供图形 *** 作界面,可以方便的添加监控指标、告警指标。支持邮件、微信等的告警通知。

2Prometheus,近些年监控方面的当红炸子鸡,Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB)。Prometheus使用Go语言开发,是GoogleBorgMon监控系统的开源版本。

其优点是轻量级,配置简易,上手简单,丰富的告警模板。

以上是两款监控软件,下面推荐几款监控辅助软件。

1grafana监控展示界面,在我们获取到监控数据后,可能需要把数据展示出来,给领导们邀功。grafana就是这样一款软件,开源免费,模板丰富。可直接对接zabbixprometheus和mysql数据库等。

2钉钉机器人。服务器出现告警怎么办,当然是发消息通知运维人员啊。钉钉机器人就提供这么一个功能。在钉钉群里面直接创建机器人,会给我们一个restfull的接口,我们就可以直接发送post请求。原生linux就直接用curl发送,Prometheus提供插件可以直接对接。

可以,我做过这样的项目,但是一盘不是服务器,是磁盘阵列(因为服务器的磁盘插槽太少,如果够的话也可以)。而且一般是作为备份存储用的。比如:客户要求数据存储3个月的时间。那首先DVR要满足此要求。磁盘阵列用于备份。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/10251173.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-06
下一篇 2023-05-06

发表评论

登录后才能评论

评论列表(0条)

保存