IT运维管理当前面临了哪些问题?

IT运维管理当前面临了哪些问题?,第1张

一、在运维的过程中,需要记住一个原则:如果报警发给了 一个不能短期内解决问题 的人。 那么应该反思这个报警是否有合理的必要。

二、告警信息,需要定制分发,制定告警策略,重点需要关注以下几个方面原则。

哪些业务需要告警?

哪种故障需要告警?

告警等级如何划分?

故障依赖关系如何定义?

告警信息如何汇集?

如何做到精准有效的告警?

最终的目的就是少收告警信息,自动处理故障,自动恢复服务,当然,这是一条漫长的路。

如果不解决以上问题,将会被告警信息所淹没,最终如题主所言,影响运维工作。

对于监控的告警信息,处理的好,将会提高我们的故障响应速度,处理的不好,会影响我们的工作情绪,适得其反。试想,当一天收到1000封告警信息,是否还会去逐一查看监控告警信息?是否还能分辨是否重大故障,还是一般故障?

对于误报,漏报,会让人对信息的警觉性放松,时间久了,还会导致对接收监控信息有反感。所以,对于监控告警信息的发送,是一件特别慎重的事情。总结一下,对于监控告警信息,我们有以下的需求:

1基于业务类型,将告警信息发送给相应的业务用户,例如IDC人员,WEB运维,CDN运维,网络运维,不同的人员管理不同的设备,因此需要把故障发送给相关用户处理。

2基于故障级别,对一个故障,将不同的故障级别发送给不同用户,例如5分钟内的故障发送给运维一线人员,10分钟发送给运维部门主管,30分钟发送给运维部门经理。重特大故障发送部门相关领导。

3基于时间发送,比如业务维护期,告警无需发送。

4故障的相关依赖关系,当A服务发生故障时,发送一般告警,当A,B服务故障时候,发送业务故障告警。

5对出现故障的服务尝试用相关命令或者脚本进进行 *** 作处理,尝试自动恢复,例如重启服务,重启服务器等。

RIIL 区别于一般的软件厂商,通过软件+服务+咨询+培训一站式交付模式,致力于提供匹配客户需求的解决方案,让客户能够真正把产品用起来,实实在在感受产品带来的价值

RIIL 区别于一般的软件厂商,依托锐捷强大平台,拥有遍布全国的销售、售前支持及售后保障网络,为客户提供便捷有力的本地化原厂服务

RIIL 在软件产品方面具备面向管理者、基于业务、可视化管理的特征,其中IT健康指数、业务雷达等创新管理功能拥有国家专利保护

RIIL 在全国具备大量的成功案例,南北车集团、中石油、清华大学、华南师范大学以及政府一半以上部委等等500多个优质行业客户都是RIIL的忠实用户

 信息系统关系着企业的安全连续运行是IT运维管理追求的目标。IT运维管理与IT运维的成本、质量、速度有着很大的关系,当然也与IT系统的安全、连续和可用联系紧密。现今市场状况下,IT外包模式下许多IT运维管理都出现了许多问题,主要包括IT资产管理问题、IT外包管理问题、IT运维成本问题以及IT运维技术问题。it运维常见问题有哪些

1 IT资产管理问题

当不同的IT资产运维被外包后,相对应会增加一部分责任人,无论是对它的维护还是更新升级改造,都会影响到IT资产的价值,同时也会对你IT资产的使用年限和配置信息产生影响,导致发生一定的变化,从而造成物理位置与实际不符、账实不符、安全责任无落脚、人机不符等问题。分散的、动态的IT资产管理是无法提供清晰的结构脉络给相关管理人员和服务人员的。

2 IT外包管理问题

完善的IT外包管理:选择外包商-使用外包商-考核评价外包商-优化外包商。信息技术基础构架库标准体系现在被许多企业采用,这种管理使外包服务过程更加的流程化。然而,它对企业对于外包商的选择、考核、评价优化均未提及。因此,就算流程管理做好了,IT运维管理外包还是没有到位。

3 IT运维成本问题

招标或者议标易确定外包价格,但是很难界定价格的合理性,也无法确定价格涵盖的服务项目。当甲方遇到突发状况时,部分服务商往往不能快速响应,可能服务人员不在本地,还有超出服务范围要追加费用这种情况的出现。有的时候公司付出高,回报低,影响到公司的未来生存发展,无法保证长期稳定的良好服务。如何衡量服务成本来确定服务价格是IT运维管理外包中的主要问题之一。

4 IT运维技术问题

针对不同的IT运维服务对象应采取相对应的技术方法。不能仅仅依靠对技术人员进行管理从而达到管理技术的目的。这样只会制约IT运维服务发展速度和质量。

事实上如何使IT运维管理外包安全稳定运行是一个既简单又复杂的问题,但是只要注意IT外包过程中所出现的一系列问题并寻找有效的解决办法,就可以保证企业的正常运行发展。

现在的企业几乎都是互联网办公,网络一旦出现问题,会对公司业务造成重大损失。而很多公司主业也不是IT,对网络问题不大懂,对于公司的网络问题往往都是请一个运维工程师处理。这些工程师有相应的专业能力,但管理人员的“不懂行”却让运维工作存在很多问题,主要有这五点:

1、缺乏有效的知识积累和共享,造成 *** 作维护效率低下,类似的故障和问题仍然在不断发生,不断解决着,同时一旦某些掌握关键信息和技能的人发生意外状况(如生病,离职等),整个日常维护可能面临严峻的考验。

2、工程师的维护职责不是很清楚,每个人都大概知道自己该做什么,但是某个具体事情到底该谁负责,却没有明细定位。

3、IT网络运维人员大多没有养成记录习惯,每个月汇总报告时,对自己的工作量、所维护系统的整体情况还是一头雾水。而且纸质的故障处理报告信息要素不全,统计和查询都是头痛的问题。

4、运维人员几乎很少能准时下班,处理突发技术故障的事情也时有发生。运维人员往往像“救火队员”一样去处理故障。 在“救火式”的IT管理维护模式下,很难有效地进行服务管理,无法保证IT服务的有效性和一致性,IT管理往往处于无序状态。

5、对于运维工程师的工作绩效缺乏客观考核依据。他们到底做了哪些事情哪些事情还没有做工作完成的时效性怎么样解决问题的质量怎么样这些问题,只能凭印象得出一个个模糊的答案。

如何解决以上问题

如何解决以上提到的问题是目前许多企业用户需要解决的问题,但首要关注的问题应是如何建立专业化分工的IT运维体系。

1、细化用户角色,力求提高运维效率

运维人力分工管理包含人员、岗位、角色等信息,如果这些信息没有统一规划,就无法进行统一配置。网络管理中的角色是根据ITIL标准进行划分的,是把IT运维各种事情(包括人员、资源、突发事故)分成不同级别和不同运维 *** 作,以便有效的配置运维人力资源。因此,对于企业而言,IT运维的专业化分工本质上是对IT运维人力资源配置的优化。例如,明确运维事件分级处理流程,明确运维人员的职责、权限、义务和绩效考核标准。事实上许多实践也证明,明确每种运维事件的专业化分工处理流程,可以大大减少IT运维 *** 作的随意性和混乱性,并能大大提高运维中的人力资源效率。

2、设立IT运维服务台,规范IT流程

在网管软件中,一般提供自助服务和运维服务台,自助服务台的作用是,给用户报故障,评价IT人员解决问题是否负责等。运维服务台是为了确定运维等级和引入优先处理原则。运维服务台主要承担:运行值班、故障监控、接受请求、工单派发及问题解决过程中的监测等工作内容。服务台就像是传统产业生产车间的调度分配员,它会不断的根据事件的等级进行匹配分工和调度。例如发生任何一个突发运维事件时,服务台会先检查并进行分类流转处理。运维人员可分为一线普通维护、二线技术专家和三线厂商专家。一线人员作为第一级问题处理人员,主要解决常规的运维问题;在一线人员不能解决的情况下,二线技术专家将迅速介入问题解决过程;三线技术专家来自产品供应商,由二线技术专家申请三线厂商专家的介入,使问题解决时间能够大大缩短。

3、FAQ和知识库,最大限度节省人力成本

提供FAQ和知识库两种方式,知识库是指对网络运维中的典型故障事件和常见问题解答的自助式处理流程。当出现故障时,用户先在自助式知识库寻找解决方法。如果问题没有得到解决,则用户利用服务台申请维护,用户申请将会移交给相应的负责人,负责人第一时间建立服务档案并一直实时监控,直到问题得到圆满的解决。因此,自助式知识库能帮助运维人员节省大量的时间,从而节省人力成本支出。

最后,专业的事情要用专门的人员来做,还要配合专业的方法。运维工程师是以技术为主的群体,他们往往关注于IT问题本身,主要通过提升自身技术实力来解决问题,不太关注技术之外的事情。这种情况下不可避免的会出现一些问题,这就需要管理人员来解决了。

服务质量指标要根据各政务部门的需求可定制、可扩充。各类IT运维服务的质量指标通常包括但不限于:

(1) IT基础设施和应用系统运维服务

监控类服务:异常报告及时率、异常漏报率。

日常维护类服务:维护作业计划的及时完成率、故障隐患发现率、异常主动发现率、故障服务请求及时满足率、业务服务请求及时满足率、问题解决率等。

维修保障类服务:服务响应及时率、到达现场及时率、故障修复及时率。

(2)安全管理服务:漏洞扫描覆盖率、安全报告呈报及时率、安全漏洞遗漏数量、安全漏洞遗漏率、加固设备覆盖率、安全补丁安装及时率、安全事件次数等。

(3)网络接入服务:平均响应时间、问题解决比率等。

(4)内容信息服务:检索成功率、响应及时率等。

(5)综合管理服务:平均响应时间、问题解决比率等。

以上就是关于IT运维如何处理大量告警全部的内容,包括:IT运维如何处理大量告警、it运维常见问题有哪些、IT运维管理当前面临了哪些问题等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/8814469.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-21
下一篇 2023-04-21

发表评论

登录后才能评论

评论列表(0条)

保存