如何做好IT运维管理工作?

如何做好IT运维管理工作?,第1张

IT运维是IT管理的核心和重点部分,也是内容最多、最繁杂的部分,该阶段主要用于IT部门内部日常运营管理,涉及的对象分成两大部分,即IT业务系统和运维人员,该阶段的管理内容又可细分为七个子系统

■设备管理:对网络设备、服务器备、 *** 作系统运行状况进行监控

应用/服务管理:对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理

■数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复

■业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理,主要关注该业务系统的CSF(关键成功因素CriticalSuessFactors)和KPI(关键绩效指标KeyPerformanceIndicators)

■目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理

■资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互

■信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127中控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等

■日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段IT运行维护管理的每一个子系统中都包含着十分丰富的内容,实现完善的IT运维管理是企业提高经营水平和服务水平的关键。运行/维护阶段与服务/支持阶段的分界线为前者是面向IT部门内部的管理,而后者是面向业务部门、企业中的其它人员或直接面向客户。

在企业IT管理的早期,更侧重于对网络、硬件等设备的管理。那时的IT管理就是通过某种方式对网络进行管理,使网络能正常高效地运行。早期的这种IT管理是NSM的阶段,主要的面向目标就是底层的基础网络设备。NSM系统是对网络中的底层设备进行实时的,统一的监控,当网络中出现了问题或者即将出现问题的时候,NSM向网络管理者提出故障定位和报警,这样做无疑大大方便了网络管理员的工作。但是,NSM系统对于网络上运行的各种业务系统以及业务系统的用户只能做一些简单的管理,这个时期的IT管理,可称之为网络运维管理阶段,这时候的IT管理人员称之为网络管理员,简称网管。\x0d\随着企业IT系统的日益成熟和复杂,企业的关注点已从单点管理到综合管理角度的转变,从关注单一网络到对业务系统的关注。原因在于,越来越多的企业意识到,业务系统涉及环节逐渐增多,单一的网络运维管理已经不足以满足管理需求,需要落实如何保障业务系统的各个环节。在满足对IT资源进行统一管理,降低运行成本、提高突发事件应对能力、提高服务质量和效率的基础上,更需要保障业务系统的正常运行,才可以保证IT投资的价值体现。同时,在国内IT管理领域,伴随着用户IT规模的扩大、IT技术的发展和用户需求的提高,原有的网络管理系统已经远远不能满足当前的用户需求。\x0d\因此,当前国内用户迫切需要一款能够对整个IT资源进行统一管理,解决IT资源所面临的种种困难,同时更要做到对业务系统有效保障并提出改进意见的平台。\x0d\在这样一个前提下,IT运维管理的概念和产品被国内知名的网络运维管理厂商率先推出。可以说,它的出现就是对当前用户需求的一种有效诠释。这个时期的IT管理,被称之为IT运维管理,这时候的IT管理人员称之为IT运维人员。\x0d\ITIL与IT运维管理的关系\x0d\ITIL诞生于国外,当时是需要针对部门人数众多,对业务保障要求高的电信、金融等行业的IT和业务进行有序化,透明化的管理,所以诞生了ITIL标准。ITIL标准的核心思想是通过将IT管理流程化,提高工作人员的工作效率,提高IT服务质量,更好的让IT系统为业务提供服务,从而为业务系统的稳定运行保驾护航。

1、深层次的IT资源监控当IT资源出现故障的时候,我们的第一反应就是快速的定位故障的根本原因以及故障影响哪些业务部门、哪些业务。以前是否出现过类似的问题,是否有成型的解决方案等等。要想能快速的定位故障的根本原因,首先我们就要做到对IT资源深层次的监控。特别是对于一些应用的监控,通过指标来量化资源的健康程度。当资源出现故障时,能快速定位到问题关键性能指标。

2、建立对业务影响范围的判断机制

当资源出现故障的时候,我们需要快速的了解他会对哪些业务部门,哪些业务造成影响。所以我们必须有一种合理规范的机制来判断。并且当同时出现几个故障时,系统能判断服务所影响业务的重要性,以此来判断恢复故障的优先级。另外我们还得有KPI报表,统计服务的可用性。

3、自动关联同类故障

当资源出现故障时,如果能自动关联同类故障,那么将大大的提高我们处理故障的效率,提升IT服务的水平。通过知识提交、审核、发布、查询等功能自动沉淀IT部门日常运维中的工作经验,帮助各级支持人员提高技能水平,简化IT服务任务,同时降低对具体个人的依赖。并且知识库要和FAQ紧密的结合在一起,真正的提升运维的效率。

4、拓展IT服务途径,提升服务质量

建立运维人员与用户之间的联系点,统一受理用户的咨询、服务请求、故障报修、投诉等情况。并且当用户能通过FAQ查询以前出现过得同类故障。这样用户可以自己解决问题,从而降低运维人员的工作量,提升运维效率,提高用户的满意度。

天天客服IT运维基于ITIL的最佳实践经验,为用户提供运维管理流程,并提供了基于ITIL的岗位定义、流程设计工具、表单设计工具、基于ITIL的流程模板和各种元素库,帮助企业在进行IT运维管理工作时,不仅能够有效的、有序的进行事故管理、问题管理、配置管理、变更管理、发布管理,达到服务支持的目的,也能够提供服务级别管理、可用性管理、能力管理,达到服务交付的目的。

PS学出来,似乎是做平面设计的吧。你进某软件公司,人家做网站,比如你们公司接了某产品做个网站,那么人家拍来照片,然后你要把那个产品扣图扣出来给做网站的同事使用。另外似乎还有网站背景啥的要你设计。至于word,excel,这类学电脑的一级基本要过,至于这类的工作,我见过“打字复印”店里有,秘书要学,财务、会计要学。

我也跟你差不多年龄,迷茫啊……!

不过有一点可以肯定,定个目标,一直努力去做,学的越精越好。

我想总有一天会熬出头的。

伴着IT在企业中的作用日益明显,IT建设和IT运维同时成为了企业效率的加速。同时,计算机硬件系统和软件系统的运维已成为了各行各业单位,尤其是信息服务部门普遍头痛的事情。本文以下内容总结几个头痛的主要因子,拿出来供大家参考指导,并接下来的系列课题中会对针对这些现状提出改进措施 。

现状一:IT运维人员成本偏高

据专业调查,大多数CIO表示最关心的是IT运维成本过高。原因是在过去的5年中,很多企业都实施了很多IT系统,使得IT运行越来越复杂,也越来越难管理。同时,其中有50%的受访CIO认为IT运维成本过高的一个原因是IT运维的自动化做得还不够好,依靠手工流程来管理,不但使到运维效率不高,而且人力成本更是花费惊人。

同时,另一家国际知名调查机构Gartner调查发现,在IT运维成本中,源自技术或产品(包括硬件、软件、网络等)成本其实只占20%,而流程维护成本占40%,运维人员成本占40%。流程维护成本包括日常维护、变更管理、测试成本等;人员成本包括训练、教育、人员流失、招聘成本等。

从图中,我们可以看出, “流程维护”类和“运维人员”两者都与软性方面的成本相关非常紧密。而且三者的关系可以用下图来表示:

备注:C类成本的大小很大程度取决于B和D类。

现状二:处在“救火式”的IT运维控制

国内在IT运维过程中,IT员工大多数只是处在被动低效率手工救火的状态,只有当事件已经发生并已造成业务影响时才能发现和着手处理。这种被动“救火”会导致:①IT运维人员终日忙碌,IT运维人员日常大部分时间和精力是处理一些简单重复的问题;②IT运维本身质量很难提高;③再加上故障预警机制的不完善,往往是故障发生后或报警后才会进行处理,不但事倍功半而且故障还常常会出现恶性连锁反应;④IT部门和业务部门对IT运维的服务满意度都不高。

现状三:简单的自动化程度起了“反作用”

尽管IT运维管理的技术在不断进步,但实际上很多IT运维人员并没有真正解脱出来,主要原因是自动化不高而导致的。技术虽然能够获取IT设备、服务器、网络流量,甚至数据库的警告信息,但成千上万条警告信息堆积在一起根本没法判断问题的根源在哪里。还有,许多企业的更新管理绝大多数工作都是手工 *** 作的。即使一个简单的系统变更或更新往往都需要运维人员逐一登录每台设备进行手工变更,当设备数量达至成百上千时,其工作量之大可想而知。而这样的变更和检查 *** 作在IT运维中往往每天都在进行,占用了大量的运维资源。因此,实现运维管理工作的自动化对企业来说已迫在眉睫。

就如图中一样,所有信息(杂乱)都从各个地方被收集到了这个圆圈(容量不变)里面,信息进去后不能主动流出来。可能会出现的情况:这个圆圈容器装满后会爆破,或者是溢出来;圆圈的运行速度会慢慢降下来,从而导致信息输入的速度也会变慢。

现状四:本是同家兄弟,却不经常来往

这个问题主要是发生在拥有许多子公司的企业,每个子公司的系统都是独立的,下面主要以国内银行业为例。以前国内的银行业没有搞集中建设,每家银行的各个地方分行都单独建设和维护自己的核心业务系统,都各自配备开发人员和维护人员。

同时在运行维护方面,对故障的解决,完全依靠运行维护部门的工程师的上门服务。不管问题大小,工程师都要来回去现场解决。遇到一些技术难度大的问题,如果工程师的水平高,处理起来就快;如果水平低,甚至花上几个小时,可能也解决不了。

虽然国内银行业的IT运行维护管理水平,有点接近国外80年代末90年代初银行业的水平,银行IT结构上都采用了大集中模式。从硬件设备上来看,国内银行不比别人差,甚至还有些领先,但IT运维管理还没达到国外当时的水平,尤其是呼叫中心、客户服务方面。”

结束语

从上面三个现状来看,主要是有关软性方面的。的确如此,国内借着近十几年高速发展,硬件方面的发展取得了重大进步,某些方面的水平甚至是超过了国外的水平,并且IT硬件的生产厂商也是出现了很多与国外厂商同等秀舞的水平,如华为、中兴等。但是往往是硬件易学,知识技巧难寻。这不仅与国内教育环境有关外,还与知识经验的继承有关。

管理要动态匹配业务需求

IT部门还会经常联合HR、法务等部门一起做跨部门的沟通,面对的对象是各部门的管理层,让他们理解企业的IT策略。

答案如下:

如今中小型企业信息化推进速度在加快,

各种应用和业务系统在不断地增加中,所以对整个IT运维系统的安全性、稳定性以及出现状况时如何应对都比较重视,尤其是在预防和处理重大IT风险方面更加重视,主要体现在以下几方面:

一、IT机房安全风险

1、机房在无人值守的时候一定要锁上;

2、未经IT部门允许,无关人员不得随意进入机房;

3、机房内要严格采取防雷、防火、防尘、防静电等措施。

_

二、电源安全风险

1、必须启用UPS备用电源;

2、定期检查机房内供电系统和线路;

3、当机房发生突然停电,首先和相关部门确认停电原因,并确认UPS电池可用时间,并根据何时来电信息来决定是否要关闭相关IT设施。

_

三、消防安全风险

1、EHS部门要定期检查机房内消防设施,确保消防设施能够正常使用;

2、工作时间发生火灾时,应及时撤离机房周围人员并通知EHS部门,在保证自身安全并得到EHS部门许可的情况下,员工应关闭电源并使用合适的灭火器灭火,如果火势无法得到有效控制,应立即拨打119;

3、非工作时间发生火灾,值班人员应及时拨打119并上报相关人员,做好火灾处置工作;

4、火灾结束后,IT相关人员应立即到现场检查相关设备,及时评估事故损失情况,并给出相应的系统恢复解决方案。

_

四、数据安全风险

1、定期备份重要数据;

2、定期进行数据恢复验证

3、备份数据异地存放

_

以上就是IT运维风险处理计划,每个公司可能有所不同,但都是大同小异,预防和处理重大IT风险,IT运维人员在平时就要做足功课,以免临阵手忙脚乱。

以上就是关于什么是IT运维全部的内容,包括:什么是IT运维、ITIL和IT运维管理有什么关系、如何做好IT运维管理工作等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/8849200.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-22
下一篇 2023-04-22

发表评论

登录后才能评论

评论列表(0条)

保存