业务应用:IT运维管理的核心 把业务指标分解到it运维中

业务应用:IT运维管理的核心 把业务指标分解到it运维中,第1张

IT运维管理包含:

一、设备管理:对网络设备、服务器设备、 *** 作系统运行状况进行监控,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、WEB等的监控与管理;

二、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复;

三、业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理,主要关注该业务系统的CSF(关键成功因素Critical Success Factors)和KPI(关键绩效指标Key Performance Indicators);

四、目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;

五、资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;

六、信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127中控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;

七、日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段。

IT运维是IT管理的核心和重点,也是内容最多、最繁杂的部分,每一个子系统中都包含着十分丰富的内容,也因此被很多人称之为“IT运维管理就像一个什么都能装的箩筐”。但通过梳理,你会发现,其实IT运维管理也有依有据,有规律可寻。

IT 运维管理是时下 IT 界最热门的话题之一随着 IT 建设的不断深入和完善,计算机硬软件系 统的运行维护已经成为了各行各业各单位领导和信息服务部门普遍关注和不堪重负的问题由于这是一个随 着计算机信息技术的深入应用而产生的新课题,因此如何进行有效的 IT 运维管理,这方面的知识积累和应 用技术还刚刚起步对这一领域的研究和探索,将具有广阔的发展前景和巨大的现实意义。

所谓 IT运维管理,是指单位 IT 部门采用相关的方法、手段、技术、制度、流程和文档 等,对IT 软硬运行环境(软件环境、网络环境等)、IT 业务系统和 IT 运维人员进行的综合管理。

企业将IT部门的职能全部或部分外包给专业的第三方IT外包公司管理,集中精力发展企业的核心业务。简单的说就是企业在内部专职IT运维人员不足或没有的情况下,将企业的IT外包服务流程,包括全部办公硬件、网络及外设的维护工作转交给专业从事IT运维的公司来进行全方位的维护。

由于信息技术的渗透性和先导性,信息技术已成为国内外企业战略决策的制定和调整、生产经营过程中的计划、组织、管理和控制不可或缺的重要工具以及公司核心技术的主要载体,信息技术促进了生产经营过程的集成化和科学化,从而成为各公司降低成本、维持技术领先地位的战略举措。

近年来,国内外各企事业单位都十分重视信息化建设,把加快信息化建设作为提高生产经营管理水平、促进业务流程优化、加强内部控制、提高决策质量和效率的重要手段。结合中国石油发展战略和业务需求,中国石油出台了统一的“十一五”信息技术总体规划,F5(企业信息系统管理)项目便是“十一五”信息技术总体规划中的一项,目标是建立集成的监控管理平台和统一、完善的运维管理体系,提高中国石油信息技术基础设施的可靠性和性能,从而保证中国石油各业务系统的高可用性,彻底改善IT服务的管理水平,提高客户满意度,降低IT服务支持成本。

被动的传统IT运维管理

市场研究机构Gartner调查发现,在导致IT基础设施出现故障的原因中,源自技术或产品方面的因素其实只占了 20%,而因为运维管理方面的原因则占到80%,可见IT系统运维及管理是相当重要的。企业每年对IT部门投资都不少,但是得到的效益却没有体现,问题仍然时常发生,感觉好像所有的投入都打了水漂。

企业的IT运维部门是一个吃力不讨好的部门,因为IT运维就是在后台默默地保证信息系统的正常运行,只有在问题发生的时候才想到还有IT部门的存在。这种现象是由于IT运维管理还处于传统模式,即无相应的运维监控软件或者是仅仅单独使用某项监控软件而没有联合使用。这种传统的IT运维管理是被动的管理,是孤岛式的管理,是与业务应用没有联动的管理。

1被动管理

传统的IT运维管理是救火式的管理。通常是用户先于IT人员发现问题,然后再找到IT部门要求解决问题。这是由于传统的IT管理采用人工方式管理基础设施,网络管理是从各种IT基础设备出发的,仅仅是保障各类IT设备如服务器、数据库、存储设备、交换机等等基础设施的正常运行。

不采用任何管理软件,仅仅靠运维人员定期轮询,或者执行某项命令来检查设备,在系统规模较小时,只要参与运维的技术人员足够负责,人工运维方式是可以满足日常运维需要的。但是,当应用系统达到一定的规模后,这种运维方式的弊端就暴露出来了。轮询一遍要花费几个小时,这样,轮询周期越长也就代表越需要更久才能发现故障。这种被动式管理IT导致有了问题不能及时发现。

2 无关业务、孤岛管理

有些企业虽然采用某一种或几种监控软件来监控IT基础设施,但这些监控软件都各自独立运作,没有进行对业务的整合监控。如果用户投诉业务应用不畅通,很难定位故障源,到底是网络、应用程序、数据库还是其他后台系统出了问题,或者是各部门踢皮球,都说自己所负责的设备正常

好一些的IT主管会把各个部门集合到一起开会,讨论问题根源。传统的IT运维管理方式是各类设备的管理各自为政,丝毫没有关联性。处理故障不便于追根溯源。每个人的精力有限,在专业应用系统赖以生存的各基础设施支撑单元上很难做到专、精、准的多面手角色,加之由于管理范围的界定和监控手段的限制,运维人员很难直接判定问题是出在基础网络、系统服务器、数据库还是应用系统自身,故障难以定位将直接导致业务恢复时间的推迟,影响业务系统的正常运行,大大降低服务质量。

将IT运维与业务相关联

IT运维是在后台默默地保证各项业务应用系统的正常运行。IT运维工作是无形的,怎样把这种无形的运维变为有形、甚至量化,这就要把IT的运维与业务相关联。传统的IT运维管理中,基础设施的运维工作不能和业务相结合,仅仅是在设备管理的层面上。这就导致IT管理的成绩没有体现。想想看,如有业务应用不正常,那网络或者服务器之类的任何一种基础设备的正常运行又有什么用呢业务应用是“1”,设备是“0”,没有了正常通畅的业务应用,那其他的都是空谈。只有在业务应用畅通的前提下,基础设施管理才有意义,才能体现IT运维管理的价值。

因此我们需要帮助企业IT:部门了解用户使用感受,关联真实用户感受和系统性能,指导问题事件定位和原因诊断 。

企业信息化发展过程首先是基础架构建设阶段,这个阶段主要是采购一些硬件和应用软件。随着采购的不断扩大,企业的IT组件不断完备,IT系统初具规模,这就产生了IT运维和管理的要求,即网络和系统监控(NSM)阶段,监控网络连通性和系统可用性,此阶段主要还是对IT设备的监控。随着企业业务日趋复杂,IT系统进一步扩大,这时就产生了对IT服务流程进行管理的需求,上升到第三阶段,即IT服务管理(ITSM)的阶段。以上三个阶段都是IT间接产生业务价值的阶段,对业务的顺畅起辅助监控的作用。

企业业务系统对IT系统依赖的不断增强,企业开始关心IT服务对业务带来的影响,强调从业务目标角度出发来管理IT,也就是到达第四个阶段――IT与业务融合的阶段,即BSM(Business Service Management,业务服务管理)阶段。企业可以根据业务目标对IT服务进行调整,以确保IT能够支持业务目标,从而直接产生业务价值(如图2所示)。

如今各类重要的IT应用系统相继在中国石油发挥着举足轻重的作用,所以IT应用系统的可用性尤其重要,例如ERP、OA、邮件、门户等各类重要的系统如果出现中断,都会给企业造成大量的经济损失,所以除了需要对各类应用系统部署冗余的设备以备保证其高可用性,同时也需要对应用系统进行监控和管理,并且进行关联管理。业务系统的可用性是由底层的各类基础设施的状态所决定的,因此建立一个有效的业务模型,将与某个业务相关的底层IT基础设施关联起来,该业务模型能够有效地定位故障根源。这样ERP的管理员只需要关心ERP业务的可用性,而没有必要去关注每台主机的性能参数和启动的进程,不但大大节约了运维时间,而且也提高了运维效率,使故障持续时间大大缩短了。

基于BSM的IT运维

当前中国石油IT运维管理的需求就是从业务出发,建立基于BSM解决方案的新型IT运维。

新型的IT运维管理系统要做得到的就是基于BSM架构的业务管理。

首先,要实时掌控最终用户对IT服务的使用体验,根据制定好的SLA(Service Level Agreement,服务等级协议)来管理业务服务的质量,这样就可以根据业务影响和SLA来对IT服务进行管理。

其次,通过端对端的应用交易时间测量,实现业务要求端对端的可见性;从最终用户的角度,来测量业务服务的响应性能,主动帮助运维人员在第一时间发现问题,以便在问题对用户造成不利影响之前,及时得到隔离、诊断和修复,把它们对业务的干扰降到最低。

第三,提供业务服务、应用及底层IT系统构架部件之间的映射关系。这种解决方案通常会基于一种称为CMDB(Configuration Management Database,配置管理数据库)来实现。通过服务依存关系映射技术,来展现业务服务、应用和底层IT系统构架部件之间的动态关系,这样就增进了对各种IT元素的掌控和理解。

第四, 借助业务服务与IT基础设施的依存关系,对告警事件进行管理。当IT系统的组件产生告警时,结合收集上来的底层的IT系统告警事件,对它们进行过滤、关联、聚合,根据对业务服务影响的严重性,来进行排序处理。

传统意义上的CMDB是服务流程中的一部分,是ITIL中最重要、最核心的概念之一,在以业务为核心的IT运维中,CMDB也是业务建模的主要工具。CMDB通过自动发现工具收集和一定范围的IT基础架构基础信息,包括配置项和关系,建立IT基础架构模型;并通过端到端的业务服务拓扑图来可视化展示业务系统所有部件和关联关系。

把这四方面的功能整合起来,从最终用户的角度来衡量业务影响和风险;自动发现业务服务、应用和底层IT系统构件,并建立依存关系;理解用户感受,监控用户业务响应时间 ,在用户受影响之前发现问题,以求满足下列功能:

1 通过基于角色的业务视图,提供业务流和服务的可见性;

2 从最终用户的角度来衡量业务影响和风险;

3 设置和检测业务过程的SLA,了解应用性能对业务的影响;

4 24×7小时端到端监控,从浏览器到后台实时监控所有交易;

5 理解用户感受,监控用户业务响应时间 ,在用户受影响之前发现问题;

6 主动发现和按优先级管理关键业务问题;

7 通过自动把业务和底层运营信息建立关联来缩短平均问题修复时间;

8 自动发现业务服务、应用和底层IT系统构件,并建立依存关系;

9 通过联合的CMDB,来为IT环境提供一个“统一的真实数据”视图,这样就可以为用户提供一个主动的、以业务为中心的BSM解决方案,帮助用户极大地改善业务服务的性能和可用性,降低服务突然中断带来的风险。

提升IT部门的作用

以前,IT运维部门救火队式的混乱状况导致无法判断IT运维总体表现的好坏。而IT部门又是公认的成本中心,这就导致了在很多企业中IT部门总是承受着很多批评,IT人员的工作热情也不高。

而现在,IT运维部门实现了主动发现问题、提前处理故障;IT运维管理与实际的业务应用挂钩,IT运维部门的工作由无形化为有形;促进IT部门从成本中心向利润中心转变,这一切既有利于IT人员发挥其工作热情,也有利于IT部门在整个企业地位的提升。

中石油的IT运维管理就是要基于BSM模式来建设,F5项目就是要实现基于业务来管理IT,也就是要提高信息技术基础设施的可靠性和性能,降低支持成本,对基础设施的规划进行最佳的决策和采用更好的系统支持策略。同时,获取与业务运行相一致的信息技术服务与实践,整合网络、系统、数据库和应用系统管理等关键业务,从而服务于数据大集中趋势下数据中心运维模式的建立和各专业应用日常运维的需要。

近年来,在烟草行业内,信息系统运维服务标准化工作被提上了议事日程。早在2009年,国家烟草专卖局信息中心和中烟电子商务公司就专门举办了相关的研讨会。在当前情况下,如何才能保证烟草行业内的信息系统可靠、平稳运行?与之相适应的IT运维服务管理的行业需求,特别是运维服务标准化的要求,已逐步凸显并越来越迫切。为此,有一些行业内机构,已经开始采用ISO20000系列标准的思想,并参考ITIL框架规定的方法进行IT服务支撑系统规范化运维。

接触ISO20000

作为高度自动化的制造业企业,陕西中烟工业有限责任公司(下称陕西中烟)部署应用了众多的信息系统,包括企业资源管理系统(ERP)、决策管理系统、办公自动化系统(OA)、档案管理系统等等,如何确保这些信息系统安全、稳定、可靠地运行,如何确保这些系统的使用者对IT服务水平满意,是IT部门面临的重大挑战。

2009年初,北京中烟信息技术有限公司成为烟草行业内首家通过ISO20000国际标准的企业,这是ISO20000首次全面进入陕西中烟IT部门的视界。此后,我们对ISO20000国际标准原文进行了仔细的研读,发现该标准所体现的流程与方法非常具有借鉴意义。

为借鉴ISO20000标准以指导IT运维的日常工作,陕西中烟多次组织相关IT人员参观考察了部分企业的应用实例,并结合陕西中烟自身的业务特点,按照ISO20000的要求建立了一套适合自身的IT服务管理流程,并引入了PDCA——持续改进的方法论(P-计划,D-执行,C-检查,A-改进)。

考虑属于公司内部IT部门的自身属性,这套服务管理流程的重点是如何把握IT系统使用者的需求,并协调、管控各种资源满足需求,而且还能满足预算管理要求。

通过一番摸底和调研,陕西中烟参照ISO20000标准的要求制定了IT服务管理策略,并构建了事件管理、变更管理、配置管理、容量管理、信息安全管理、供应商管理共六个流程。根据自身的业务需求,制定了流程策略及 *** 作指南,并在实践过程中不断发展与改进。

经过半年多的实践应用,系统使用者对IT工作的满意程度明显提升,IT管理人员也感觉找到了IT管理的窍门。

对ISO20000的再认识

虽然陕西中烟没有以通过ISO20000认证为目标,但通过一些流程及策略的落地实施,IT部门对ISO20000有了新的认识。

陕西中烟为什么要实施ISO20000呢?很重要的一点就是希望借由实施ISO20000提升企业或部门的IT服务管理水平,获得一种良好的、可持续发展的内驱力。

ISO20000方法论在日常IT管理工作中起到了至关重要的作用,在IT服务管理水平上有了明显的提高,包括流程的规范性、不断改进服务方式与服务内容,最重要的是,业务活动的工作效率得到了可喜的提高。

相反的,如果在IT服务的过程中,不寻求改变、居安不思危、满足于现状,可能自身的水平还保持不变,但别人都进步了,相对而言自己还是落后了。所以停滞不前所带来的结局只能是无法适应新形势、新任务的需要,最终企业的业务活动受IT信息系统所制约。

“改则进,滞则废”,笔者认为这就是ISO20000国际标准的精髓。对于日常信息系统运维工作来说,陕西中烟建立在各业务系统中的信息系统对IT管理部门的技术支持、支持效果、质量、方式方法等的反馈,就是对IT运维人员的客观评价。业务部门提出了一些批评与改善要求,IT部门认真反思,查找原因,确定改进方案,并组织实施,同时让实施结果再接受客户的评价,如此这般持续改进,不断满足客户需要。自我批评,相当于内部审核或自评估,其实质就是寻找自身的不足,从而加以改进,不断得到提高。这也是为什么IT部门要定期进行流程回顾、不断提出改进计划的原因。

实际上,往往在运维工作中,IT人员不太喜欢听到“刺耳”的声音,但如果有问题不去正视,往往结果将更加糟糕。对于工作中长期存在的问题,若不能从根本上认识不足,不加以改进,下次遇到同样问题的可能性还很大,因为流程或工作方式方法上本身就存在问题。如果流程不合理,就需要进行重新梳理,直至符合业务需要并能达到预期目的;如果流程很规范但没有落实,那就是人的问题了,那该反思的就不是流程,而是这个人本身了。

国家一直在强调“可持续发展”,但对于IT信息管理工作来说,可持续发展的动力是什么呢?那就是不断提高信息管理水平、工作质量,提高信息系统的使用效率。而怎样才能做到这一点呢?其实,ISO20000为IT运维工作提供了答案,那就是一套科学的、良好的、能持续改进的方法,不断创新思维、创新服务。

作者简介

崔勇,1998年开始从事信息化建设工作,参与过陕西中烟信息化总体规划,在ERP实施项目管理、信息安全管理、IT运维管理等方面具有丰富经验。

以上就是关于如何做好IT运维管理工作全部的内容,包括:如何做好IT运维管理工作、[四级体系打造整体IT运维] 华为IT运维体系介绍、IT运维管理包含哪些内容等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/8867104.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-22
下一篇 2023-04-22

发表评论

登录后才能评论

评论列表(0条)

保存