业务应用:IT运维管理的核心 把业务指标分解到it运维中

业务应用:IT运维管理的核心 把业务指标分解到it运维中,第1张

所谓IT 运维管理,是指单位 IT 部门采用相关的方法、手段、技术、制度、流程和文档 等,对IT 运行环境(如硬软件环境、网络环境等)、IT 业务系统和 IT 运维人员进行的综合管理 IT 运维管理主要包括七个方面的管理内容:

1、设备管理:对网络设备、服务器设备、 *** 作系统运行状况进行监控和管理;

2、应用/服务管理:对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服 务的监控管理,如邮件系统、DNS、Web 等的监控与管理;

3、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复;

4、业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理, 主要关注该业务系统的 CSF(关键成功因素 Critical Success Factors)和KPI(关键绩效指 标Key Performance Indicators);

5、目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;

6、·资源资产管理:管理企业中各 IT 系统的资源资产情况,这些资源资产可以是物理存在 的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;

7、信息安全管理:目前信息安全管理主要依据的国际标准是 ISO17799,该标准涵盖了信 息安全管理的十大控制方面,36 个控制目标和 127 种控制方式,如企业安全组织方式、资产 分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;·日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩 效考核量化依据、提供解决经验与知识的积累与共享手段

内容来源于:ITSS符合性评估落地工具-云雀运维!!

所谓 IT运维管理,是指单位 IT 部门采用相关的方法、手段、技术、制度、流程和文档 等,对IT 如硬运行环境(软件环境、网络环境等)、IT 业务系统和 IT 运维人员进行的综合管理。

IT 运维管理主要包括八个方面的管理内容:

1 设备管理。

对网络设备、服务器设备、 *** 作系统运行状况进行监控和管理。

2 应用服务。

对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web 等的监控与管理。

3 数据存储。

对系统和业务数据进行统一存储、备份和恢复。

4 业务。

包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理, 主要关注该业务系统的 CSF(关键成功因素 Critical Success Factors)和KPI(关键绩效指 标Key Performance Indicators)。

5 目录内容。

该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理。

6 资源资产。

管理企业中各 IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互。

7 信息安全。

信息安全管理主要依据的国际标准是 ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和 127种控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等。

8 日常工作。

该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段。

由于信息技术的渗透性和先导性,信息技术已成为国内外企业战略决策的制定和调整、生产经营过程中的计划、组织、管理和控制不可或缺的重要工具以及公司核心技术的主要载体,信息技术促进了生产经营过程的集成化和科学化,从而成为各公司降低成本、维持技术领先地位的战略举措。

近年来,国内外各企事业单位都十分重视信息化建设,把加快信息化建设作为提高生产经营管理水平、促进业务流程优化、加强内部控制、提高决策质量和效率的重要手段。结合中国石油发展战略和业务需求,中国石油出台了统一的“十一五”信息技术总体规划,F5(企业信息系统管理)项目便是“十一五”信息技术总体规划中的一项,目标是建立集成的监控管理平台和统一、完善的运维管理体系,提高中国石油信息技术基础设施的可靠性和性能,从而保证中国石油各业务系统的高可用性,彻底改善IT服务的管理水平,提高客户满意度,降低IT服务支持成本。

被动的传统IT运维管理

市场研究机构Gartner调查发现,在导致IT基础设施出现故障的原因中,源自技术或产品方面的因素其实只占了 20%,而因为运维管理方面的原因则占到80%,可见IT系统运维及管理是相当重要的。企业每年对IT部门投资都不少,但是得到的效益却没有体现,问题仍然时常发生,感觉好像所有的投入都打了水漂。

企业的IT运维部门是一个吃力不讨好的部门,因为IT运维就是在后台默默地保证信息系统的正常运行,只有在问题发生的时候才想到还有IT部门的存在。这种现象是由于IT运维管理还处于传统模式,即无相应的运维监控软件或者是仅仅单独使用某项监控软件而没有联合使用。这种传统的IT运维管理是被动的管理,是孤岛式的管理,是与业务应用没有联动的管理。

1被动管理

传统的IT运维管理是救火式的管理。通常是用户先于IT人员发现问题,然后再找到IT部门要求解决问题。这是由于传统的IT管理采用人工方式管理基础设施,网络管理是从各种IT基础设备出发的,仅仅是保障各类IT设备如服务器、数据库、存储设备、交换机等等基础设施的正常运行。

不采用任何管理软件,仅仅靠运维人员定期轮询,或者执行某项命令来检查设备,在系统规模较小时,只要参与运维的技术人员足够负责,人工运维方式是可以满足日常运维需要的。但是,当应用系统达到一定的规模后,这种运维方式的弊端就暴露出来了。轮询一遍要花费几个小时,这样,轮询周期越长也就代表越需要更久才能发现故障。这种被动式管理IT导致有了问题不能及时发现。

2 无关业务、孤岛管理

有些企业虽然采用某一种或几种监控软件来监控IT基础设施,但这些监控软件都各自独立运作,没有进行对业务的整合监控。如果用户投诉业务应用不畅通,很难定位故障源,到底是网络、应用程序、数据库还是其他后台系统出了问题,或者是各部门踢皮球,都说自己所负责的设备正常

好一些的IT主管会把各个部门集合到一起开会,讨论问题根源。传统的IT运维管理方式是各类设备的管理各自为政,丝毫没有关联性。处理故障不便于追根溯源。每个人的精力有限,在专业应用系统赖以生存的各基础设施支撑单元上很难做到专、精、准的多面手角色,加之由于管理范围的界定和监控手段的限制,运维人员很难直接判定问题是出在基础网络、系统服务器、数据库还是应用系统自身,故障难以定位将直接导致业务恢复时间的推迟,影响业务系统的正常运行,大大降低服务质量。

将IT运维与业务相关联

IT运维是在后台默默地保证各项业务应用系统的正常运行。IT运维工作是无形的,怎样把这种无形的运维变为有形、甚至量化,这就要把IT的运维与业务相关联。传统的IT运维管理中,基础设施的运维工作不能和业务相结合,仅仅是在设备管理的层面上。这就导致IT管理的成绩没有体现。想想看,如有业务应用不正常,那网络或者服务器之类的任何一种基础设备的正常运行又有什么用呢业务应用是“1”,设备是“0”,没有了正常通畅的业务应用,那其他的都是空谈。只有在业务应用畅通的前提下,基础设施管理才有意义,才能体现IT运维管理的价值。

因此我们需要帮助企业IT:部门了解用户使用感受,关联真实用户感受和系统性能,指导问题事件定位和原因诊断 。

企业信息化发展过程首先是基础架构建设阶段,这个阶段主要是采购一些硬件和应用软件。随着采购的不断扩大,企业的IT组件不断完备,IT系统初具规模,这就产生了IT运维和管理的要求,即网络和系统监控(NSM)阶段,监控网络连通性和系统可用性,此阶段主要还是对IT设备的监控。随着企业业务日趋复杂,IT系统进一步扩大,这时就产生了对IT服务流程进行管理的需求,上升到第三阶段,即IT服务管理(ITSM)的阶段。以上三个阶段都是IT间接产生业务价值的阶段,对业务的顺畅起辅助监控的作用。

企业业务系统对IT系统依赖的不断增强,企业开始关心IT服务对业务带来的影响,强调从业务目标角度出发来管理IT,也就是到达第四个阶段――IT与业务融合的阶段,即BSM(Business Service Management,业务服务管理)阶段。企业可以根据业务目标对IT服务进行调整,以确保IT能够支持业务目标,从而直接产生业务价值(如图2所示)。

如今各类重要的IT应用系统相继在中国石油发挥着举足轻重的作用,所以IT应用系统的可用性尤其重要,例如ERP、OA、邮件、门户等各类重要的系统如果出现中断,都会给企业造成大量的经济损失,所以除了需要对各类应用系统部署冗余的设备以备保证其高可用性,同时也需要对应用系统进行监控和管理,并且进行关联管理。业务系统的可用性是由底层的各类基础设施的状态所决定的,因此建立一个有效的业务模型,将与某个业务相关的底层IT基础设施关联起来,该业务模型能够有效地定位故障根源。这样ERP的管理员只需要关心ERP业务的可用性,而没有必要去关注每台主机的性能参数和启动的进程,不但大大节约了运维时间,而且也提高了运维效率,使故障持续时间大大缩短了。

基于BSM的IT运维

当前中国石油IT运维管理的需求就是从业务出发,建立基于BSM解决方案的新型IT运维。

新型的IT运维管理系统要做得到的就是基于BSM架构的业务管理。

首先,要实时掌控最终用户对IT服务的使用体验,根据制定好的SLA(Service Level Agreement,服务等级协议)来管理业务服务的质量,这样就可以根据业务影响和SLA来对IT服务进行管理。

其次,通过端对端的应用交易时间测量,实现业务要求端对端的可见性;从最终用户的角度,来测量业务服务的响应性能,主动帮助运维人员在第一时间发现问题,以便在问题对用户造成不利影响之前,及时得到隔离、诊断和修复,把它们对业务的干扰降到最低。

第三,提供业务服务、应用及底层IT系统构架部件之间的映射关系。这种解决方案通常会基于一种称为CMDB(Configuration Management Database,配置管理数据库)来实现。通过服务依存关系映射技术,来展现业务服务、应用和底层IT系统构架部件之间的动态关系,这样就增进了对各种IT元素的掌控和理解。

第四, 借助业务服务与IT基础设施的依存关系,对告警事件进行管理。当IT系统的组件产生告警时,结合收集上来的底层的IT系统告警事件,对它们进行过滤、关联、聚合,根据对业务服务影响的严重性,来进行排序处理。

传统意义上的CMDB是服务流程中的一部分,是ITIL中最重要、最核心的概念之一,在以业务为核心的IT运维中,CMDB也是业务建模的主要工具。CMDB通过自动发现工具收集和一定范围的IT基础架构基础信息,包括配置项和关系,建立IT基础架构模型;并通过端到端的业务服务拓扑图来可视化展示业务系统所有部件和关联关系。

把这四方面的功能整合起来,从最终用户的角度来衡量业务影响和风险;自动发现业务服务、应用和底层IT系统构件,并建立依存关系;理解用户感受,监控用户业务响应时间 ,在用户受影响之前发现问题,以求满足下列功能:

1 通过基于角色的业务视图,提供业务流和服务的可见性;

2 从最终用户的角度来衡量业务影响和风险;

3 设置和检测业务过程的SLA,了解应用性能对业务的影响;

4 24×7小时端到端监控,从浏览器到后台实时监控所有交易;

5 理解用户感受,监控用户业务响应时间 ,在用户受影响之前发现问题;

6 主动发现和按优先级管理关键业务问题;

7 通过自动把业务和底层运营信息建立关联来缩短平均问题修复时间;

8 自动发现业务服务、应用和底层IT系统构件,并建立依存关系;

9 通过联合的CMDB,来为IT环境提供一个“统一的真实数据”视图,这样就可以为用户提供一个主动的、以业务为中心的BSM解决方案,帮助用户极大地改善业务服务的性能和可用性,降低服务突然中断带来的风险。

提升IT部门的作用

以前,IT运维部门救火队式的混乱状况导致无法判断IT运维总体表现的好坏。而IT部门又是公认的成本中心,这就导致了在很多企业中IT部门总是承受着很多批评,IT人员的工作热情也不高。

而现在,IT运维部门实现了主动发现问题、提前处理故障;IT运维管理与实际的业务应用挂钩,IT运维部门的工作由无形化为有形;促进IT部门从成本中心向利润中心转变,这一切既有利于IT人员发挥其工作热情,也有利于IT部门在整个企业地位的提升。

中石油的IT运维管理就是要基于BSM模式来建设,F5项目就是要实现基于业务来管理IT,也就是要提高信息技术基础设施的可靠性和性能,降低支持成本,对基础设施的规划进行最佳的决策和采用更好的系统支持策略。同时,获取与业务运行相一致的信息技术服务与实践,整合网络、系统、数据库和应用系统管理等关键业务,从而服务于数据大集中趋势下数据中心运维模式的建立和各专业应用日常运维的需要。

我想提出这个问题,应该有一个前提,从用户层面,或是从系统层面,数据保护等等,用户层面,可能是指用户的帐户安全性,保密性等。系统层面和数据层面应该就差不多了,如何隔离这些信息应该是关键。

计算机技术在企业中的应用越来越广泛,从最初的简单计算到初级办公,到现在的大型应用系统,计算机应用越来越来越深入到企业的各个方面,企业对计算机应用系统的依存度越来越高。而基础网络系统(网络设备、线路、服务器、桌面电脑等)则是计算机应用系统的运行保障,就好比是高速公路,路通则信息通,因而基础网络系统的运行情况对现代企业各项活动开展起着非常重要的作用。为了应对基础网络的运维,各企业应用多种管理手段、技术手段对IT运维进行提升,比如划分职能科室(组)、职能人员(网络管理员、网络安全员、系统管理员、数据库管理员、现场管理等岗位)是管理手段,应用ITSM(IT服务流程管理)、桌面安全管理、网管、活动目录服务等系统是技术手段。其中有的职能重复,有的系统交叉,本文以的笔者所在企业IT运维现状为背景,探讨IT运维的发展模式,旨在优化大型企业IT运维模式,更好地为企业服务。

1 IT运维现状分析

不同企业IT运维方式大不相同。由于不同地域,不同行业计算机应用发展水平不同,造成不同企业的管理模式大不相同,比如银行系统,由于计算机普及应用较早,地域分布较广,计算机应用及运维发展较快;而某些大型企业,由于管理者偏重主营产品,忽视在IT基础设施及应用系统上的投入,因而IT运维服务处于较低水平。

同一个企业IT运维方式也存在差别。同一企业,如果规模较大,二级单位较多,由于管理方式差别,运维模式也有较大不同。比如有些企业维护人员多,有些少,有些企业采用传统方式运维,有些企业则重视应用先进的管理系统等,这些原因造成同一企业内部的差别。

2 理顺思路,建立合适的IT运维架构

IT运维的目的

IT运维的目的主要有三个:第一个是提供一个稳定高效的基础网络平台,为各种计算机应用系统的正常运行提供保障;第二个是为客户提供满意的服务,使客户端与计算机相关的故障能快速地得到解决;第三个是节省人力,提高工作效率,快速处理基础网络的故障。正是基于这样的目的,所以企业在基础网络方面不断加大投入,在管理上不断创新。

分析企业目前各个应用系统

基础网络是为应用服务的,所以我们可以分出哪些系统是属于基础网络的,哪些系统是属于企业应用类的,比如某大型企业的信息系统中,ERP、MES、LIMS等系统是属于应用服务类系统,直接面对终端用户,而网管系统、桌面安全、ITSM、数据存储备份等则是属于基础网络类的,其中ITSM是直接为用户提供服务接口的,其它则是作为IT基础管理系统。对于应用服务类的系统我们要分析其可能故障,并理清解决的流程;对于基础网络类的系统,我们则要将其置于流程之中,理清如何协作才能更好地为用户层的应用系统服务。

建立合适的IT运维架构

传统的运维框架很简单,基本是负责人制,碰到运维方面的问题时由负责人分配工作,这样的方式初期运作简单高效,但随着企业规模的扩大及计算机应用的普及,传统作业方式受很多因素影响,比如分配工作难、耗费人力多、处理问题能力要求高、工作量大等,所以企业迫切需要新的IT运维模式。

某大型国有企业,对基础IT运维相当重视,近几年相继在各分公司推广部署桌面安全系统、防病毒系统、网管系统等,各分公司也针对企业实际情况上做了一些很好的系统,比如某大型企业应用的ITSM系统、上网行为管理系统,这些系统之间有些重复,但各有侧重,那么如何使各系统有机结合,建立一个合适的IT运维框架则是必要的。笔者从某大型企业IT运维现状出发,提出一种IT运维架构,仅供讨论,如图1所示。

图1中ITSM为用户服务接口,内控则是管理接口,用户端的问题进入ITSM系统后,按问题分类或业务分工进入相应的基础网络系统或应用系统处理,各系统也需要分别建立相应的运维架构,比如防病毒系统可以建立。

图1 IT运维架构

如图2所示的运维架构。经各系统处理完后反馈给用户并进行归档,内控则对整个运维过程进行规范化控制。

图2 防病毒体系的三级运维架构

3 优化结构,建立合适的运维流程

分析IT运维需要处理的各种问题。IT运维所需处理的故障种类很多,硬件故障还是软件故障、内部网故障还是外部网故障、系统问题还是病毒问题、用户端问题还是服务器端问题,网络设备问题还是应用系统问题等,列出工作中已遇到过的问题以及可能出现的的问题,通过分析,然后再来建立我们的流程,是建立合理流程的依据。

结合组织结构,建立合适的运维流程。IT部门一般按专业划分科室,比如网络、系统、应用开发、工业控制等,这种划分是以水平层面来管理的,传统管理模式基本都是这种方式,而新的基础IT运维系统要求以专业及技术水平来进行竖直层面的分工,比如ITSM要求一线处理现场基础问题,二线处理复杂问题,经理处理全局问题及疑难问题,从而对不同层次提出了不同的技术要求,因此企业需要在水平与竖直两个层面上找到一个平衡点,来建立合适的管理模式。结合企业实际情况,经过结构优化后,建立各个系统的运维流程,图1的运维架构显示,各个系统之间是相对独立而又相互联系,因此相应的流程必定是相对独立而又相互联系的。

4 防患于未然,注重日常管理工作

建立各系统的管理办法、推广预知维修思维。正如象设备维修由最初的事后维修发展到预知维修模式一样,IT运维模式同样要注重预知维修,即是在问题出现之前,根据一些监测系统(比如网管系统)、日志记录系统等发现异常现象,将故障消灭在萌芽状态。现代企业对计算机信息系统的依赖性越来越高,要求也越来越高,比如某大型企业的MES、ERP、IC卡等系统,要求7 X 24 h工作,任何一次小小的故障都可能造成巨大的经济损失,因此减少信息系统故障率是非常重要的。要做到预知维修,具体到工作中就是要建立各个系统的管理办法,其中要包括异常监测和应急处理等内容,一些关键系统必须有日报,周报或月报。ITSM系统中的常见故障和经验汇总功能即是预知维修思维应用在现代管理上的体现。

建立完善的文档资料。网络系统里的资料再详细,也有出故障甚至丢失的可能,维护良好的文档对于IT运维很有帮助。资料整理除了要求全面,清晰外,还需要满足两个原则,一个是动态更新,过时的资料会误导对事情的了解及判断;第二个是让一个新人能看明白,完全不了解情况的新人(具备专业知识)通过资料能了解现状,则说明这是一份高质量的资料。比如,企业网络连接的文档资料,好的文档的关键不是把每个连接到各个图形的工作站(假设保持最新信息)都进行归档,而是把注意力集中到网络互联(拓扑、交换机和路由器)、服务器、网关和防火墙上。路由器和交换机没有必要用图形(类似设备的图形)表示,用简单的几何形状(如五边形、圆、方块和矩形)表示即可。例如,总使用一个八边形表示一个核心层交换机、用五边形表示汇聚层交换机、用正方形表示接入层交换机。

5 分清责任,建立相应的激励制度

不同的岗位工作方式不同,比如有的现场维护,有的远程处理;不同的技术水平要求不同的待遇,比如ITSM系统中一线技术人员与事件经理责任不同,待遇应该不同,因此企业应当推出相应的奖罚、晋升制度,以激励员工进步。本文着重于运维模式,对此不作进一步探讨。

6 结语

企业为优化生产、提高工作效率、减少成本,采用多种基础网络维护系统和生产应用系统,达到上述目的的同时,也对IT运维模式提出了更高的要求,新的运维模式要求一个清晰的运维架构和合理的工作流程, 同时更要注重日常管理工作和激励机制,这样才能更好地为企业服务。但企业在适应新的系统过程中,必然会出现一些问题,比如员工心态难适应、组织结构难协调、奖罚制度难改变等,这对很多企业是一个挑战。

IT运维管理系统至少应该具备下面几个特点: 统一的运行展现:可以给运维管理人员提供网络管理、业务应用管理、机房环境等资源监控系统的集中展现与处理平台,这即方便运维人员 *** 作,也解决了IT系统的统一协调问题; 问题的管理功能:可以帮助运维人员查明突发事件或错误产生的根本原因,并制定解决问题的方案和防止错误再次发生的有效措施; 变更的管理:通过分析、计划、执行和回顾四个阶段,最大限度控制变更的风险,保持企业IT部门和客户之间的信息沟通,这不但降低了对人的依赖,而且还实现了运维的量化、标准化管理。

以上就是关于什么是IT运维管理全部的内容,包括:什么是IT运维管理、IT运维都包含什么工作内容、业务应用:IT运维管理的核心 把业务指标分解到it运维中等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/langs/8830430.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-22
下一篇 2023-04-22

发表评论

登录后才能评论

评论列表(0条)

保存