IT运维管理包含哪些内容

IT运维管理包含哪些内容,第1张

一、IT营运管理方法论现今的企业为了强化自己在这个新世纪的竞争力,导入了ERP系统、供应链系统、CRM系统、决策支持系统、知识管理系统等等,这些系统最后都要进到企业的IT营运体系中。当我们透视解决方案生命周期时,可以看到,所有的解决方案最后都要进到企业的IT营运体系中,为企业员工所使用。如果IT的整个营运管理做得不好,那这些花大钱建置起来的系统再好功能再强也没有用,因为使用者根本无法顺利地使用它们。某大型电子公司,共运行了四十多个应用系统,当他的信息主管被问到,哪一个系统最重要时,他回答:「IT的营运与管理最重要!唯有好的IT营运管理,才能让公司上上下下好好的用每一个系统。」这个见解实在是一针见血。既然IT营运管理非常重要,那么如何提供好的IT 服务,对IT 主管或CIO 而言当然是非常重要的课题。答案是采用更新的技术或添购功能更强的设备吗?在1999 及2000年Gartner Group 广泛访问企业CIO 有关服务或应用程序无法使用(downtime) 的原因。结果大家最常认定会出问题的技术或产品(包括硬件、软件、网络、电力失常及天灾等),其实只占了20%,那么占大宗的是什么呢?我想你已经猜到了,作业程序(Process) 失误就占了40%,另外作业人员(People) 疏失也占了40%。作业流程失误包括变更管理(Change Management) 没有做好、超载、没有测试等等程序上的错误或不完整。作业人员疏失包括忘了做某些事情、训练不足、备份错误或安全疏忽等等。Gartner Group 这份访查结果正是80/20 法则的再次印证。我们常想要把系统的可用度提高,当然就是要花大钱购买标榜可提高可用度的硬件或软件。孰不知这个部分事实上只占了系统停机原因的20%。如何做好IT 服务管理,首要工作当然是加强流程和作业人员管理,因为那才是造成系统无法使用的主要原因- 两个原因加起来共占80%!我们常听人家说大型主机(Mainframe) 的 系统比较稳定可靠,所以经过了这么多年还是有许多企业愿意花大钱继续一年年采用。其实真的是它的系统软硬件更好吗?恐怕并不尽然。我们知道,大型主机系统 有着一套完整清楚的系统运作规范可遵循,人员在训练时花在运作程序方面的心力绝对不亚于系统软硬件,甚至是更多。有了严谨的程序,加上完整的人员训练,自 然就可以把那80%的系统停机风险降到最低。那么是否有方法论,可以用来建构企业内IT 服务管理而且是主要IT 厂商都支持的呢?

二、什么是ITILITIL(Information Technology Infrastructure Library)是信息系统运营与服务管理标准,用于定义IT部门管理工作中需要的各个工作程序(Process),以及各个工作程序之间的相互关系。在跨国公司IT经理中素有"IT界MBA"之称。80年代中期,英国政府部门发现提供给其的IT服务质量不佳,于是要求当时的政府计算机和电信局(CCTA),启动一个项目对此进行调查,并开发一套有效的和可进行财务计量的IT资源使用方法以供本国的政府部门和私有部门使用。同时,这种方法还应该是独立于厂商的并且可适用于不同规模、不同技术和业务需求的组织。这个项目的最终成果是一套公开出版的IT服务管理指南,即ITIL(Information Technology Infrastructure Library)。虽然ITIL当初只是为英国政府开发的,但是在90年代初期,它很快就在欧洲其它国家和地区流行起来。到90年代中期,ITIL成为了事实上的欧洲IT服务管理标准。90年代后期,ITIL又被引入到美国、南非和澳大利亚等国家和地区。2001年英国标准协会(BSI)在国际IT服务管理论坛(itSMF)年会上正式发布了以ITIL为基础的IT服务管理英国国家标BS15000。2002年BS15000被提交给国际标准化组织(ISO),申请成为IT服务管理国际标准。国际标准组织已接受这个申请,并为此设立了一个专门工作组。该标准有望在2006年前后生效,可以说,ITIL已是事实上的国际IT服务管理标准。ITIL的目的是帮助企业降低IT运营管理成本,并且提高IT服务水平,提高业务部分的满意度。

三、ITIL的核心思想ITIL它并不是一套理论模式,它所根据的是最佳的实际经验。其中的许多经验不但广为人知,而且有无数的IT机构都是采用它来提升IT服务的效率及加强IT部门间的横向沟通。这套方法论历经了十数年的考验,证明它是最被IT业界广为接受的一套经营IT经验指南,等于是IT管理的业界标准。ITIL将IT的工作分为两大类:分别为《服务支持》(《Service Support》)和《服务提供》(《Service Delivery》Service Support针对的是一般系统的运作部分,目的是让使用者可以顺利存取到IT服务。其中包括Service Desk、事件处理与追踪、问题处理与追踪、系统变更、系统配置设定的记录与维护,以及版本的发行与控管。第二大类Service Delivery则是针对IT部门对客户提供信息服务时应有的工作程序。其中包括服务层级的约定与管理、IT服务的财务管理、系统可用度管理、系统容量的测量与未来规划、灾难情况的业务持续运作规划与系统复原。《服务支持》(《Service Support》包括如下流程:

1 事件管理(Incident Management): 识别偶发的事件。

2 问题管理(Problem Management):对服务台识别的偶发事件的潜在原因加以诊断,安排改正IT基础设施的错误并进行问题预防指导。

3 变动管理(Change Management):变动管理过程确保使用标准方法和规程有效且迅速处理所有变动。变动管理旨在提高组织的日常运作水平。

4 配置管理(Configuration Management):识别、控制、维护和检验现有的包括基础设施和服务在内的IT资产。

5 发布管理(Release Management):通过控制软件、硬件的发行和版本确保信息系统资产的安全,并消除不同版本引起的潜在问题。 《服务提供》(《Service Delivery》)包括如下流程:

1 服务水平管理(Service Level Management):服务水平管理的目标是通过协调IT用户和提供者双方的观点,实现特定的、一致的、可测量的服务水平,以为客户节省成本、提高用户生产率。

2 可用度管理(Availability Management):可用性管理的目标是优化IT基础设施的性能,它的服务和支持的组织。可用性管理导致成本节省的、持续的服务可用性水平,这种服务可用性确保业务满足其目标。

3 能力管理(Capacity Management):使组织在危机出现时管理资源并提前预测需要的额外的能力。它描述了计划、实施和运行该过程必需的规程。

4 持续性管理(Continuity Management):在尽量少的中断客户业务情况下,提供IT服务,并在IT系统出现问题时,以可控的方式恢复。

5 财务管理(Financial Management):确定IT服务的成本核算,设定预算,监督预算执行情况,根据提供的服务收取费用。 针对ITIL管理流程的具体实现,ITIL标准又将实现工具分为三类:Process Management Tools—过程管理工具Analysis Tools—分析工具Execution Tools—执行工具 四、XX银行IT管理规划建议全面实施ITIL模式对任何IT企业都至关重要,但在实施时通常需要循序渐进,并且要从最急迫需要解决问题处入手。最重要的是要采用统一的符合ITIL标准的信息架构。另外,在实施前,切记先记录下现有环境数据,以便随着时间的流逝来衡量成效。我们建议xx银行将规划分为:短期目标,中期目标,长期目标三个阶段实施,从而构建符合ITIL标准的IT服务和管理平台。短期目标:达到目的1)立符合ITIL标准的统一的信息架构(altiris notification server)

2) 保证统一的配置管理数据库(Configuration Management Database)

3)实现变更管理、配置管理、问题管理变更管理(Change Management)为何要做变更管理呢?这里举两个因为变更管理没做好而蒙受重大损失的例子来说明。2001 6 ,NASDAQ当机长达半天,原因是 *** 作人员做了一个未经测试的变更动作,结果导致整个系统停机。同样也是在2001年6月,NYSE在半夜做了一个软件变更的变更动作,导致部份系统当机,无法完成股票买卖交易。这两件事都上了报纸及新闻头条,包括华尔街日报、CNN 及CNBC等等。这反映出了变更管理真的很重要,一旦没有做好它,企业的关键任务(Mission Critical)系统就会受到影响。以银行业为例,只要是IT部门当机一小时,其导致的结果可能是全体员工要花上数倍或甚至是数十倍的时间来补救,而且因为分行里客户大排长龙,负面报导上了晚间新闻及报纸,企业形象受损的损失更是无法估计。这也可以说明为何企业CIO 把变更管理视为第一要务。为进行变化管理,IT组织中应该有变更管理员(Change Manager)及CAB(Change Advisory Board)的编制。变更管理员是全程负责监督RFC从提出到结案整个过程的人。CAB代表是变更咨询委员会。配置管理:在公司内,通常会做所谓的资产管理(Asset Management),也就是把每项公司资产是何年何月何日购入、哪一个会计科目、负责人是谁等信息记载在数据库中,这是一般传统的资产管理方式。但是实际经验显示,如果用这种方式来管理IT相关资产,包括硬件、软件、网络等等,结果会因为记录的信息太过简化而衍生出许多问题。IT资产的管理所必须记录的信息要比一般资产多得多。目前有经验的IT部门都有一套方式来记录IT资产。但是IT资产的管理难道就只是详尽记录它的型号版本等等这些规格信息而已吗?其实这是不够的,还要包含该项资产所有的配置设定,以及它与其它IT资产之间的相互影响关系。这些配置都会输入到所谓的「配置管理数据库」(CMDBConfiguration Management Database)中。准确而完整的CMDB是相当重要的。因此要有一个机制来提供这个信息,这个机制就是配置管理(Configuration Management)。配置管理可存取并提供IT资产正确信息和这些资产间的关系,还能提供对系统的影响及趋势分析,降低未经授权软件的使用情形,以及控制所使用的IT资产。问题管理问题管理的目标就是要找出事件或问题发生的真正原因,并找出对策或步骤来解决问题。我们常说要对症下药。没有针对原因来解决问题,可能可以让服务暂时还可以使用,但如果错误原因没有被消除的话,将来还是会发生问题,事件还会再重复发生─ 进而再度影响IT服务的提供。这 也就是为什么要有问题管理的原因。唯有找到原因,才能解决问题,避免同样的问题一而再,再而三的发生。问题管理分成两个部分,一个是被动的部分─等事件通 报变成问题,再来分析问题,找出问题发生原因,加以诊断,再提出解决方法及步骤。一个是主动的部分,分析趋势,事前先找出可能潜在的问题,主动提出解决方 法及步骤,预防问题将来发生。

4) 对应altiris工具

配置管理Configuration Management 过程管理工具/分析工具/执行工具

Altiris Architecture- altiris notification server 建立统一的信息管理架构

Altiris Inventory solution 资产管理

Altiris web reports 报表分析功能

Asset Control solution 固定资产管理,建立最完整统一的资产信息及相关联信息

变化管理Change Management 分析工具

Altiris Inventory solution 资产管理

Asset Control solution 固定资产管理

Altiris web report 报表分析功能

Application Metering Solution 应用软件管理

执行工具

Altiris software delivery 软件部署与升级管理

Altiris client management suite 客户端 *** 作系统部署、升级;软件的部署与升级;微软补丁自动安全管理;远程控制等。

问题管理Problem management及事件管理 Incident management 分析工具

Altiris Inventory solution IT 资产管理

Asset Control solution 固定资产管理

Altiris web report 报表分析功能

Application Management Solution 应用管理

执行工具

Altiris Deployment Solution 系统部署、升级和管理

Application Management Solution 应用管理

Carbon Copy Solution 远程控制

中期目标:达到目的:实现事件管理、持续性管理(Continuity Management)、可用度管理在现今全球化经济社会下,可用度及IT服务持续性管理可说是最举足轻重的两个重要程序。营运服务能否持续每天24 小时,一周7天地正常运作,变得愈来愈重要。可用度能左右顾客满意度,并且能快速的影响企业整体声誉及业务是否成功。IT服务持续性管理程序是要确保正常可用的解决方案发生问题后,依然能够持续提供另一个等级的IT服务给客户。从这个观点来看,可用度管理及IT服务持续性管理的关系非常密切。这两个管理程序都是试图减小IT服务的可用度危机。可用度管理的焦点主要是集中在处理日常可能出现会影响到可用度的危机,如果无对应的反制措施或反制措施没有办法完全涵盖或应付时,这些危机就由应变计划及IT服务持续管理程序来处理。IT服务持续管理程序分做3 个步骤。第一步是取得Service Level Agreement,然后分析及找出每层的危机,将IT服务分成下列层级:服务、应用软件、中介软件、 *** 作系统、硬件、网络、环境、外在影响因素。第二步是提出这些紧急状况的解决方法;这包括两个部分:第一个部分是Failover,第二个部分是Recovery。Failover 包括有几种选择:Cold Standby、Warm Standby 及Hot Standby。第三步则是制作应变计划。对应altiris方案:

服务水平管理(Service Level Management) 过程管理工具/分析工具/执行工具

Altiris helpdesk Solution 建立统一的service desk

持续性管理(Continuity Management) 分析工具

Altiris Site Monitor Solution 网络站点监控模块

Altiris Monitor Solution 服务器监控模块

Application Metering Solution 应用监控模块

执行工具

Altiris Recovery Solution 恢复模块

长期目标:达到目的:IT财务管理分析(Financial Management)

IT财务管理分析Financial Management) 过程管理工具/分析工具/执行工具

Altiris Contract Management Solution 合同管理

Altiris TCO Management Solution IT 总体拥有成本分析

而ITSM最强调的就是流程、人员和技术三大要素的有机结合,ITSM在实施过程中不仅部署相应的管理工具,同时将根据企业的具体情况制定人员的岗位职责、设计日常工作流程,以及突发事件和问题管理流程等等。例如一汽大众在谈到为什么要引入IT服务管理的理念时就提出了以下原因:为IT系统用户提供单一的联系点,任何用户在发现问题时都可以有统一的接口;为IT部门管理层提供具体的统计报告,对IT部门工作可以量化衡量;丰富和完善已知问题的知识库;协助提高服务台支持人员解决问题的整体能力;能够预测系统资源的支持能力;能够进行主动性问题处理;提高客户满意度。这些原因既代表了企业客户在IT服务管理方面的典型需求,同时也是ITSM的目标。另外ITSM能够降低管理成本,达到服务规范化,运维流程化,管理系统化。

在IT服务管理和运维自动化这个领域,业界近年来的发展比较快。从IT服务管理(ITSM)、数据中心自动化(DCA)到开发运营一体化(DevOps),相关概念和理论不断涌现。从IBM、BMC、HP等传统厂商各类工具产品纷纷面世到Puppet、Ansible、Saltstack等开源解决方案风起云涌,各类工程实践也是精彩纷呈。

说到运维分为哪几种,首先有必要先讨论一下运维的定义。通常我们把运维的含义界定为数据中心各专业技术岗位的日常运维工作,具体而言,就是各专业技术岗位人员与各类软硬件运维对象进行交互 *** 作的活动。

所以在过去,运维是个专业密集型、知识密集型工作,直到今天,它在一定程度上还是劳动密集型工作。从运维行业的发展趋势来看,运维工作从早期的人工运维,到自动化运维,如今已走向了智能运维。现在,越来越多的企业意识到,智能运维是一种全新的数字化运维能力,企业基于已有的运维数据,通过机器学习方式从而解决自动化运维无法解决的问题,这也将是数字化转型的必备能力。因为智能运维能够帮助企业快速发现异常、有效诊断问题根因、以业务为导向地进行运营分析和决策、持续有力地提升运维数据质量。

现在,智能运维发展正如火如荼,Gartner预见其为下一代运维,认为到2022年将有近50%的企业用户部署智能运维。

其实这个过程和手机的发展历史很像。一开始我们惊喜的称呼iPhone为“智能手机”,而今天再没有人叫它“智能手机”因为这就是手机该有的样子。所以运维也是如此,在企业数字化转型大潮中,“智能”是运维本该有的样子。

内容来源于国内领先的智能运维AIOps落地解决方案供应商擎创科技。

ISO 20000是面向机构的IT服务管理标准,目的是提供建立、实施、运作、监控、评审、维护和改进IT服务管理体系(ITSM)的模型。建立IT服务管理体系(ITSM)已成为各种组织,特别是金融机构、电信、高科技产业等管理运营风险不可缺少的重要机制。ISO 20000让IT管理者有一个参考框架用来管理IT服务,完善的IT管理水平也能通过认证的方式表现出来。

IT服务管理(ITSM)[1] 是一套帮助企业对IT系统的规划、研发、实施和运营进行有效管理的方法,是一套方法论。ITSM起源于ITIL(IT Infrastructure Library,IT基础架构标准库),ITIL是CCTA(英国国家电脑局)于1980年开发的一套IT服务管理标准库。它把英国在IT管理方面的方法归纳起来,变成规范,为企业的IT部门提供一套从计划、研发、实施到运维的标准方法。这套标准已经被欧洲、美洲和澳洲的很多企业采用,目前在欧洲40-60%的IT经理都知道ITSM,在美国有20-30%的IT经理了解ITSM,而在国内了解ITSM的人还很少。itSMF的CEO Aidan Lawes认为,“对一个企业来说,不管其IT架构多大,都需要ITSM,目前把业务与IT能够很好集成的客户还不多,很多人首先想到的是业务,然后才是IT,而不是用IT去驱动业务。” Aidan Lawes认为有必要要从教育入手普及ITSM,让人们从学生时代就意识到ITSM的重要性。

基于不同的出发点和侧重点,人们提出了各种各样的有关IT服务管理的定义。

国际IT领域的权威研究机构加特纳(Gartner)认为,ITSM是一套通过服务级别协议(SLA)来保证IT服务质量的协同流程,它融合了系统管理、网络管理、系统开发管理等管理活动和变更管理、资产管理、问题管理等许多流程的理论和实践。

而ITSM领域的国际权威组织itSMF(国际IT服务管理论坛)则认为ITSM是一种以流程为导向、以客户为中心的方法,它通过整合IT服务与组织业务,提高组织IT服务提供和服务支持的能力及其水平。

ISO/IEC20000标准发展于BS15000标准,始于1995年,后来几经发展迭代,成为了由两部分内容构成ISO20000信息技术服务管理体系,并且被IT服务管理广泛接受的标准。

一、IT服务简介

11 什么是IT服务管理

世界IT领域的权威研究机构加特纳和IT服务管理领域的国际权威组织IT服务管理论坛(itSMF)都有不同的理解。经过多年的发展和研讨,IT服务管理国际标准ISO20000对IT服务管理提供了简洁明了地定义,即IT服务管理就是“管理服务以满足业务要求”,这个概念直接明确了IT服务管理的目标是必须满足业务的要求,而服务管理的内容则落在其定义的十三个过程及其管理的管理。同时ISO20000鼓励在交付被管理的服务时采用综合的过程方法,以满足业务和顾客要求。

12 为什么要实施基于ISO20000标准的IT服务管理

随着市场竞争的加剧和电子商务在世界范围内的兴起,现在的企业必须持续不断地和快速地对其业务进行管理和变革。这些企业的业务很大一部分越来越依赖于其IT系统来提供使客户满意的服务,为了实现高质量的服务管理,可以借鉴服务管理的“最佳实践”。这些实践在英国商务部开发的ITIL系列指南和英国率先开发的国家标准BS15000实施基础上,最终形成了ISO20000国际标准。

经验表明,企业通过实施基于ISO20000的IT服务管理方案可以取得良好的效益,包括:

(1) 将IT和企业业务进行更好的整合;

(2) 提高IT服务质量,降低IT服务成本,从而提高了IT投资价值;

(3) 使IT成为更有效的业务变革手段;

(4) 更好的发挥员工的作用,提高了员工的工作积极性。

而IT服务提供商通过基于ISO20000有效实施IT服务管理,就能向其国内外客户广泛地证实其服务提供的能力,给客户提供广泛认可的信心,从而增强其市场竞争优势。

对于ITIL这种高度抽象的理论框架,可能有的CIO朋友可能会觉得实用性不强,无法与自己的实际业务结合,无法落地,尤其是老外搞得东西,晦涩难懂,虚无缥缈。

本人负责IT多年来看,对ITIL有一些个人的理解,特别是经过了理论与实践的结合,总体来讲,我个人认为ITIL是非常有效的IT服务管理工具。

理论是通过很多的实践而总结出来的,包含很多的经验和教训,理论的好处就是使用场景广。当我为IT服务流程迷茫的时候,拿ITIL的几个模块来参考一下,就会恍然大悟,理解到ITIL其实已经覆盖了IT日常服务工作中绝大多数的场景。

没有理论引导就如同瞎子抹黑,走出一条路很难,有了理论就有了方向,尝试在工作中运用,如同指明灯,不断领悟,IT服务管理工作就会容易很多。

ITIL分为服务交付和服务支持两部分,服务交付更多是我们IT人员在做的日常工作,服务支持是后端支撑的工作,为服务交付提供必须的基础。

详细的流程这里不展开谈,里面的内容很多,后面分不同文章论述,主体的部分可以从我这个图中看到,从用户的服务请求开始,到服务台,事件管理,问题管理,变更管理,配置管理,基本上都是我们IT人员日常在做的工作,这里ITIL做了提炼总结,脑中存着这样一个图,工作的时候起码会有一个大概的路子,不至于走的太偏,也不至于有大的遗漏。

下面的服务支持部分,包括服务等级管理,可用性管理,能力管理,IT服务连续性管理,财务管理,这些多是我们CIO或IT负责人需要考虑的事情,通常在年度预算的时候需要考虑明年需要新增哪些系统或者设备,有哪些扩容需求,服务的RTO和RPO是怎么样,来规划IT的技术和软硬件的支持能力,决定IT的投资预算,来支撑服务交付从而提供客户服务。

作为IT管理的“ERP解决方案”,IT服务管理给实施它的企业、企业员工及其他利益相关者提供多方面的价值。这些价值可归纳为商业价值、财务价值、员工利益、创新价值和内部价值: IT在商业中扮演着越来越重要的角色,通过实施IT服务管理,可以获取多方面的商业价值,比如:

确保IT流程支撑业务流程,整体上提高了业务运营的质量;

通过事故管理流程、变更管理流程和服务台等提供了更可靠的业务支持;

客户对IT有更合理的期望,并更加清楚为达到这些期望他们所需要的付出;

提高了客户和业务人员的生产率;

提供更加及时有效的业务持续性服务;

客户和IT服务提供者之间建立更加融洽的工作关系;

提高了客户满意度。 IT服务管理不但提供商业价值,而且使企业在财务上直接受益,比如:

降低了实施变更的成本;

当软件或硬件不再使用时,可以及时取消对其的维护合同;

“量体裁衣”的能力,即根据实际需要提供适当的能力,如磁盘容量;

恰当的服务持续性费用。 IT服务管理也使服务人员多方面受益,比如:

IT人员更加清楚了解对他们的期望,并有合适的流程和相应的培训以确保他们能够实现这些期望;

提高IT人员的生产率;

提高了IT人员的士气和工作满意度;

使IT部门的价值得到更好的体现,从而提高了员工的工作积极性。

创新价值

IT服务管理提供的创新价值包括:

IT服务提供方更为清楚地理解客户的需求,确保IT服务有效支撑业务流程;

更多地了解当前提供的IT服务的有关信息;

改进IT支持,使业务部门能够更加灵活地使用IT;

提高了服务的灵活性和可适应性;

提高了预知未来发展趋势的能力,从而能够更加迅速地采用新的服务需求和进行相应的市场开发。

以上就是关于如何基于ITIL构建有效的IT服务管理体系全部的内容,包括:如何基于ITIL构建有效的IT服务管理体系、什么是IT服务管理三个要素、IT运维管理包含哪些内容等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/8810181.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-21
下一篇 2023-04-21

发表评论

登录后才能评论

评论列表(0条)

保存