IT运维管理当前面临了哪些问题

IT运维管理当前面临了哪些问题,第1张

在ITIL实施初期,大部分公司会重点建设ITIL的主要流程,经验表明,如下流程的成功实施能给企业带来明显的成效:

(1)故障管理流程建设

故障管理流程的目标是在给用户和公司正常的业务活动带来最小影响的情况下,尽快返回到SLA中定义的正常服务级别;保留故障的有效记录以便能够权衡并改进处理流程,给其他的服务管理流程提供合适的信息,以及正确报告进展情况。

故障管理在实际工作中是使用最频繁也是见效最快的一个流程。但故障管理流程实施落地时经常碰到一些难题,使得故障管理无法达到最佳状态,如:如何进行故障单的设计,可以更好地进行故障管理流程考核以及人员绩效考核在紧急情况下,按照正常的流程填写故障单然后再派单的方式,可能无法满足响应速度的需要。如何解决这一现实需求与流程规范性之间的矛盾

(2)服务台的建设

服务台是服务提供商与用户间的单一联系点。典型的服务台负责管理敀障和服务请求,还负责与用户的沟通。服务台的类型包括分布式服务台和集中式服务台两种。不同的企业具有不同的组织结构、业务类型,而与用户成熟度和领导的想法也都不同,服务台的实施会碰到诸多的问题。

(3)问题管理流程的建设

(4)配置管理流程的建设

配置项(CI):IT组件以及运用这些IT组件提供癿服务被称为配置项(CI)。配置项可以包括由IT部门所控制的所有PC硬件、各种软件、有源和无源网络、服务器、中央处理器、文件、规程、服务和所有其他的IT组件。

配置管理:指由识别和确讣系统的配置项、记录和报告配置项状态和变更请求、检验配置项的正确性和完整性等活动构成的服务管理流程。

配置管理流程的目标:计量组织和服务中所使用的所有IT资产和配置项的价值;为其它服务管理流程提供有关IT基础架构配置的准确信息;为事件管理、问题管理、变更管理和发布管理的运作提供支持;核实有关IT基础架构的配置记录的正确性并纠正发现的错误。

CMDB的建设实施是一个软件工具、实施经验、执行力度综合较量的过程。以下是CMDB建设的常见问题:

(5)知识库的建设

知识库的建设往往是经历这样一个历程:兴奋期、创业期、蜜月期、苦恼期、颓废期、废止期。究其原因,主要是在构建和运营知识库过程存在以下三方面的问题难以解决。

(6)服务目录的建设

服务目录是一个数据库或有组织的文档,包含关于所有实时IT服务的信息,包括就绪可部署的服务。服务目录是服务组合中唯一向客户发布的部分,用于支持IT服务的销售和交付。服务目录包括关于交付物、价格、联系点、订购和申请流程等信息。

服务无形性和交互性的特点使得服务目录的梳理成为一门玄学,很多IT服务经理经常抱怨服务目录的梳理缺乏统一的标准。

根据IT系统运营阶段的特点,IT管理可以划分为三大部分:

一、运行/维护

该部分是IT管理的核心和重点部分,也是内容最多、最繁杂的部分,该阶段主要用于IT部门内部日常运营管理,涉及的对象分成两大部分,即IT业务系统和运维人员,该阶段的管理内容又可细分为七个子系统:

1、设备管理:对网络设备、服务器设备、 *** 作系统运行状况进行监控应用/服务管理:对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理

2、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复

3、业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理 ,主要关注该业务系统的CSF(关键成功因素Critical Success Factors)和KPI(关键绩效指标Key Performance Indicators)

4、目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理

5、资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互

6、信息安全管理:该部分包含了许多方面的内容,信息安全管理主要依据的国际 标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127种控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等

7、日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段IT运行维护管理的每一个子系统中都包含着十分丰富的内容,实现完善的IT运维管理是企业提高经营水平和服务水平的关键。运行/维护阶段与服务/支持阶段的分界线为前者是面向IT部门内部的管理,而后者是面向业务部门、企业中的其它人员或直接面向客户

二、服务/支持

该阶段主要为IT部门的运维人员向其它人员(内部和外部)提供服务与支持,内容主要包括用户投诉与申告的及时响应与处理,系统故障发现、通知、分派、监督、解决、回馈流程的闭环方式管理。该部分的实现会极大提高IT部门的服务意识和服务水平、规范服务与技术支持的流程,该部分与优化/变更阶段的分界线是 IT部门服务水平的考核是否能够满足业务部门或客户的要求,如果现有IT系统已经不能满足要求,则进入优化和变更阶段。

三、优化/变更

该部分指IT部门在IT系统、业务应用、软件开发的建设阶段结束,进入运营阶段后对系统优化、软件升级、设备配置和管理策略变更进行的管理。

1、变更管理:主要用于建立合理、科学、规范的变更流程管理,包括立项/变更申请、审批、执行、数据和版本的一致性和连续性保持等。

2、服务水平管理:通过定义服务水平协议,并利用相应监控手段、或模拟用户行为以及用户体验追踪等方式考核IT部门为业务部门或客户提供的服务,并根据考核结果评价IT部门的运维工作情况,评估IT系统是否需要改造或替换。

3、性能/响应管理:采集IT和业务系统的性能数据,定位系统性能瓶颈,诊断系统性能下降或不稳定原因,分析系统运行历史数据,推断系统运行趋势。

随着中国信息化水平发展的加速,IT系统越来越复杂,越来越庞大,公司业务对IT系统的依赖性也日渐提高,IT系统的任何波动和故障,都会直接影响公司业务的正常开展和进行,企业需要具备合理有效的IT运维策略来保证业务系统的正常运作。

一、IT运维管理的现状及问题

信息系统的架构创新不仅仅带来了效率提升、成本下降等管理层面的价值,更是成为了企业加速形成差异化经营、保持核心竞争力优势的关键,而IT系统的运维与管理是企业业务系统的保障,更是企业生存和快速发展的支撑。

公司在信息化水平日益完善的同时,随之而来的是更多的应用系统、软硬件平台和设备等需要维护和管理。如何对结构复杂的IT系统进行有效的监控和管理,已经成为了企业信息化部门非常关注的一个问题。作为IT管理部门,经常被大量的IT故障和问题所困扰,“拆东墙补西墙”的尴尬场景也是常常上演。不论哪一家企业,只要它的员工和IT系统发展到一定的水平,就会不可避免地面临IT系统管理的一系列难题。

IT运维管理工作中可能存在的问题有:

11IT运维管理机制不完善,流程 *** 作不统一

许多企业尚没有建立起稳定和规范的IT运维机制。现有的IT运维流程的 *** 作不规范不统一。如IT事件单提交之后,事件预判和优先级的设定不统一,没有规范性的指导文档,仅以运维工程师的经验判断或约定俗成的主观方式引导IT事件的处理。有识别但不规范,有处理但无管理,有人员但疲于应付,有系统但用不好。因此,“轻规范、重维护”的IT运维管理现状很容易造成因员工技能水平参差不齐带来的IT运维不稳定,直接影响维护体系的效果。简单点说就是还未脱离传统管理思想的束缚。

12过度依赖核心人员,年轻员工成长慢

IT运维管理是一个系统性的技能,在实际工作中积累的的经验始终仅能在小范围内得到传播和继承,这就形成了企业里面的一个特殊景象,同样是IT运维部门,有的员工独挡一面从白天忙到天黑累倒吐血,有的员工经验平平帮不上什么忙反倒悠哉游哉。尤其是IT的使用部门,对于有经验的IT运维人员更加依赖和倚重,这样导致了无论是IT事件性质的识别、优先级的界定,还是问题的分析判断,均汇总至少数核心人员进行处理。所谓大事小事一把抓,这样不仅增加了少数核心人员的工作量,也容易产生工作流程的“瓶颈”,降低运维管理部门整体的工作效率,也会让一些核心员工产生巨大的压力感。

对于ITIL这种高度抽象的理论框架,可能有的CIO朋友可能会觉得实用性不强,无法与自己的实际业务结合,无法落地,尤其是老外搞得东西,晦涩难懂,虚无缥缈。

本人负责IT多年来看,对ITIL有一些个人的理解,特别是经过了理论与实践的结合,总体来讲,我个人认为ITIL是非常有效的IT服务管理工具。

理论是通过很多的实践而总结出来的,包含很多的经验和教训,理论的好处就是使用场景广。当我为IT服务流程迷茫的时候,拿ITIL的几个模块来参考一下,就会恍然大悟,理解到ITIL其实已经覆盖了IT日常服务工作中绝大多数的场景。

没有理论引导就如同瞎子抹黑,走出一条路很难,有了理论就有了方向,尝试在工作中运用,如同指明灯,不断领悟,IT服务管理工作就会容易很多。

ITIL分为服务交付和服务支持两部分,服务交付更多是我们IT人员在做的日常工作,服务支持是后端支撑的工作,为服务交付提供必须的基础。

详细的流程这里不展开谈,里面的内容很多,后面分不同文章论述,主体的部分可以从我这个图中看到,从用户的服务请求开始,到服务台,事件管理,问题管理,变更管理,配置管理,基本上都是我们IT人员日常在做的工作,这里ITIL做了提炼总结,脑中存着这样一个图,工作的时候起码会有一个大概的路子,不至于走的太偏,也不至于有大的遗漏。

下面的服务支持部分,包括服务等级管理,可用性管理,能力管理,IT服务连续性管理,财务管理,这些多是我们CIO或IT负责人需要考虑的事情,通常在年度预算的时候需要考虑明年需要新增哪些系统或者设备,有哪些扩容需求,服务的RTO和RPO是怎么样,来规划IT的技术和软硬件的支持能力,决定IT的投资预算,来支撑服务交付从而提供客户服务。

采用何种远维方案可谓见仁见智,并且不同的公司有不同的安全需求和硬件前提。毫无疑问,远程维护不同于本地运维采用什么样的远维方案应该有一个基本的原则。安全和方便应该是选择远维方案的出发点。

远维首先要保证安全性,不管是内网还是外网的远控要保证控制端与被控端的唯一性。也就是说,要预防第三端的介入,杜绝“第三人”的参与。要做到这一点,在被控端要做好安全部署(比如关闭多余端口、IP过滤、控制列表等),以防未经授权的恶意控制。另外,远控方式的安全性也要保证(比如对数据进行加密等),以防“中间人”的嗅探。

远维的方便性这个很好理解,也是IT人员追求的目标。方便性应该包括两个方面的含义,一是 *** 作上的便利,能够以最快的速度实施远程维护,二是远维较少受外界因素的限制(比如地理位置、软硬件设备等),可以随时随地的进行远维。选择方便的远维方案,不仅提高了工作效率,而且保证了假日的质量。

按照ITL规范来讲,it运维流程分为:事件管理流程、问题管理流程、变更管理流程、发布流程。在日常运维中,从发现运维问题开始,提交一个新的运维事件到解决此事件。这个过程为事件流程。当运维过程中某个事件发展成为常态或发现潜在的影响面广的问题,则提交一个问题流程。在解决问题流程的过程中,需要对系统环境或软硬件设施进行修改或变动,则需要提交一个变更流程。

计算机技术在企业中的应用越来越广泛,从最初的简单计算到初级办公,到现在的大型应用系统,计算机应用越来越来越深入到企业的各个方面,企业对计算机应用系统的依存度越来越高。而基础网络系统(网络设备、线路、服务器、桌面电脑等)则是计算机应用系统的运行保障,就好比是高速公路,路通则信息通,因而基础网络系统的运行情况对现代企业各项活动开展起着非常重要的作用。为了应对基础网络的运维,各企业应用多种管理手段、技术手段对IT运维进行提升,比如划分职能科室(组)、职能人员(网络管理员、网络安全员、系统管理员、数据库管理员、现场管理等岗位)是管理手段,应用ITSM(IT服务流程管理)、桌面安全管理、网管、活动目录服务等系统是技术手段。其中有的职能重复,有的系统交叉,本文以的笔者所在企业IT运维现状为背景,探讨IT运维的发展模式,旨在优化大型企业IT运维模式,更好地为企业服务。

1 IT运维现状分析

不同企业IT运维方式大不相同。由于不同地域,不同行业计算机应用发展水平不同,造成不同企业的管理模式大不相同,比如银行系统,由于计算机普及应用较早,地域分布较广,计算机应用及运维发展较快;而某些大型企业,由于管理者偏重主营产品,忽视在IT基础设施及应用系统上的投入,因而IT运维服务处于较低水平。

同一个企业IT运维方式也存在差别。同一企业,如果规模较大,二级单位较多,由于管理方式差别,运维模式也有较大不同。比如有些企业维护人员多,有些少,有些企业采用传统方式运维,有些企业则重视应用先进的管理系统等,这些原因造成同一企业内部的差别。

2 理顺思路,建立合适的IT运维架构

IT运维的目的

IT运维的目的主要有三个:第一个是提供一个稳定高效的基础网络平台,为各种计算机应用系统的正常运行提供保障;第二个是为客户提供满意的服务,使客户端与计算机相关的故障能快速地得到解决;第三个是节省人力,提高工作效率,快速处理基础网络的故障。正是基于这样的目的,所以企业在基础网络方面不断加大投入,在管理上不断创新。

分析企业目前各个应用系统

基础网络是为应用服务的,所以我们可以分出哪些系统是属于基础网络的,哪些系统是属于企业应用类的,比如某大型企业的信息系统中,ERP、MES、LIMS等系统是属于应用服务类系统,直接面对终端用户,而网管系统、桌面安全、ITSM、数据存储备份等则是属于基础网络类的,其中ITSM是直接为用户提供服务接口的,其它则是作为IT基础管理系统。对于应用服务类的系统我们要分析其可能故障,并理清解决的流程;对于基础网络类的系统,我们则要将其置于流程之中,理清如何协作才能更好地为用户层的应用系统服务。

建立合适的IT运维架构

传统的运维框架很简单,基本是负责人制,碰到运维方面的问题时由负责人分配工作,这样的方式初期运作简单高效,但随着企业规模的扩大及计算机应用的普及,传统作业方式受很多因素影响,比如分配工作难、耗费人力多、处理问题能力要求高、工作量大等,所以企业迫切需要新的IT运维模式。

某大型国有企业,对基础IT运维相当重视,近几年相继在各分公司推广部署桌面安全系统、防病毒系统、网管系统等,各分公司也针对企业实际情况上做了一些很好的系统,比如某大型企业应用的ITSM系统、上网行为管理系统,这些系统之间有些重复,但各有侧重,那么如何使各系统有机结合,建立一个合适的IT运维框架则是必要的。笔者从某大型企业IT运维现状出发,提出一种IT运维架构,仅供讨论,如图1所示。

图1中ITSM为用户服务接口,内控则是管理接口,用户端的问题进入ITSM系统后,按问题分类或业务分工进入相应的基础网络系统或应用系统处理,各系统也需要分别建立相应的运维架构,比如防病毒系统可以建立。

图1 IT运维架构

如图2所示的运维架构。经各系统处理完后反馈给用户并进行归档,内控则对整个运维过程进行规范化控制。

图2 防病毒体系的三级运维架构

3 优化结构,建立合适的运维流程

分析IT运维需要处理的各种问题。IT运维所需处理的故障种类很多,硬件故障还是软件故障、内部网故障还是外部网故障、系统问题还是病毒问题、用户端问题还是服务器端问题,网络设备问题还是应用系统问题等,列出工作中已遇到过的问题以及可能出现的的问题,通过分析,然后再来建立我们的流程,是建立合理流程的依据。

结合组织结构,建立合适的运维流程。IT部门一般按专业划分科室,比如网络、系统、应用开发、工业控制等,这种划分是以水平层面来管理的,传统管理模式基本都是这种方式,而新的基础IT运维系统要求以专业及技术水平来进行竖直层面的分工,比如ITSM要求一线处理现场基础问题,二线处理复杂问题,经理处理全局问题及疑难问题,从而对不同层次提出了不同的技术要求,因此企业需要在水平与竖直两个层面上找到一个平衡点,来建立合适的管理模式。结合企业实际情况,经过结构优化后,建立各个系统的运维流程,图1的运维架构显示,各个系统之间是相对独立而又相互联系,因此相应的流程必定是相对独立而又相互联系的。

4 防患于未然,注重日常管理工作

建立各系统的管理办法、推广预知维修思维。正如象设备维修由最初的事后维修发展到预知维修模式一样,IT运维模式同样要注重预知维修,即是在问题出现之前,根据一些监测系统(比如网管系统)、日志记录系统等发现异常现象,将故障消灭在萌芽状态。现代企业对计算机信息系统的依赖性越来越高,要求也越来越高,比如某大型企业的MES、ERP、IC卡等系统,要求7 X 24 h工作,任何一次小小的故障都可能造成巨大的经济损失,因此减少信息系统故障率是非常重要的。要做到预知维修,具体到工作中就是要建立各个系统的管理办法,其中要包括异常监测和应急处理等内容,一些关键系统必须有日报,周报或月报。ITSM系统中的常见故障和经验汇总功能即是预知维修思维应用在现代管理上的体现。

建立完善的文档资料。网络系统里的资料再详细,也有出故障甚至丢失的可能,维护良好的文档对于IT运维很有帮助。资料整理除了要求全面,清晰外,还需要满足两个原则,一个是动态更新,过时的资料会误导对事情的了解及判断;第二个是让一个新人能看明白,完全不了解情况的新人(具备专业知识)通过资料能了解现状,则说明这是一份高质量的资料。比如,企业网络连接的文档资料,好的文档的关键不是把每个连接到各个图形的工作站(假设保持最新信息)都进行归档,而是把注意力集中到网络互联(拓扑、交换机和路由器)、服务器、网关和防火墙上。路由器和交换机没有必要用图形(类似设备的图形)表示,用简单的几何形状(如五边形、圆、方块和矩形)表示即可。例如,总使用一个八边形表示一个核心层交换机、用五边形表示汇聚层交换机、用正方形表示接入层交换机。

5 分清责任,建立相应的激励制度

不同的岗位工作方式不同,比如有的现场维护,有的远程处理;不同的技术水平要求不同的待遇,比如ITSM系统中一线技术人员与事件经理责任不同,待遇应该不同,因此企业应当推出相应的奖罚、晋升制度,以激励员工进步。本文着重于运维模式,对此不作进一步探讨。

6 结语

企业为优化生产、提高工作效率、减少成本,采用多种基础网络维护系统和生产应用系统,达到上述目的的同时,也对IT运维模式提出了更高的要求,新的运维模式要求一个清晰的运维架构和合理的工作流程, 同时更要注重日常管理工作和激励机制,这样才能更好地为企业服务。但企业在适应新的系统过程中,必然会出现一些问题,比如员工心态难适应、组织结构难协调、奖罚制度难改变等,这对很多企业是一个挑战。

以上就是关于企业如何进行IT服务管理全部的内容,包括:企业如何进行IT服务管理、IT管理的内容、IT运维管理当前面临了哪些问题等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/8845545.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-22
下一篇 2023-04-22

发表评论

登录后才能评论

评论列表(0条)

保存