IT运维的管理现状

IT运维的管理现状,第1张

企业IT运维的难题并不是网络应用能力的不足而是网络运维管理能力和IT运维服务的缺失。网络运维的行业标准为ITIL,通过ITIL在企业的实践,我们可以从以下几个方面提高企业的网络运维服务能力:

1.基于ITIL流程和理念,建立合理的工作流程,合理安排人员岗位,明确职责,避免一旦出现故障,互相推诿或者不知该找谁解决的情况。能保障在业务中断的第一时间找到相关负责人去解决问题,迅速恢复业务。

2.实现统一监控平台,将各种监控资源通过集中展现和告警的方式进行统一管理,从整体上全面、快速了解系统当前的运行状态,帮助运维人员快速定位故障,缩短排查时间。

3.高效的、合理的流程设置和流转,相互关联的事件工单、问题工单、变更工单、配置工单,使得运维工作流转过程中的资源关联清晰、过程明确可控、历史数据和处理过程可查,提高业务系统运行效率。

4.高效、实时、准确的配置管理库可为运维服务提供所需的配置项信息,可通过设定的条件自定义查询、浏览、打印,不必费时费力去整理杂乱繁多的纸质记录,降低IT运维人员工作量。

5.追踪资产生命全周期的资产管理,可对所有台账资源一目了然,对资产的使用状态准确记录,提高资产设备的重复使用率,及时淘汰报废设备,更新所需设备,提高IT资产使用率,降低IT资产投入。

6.建立知识库积累,避免专业的技术问题永远只能依赖某一个或几个专业人员来解决的现状,使运维工作中的实际经验和专业知识得到共享,让人人都能成为IT运维专家。

7.量化运维人员的运维工作,通过运维分析数据制定运维考核标准,逐步提高运维人员的服务水平和服务质量。

在企业内部也是一样,当大量的生产和经营数据集中在数据中心,一旦人们与数据中心因为IT故障而失去联系,停滞的也许不是个人应用受阻这样简单的后果。为了应对大数据下的新业务需求,传统的IT运维管理就需要针对数据中心基础架构做出改变,这种进化包括针对虚拟化和服务交付能力的调整,以及IT与业务融合所必备的方法和工具。 数据中心迎来了“按需配置”的变革 过去,每次当我们的数据中心的业务容量不足的时候,就会想到增加更多的硬件、设备来满足客户需求。但在海量数据汹涌来袭的时候,这种增加都是被动的、延迟的。据统计,互联网上的数据每两年翻一番,而目前世界上90%以上的数据都是最近几年才产生的,这为大数据概念的横空出世做好了准备。数据的增长超出了我们的预期,那么是否可以找到一个办法,让我们可以对业务部门提供一种“按需分配”的低成本方案呢?虚拟化技术以其降低成本、灵活性,以及动态的扩容特性,给出了最佳的答案。 许多企业希望采用云计算和虚拟化技术实现“按需配置”的基础环境、服务等级,实现更低的成本和更高的盈利。然而,要从大数据这个藏量巨大的金矿中淘到金子,并没那么容易,传统架构下的IT运维管理与成熟的虚拟化技术并没有齐头并进。 首先,虚拟机一旦出现故障,如果不能及时恢复,这个损失可能远远超过节省电源和空间的费用。其次,虚拟机的灵活性对IT运维中的“配置管理”可谓是一杯毒酒,泛滥的迁移和扩容会让IT基础设备重新回到混乱的过去。在传统数据中心,管理员可以确定地表述:我的数据库在服务器A上运行,这台服务器与交换机B进行连接并使用存储阵列C,它们的性能指标都非常良好。但动态数据中心采用虚拟化技术后,解耦了这种关系,更具伸缩性,或是随意的(人们对“灵活性”的误读)利用这些基础设施资源。业务系统可以位于服务器集群中的任何计算节点上,可以利用任何存储设备上的存储空间,可以使用虚拟网络,也可以进行转移以满足性能或运营需求。但这些优势,却在IT运维管理中造成“看不见”、“说不清”的严重问题。 虚拟化运维管理的“两大难题”如何突破? 如果你都不知道自己的IT环境里有什么,就别指望控制、维护和提高它们。因此,配置管理和性能监控在任何时候都没有变,它们只是进化到了更高的阶段。 作为国内领先的IT运维管理专家,北塔软件认为:IT运维管理不是一蹴而就的,更不是一成不变的,大数据情形下的网络管理将要应对更多的技术和管理层面的挑战。之前,针对基础设施的监控一般侧重对物理设备、物理网络、物理存储的管理,而虚拟化后的变更 *** 作变得越来越简单,但这会使得一些虚拟机脱离管理的范围,尤其是在配置管理和性能监控两个方面。管理人员需要对新增的虚拟网络、数据存储、虚拟机、ESX/ESXi主机数量、集群对象提供一种与之配套的IT运维管理工具。 从改进配置管理开始着手是很重要的一步,因为这可以清晰地呈现出不断变化的虚拟机、物理服务器、存储和网络资源之间的关系。另外,随着每台物理机上托管的虚拟机数量增多并提高了整体利用率,性能测算与监控的重要性也在攀升。为了预防虚拟机密度过大,或者利用率不足的问题(虚拟化之后,这个问题并没有完全消除),运维管理人员必须拥随时调整物理主机的承载力。 为了消除用户大数据时代的运维顾虑,在全面提供了对主机、网络、机房等领域的管理解决方案之后,北塔软件在北塔BTIM(BetasoftIntegratedManagement,IT综合管理软件)中增加了针对VMware虚拟化管理和FC-SAN存储管理解决方案。

伴着IT在企业中的作用日益明显,IT建设和IT运维同时成为了企业效率的加速。同时,计算机硬件系统和软件系统的运维已成为了各行各业单位,尤其是信息服务部门普遍头痛的事情。本文以下内容总结几个头痛的主要因子,拿出来供大家参考指导,并接下来的系列课题中会对针对这些现状提出改进措施 。

现状一:IT运维人员成本偏高

据专业调查,大多数CIO表示最关心的是IT运维成本过高。原因是在过去的5年中,很多企业都实施了很多IT系统,使得IT运行越来越复杂,也越来越难管理。同时,其中有50%的受访CIO认为IT运维成本过高的一个原因是IT运维的自动化做得还不够好,依靠手工流程来管理,不但使到运维效率不高,而且人力成本更是花费惊人。

同时,另一家国际知名调查机构Gartner调查发现,在IT运维成本中,源自技术或产品(包括硬件、软件、网络等)成本其实只占20%,而流程维护成本占40%,运维人员成本占40%。流程维护成本包括日常维护、变更管理、测试成本等;人员成本包括训练、教育、人员流失、招聘成本等。

从图中,我们可以看出, “流程维护”类和“运维人员”两者都与软性方面的成本相关非常紧密。而且三者的关系可以用下图来表示:

备注:C类成本的大小很大程度取决于B和D类。

现状二:处在“救火式”的IT运维控制

国内在IT运维过程中,IT员工大多数只是处在被动低效率手工救火的状态,只有当事件已经发生并已造成业务影响时才能发现和着手处理。这种被动“救火”会导致:①IT运维人员终日忙碌,IT运维人员日常大部分时间和精力是处理一些简单重复的问题;②IT运维本身质量很难提高;③再加上故障预警机制的不完善,往往是故障发生后或报警后才会进行处理,不但事倍功半而且故障还常常会出现恶性连锁反应;④IT部门和业务部门对IT运维的服务满意度都不高。

现状三:简单的自动化程度起了“反作用”

尽管IT运维管理的技术在不断进步,但实际上很多IT运维人员并没有真正解脱出来,主要原因是自动化不高而导致的。技术虽然能够获取IT设备、服务器、网络流量,甚至数据库的警告信息,但成千上万条警告信息堆积在一起根本没法判断问题的根源在哪里。还有,许多企业的更新管理绝大多数工作都是手工 *** 作的。即使一个简单的系统变更或更新往往都需要运维人员逐一登录每台设备进行手工变更,当设备数量达至成百上千时,其工作量之大可想而知。而这样的变更和检查 *** 作在IT运维中往往每天都在进行,占用了大量的运维资源。因此,实现运维管理工作的自动化对企业来说已迫在眉睫。

就如图中一样,所有信息(杂乱)都从各个地方被收集到了这个圆圈(容量不变)里面,信息进去后不能主动流出来。可能会出现的情况:这个圆圈容器装满后会爆破,或者是溢出来;圆圈的运行速度会慢慢降下来,从而导致信息输入的速度也会变慢。

现状四:本是同家兄弟,却不经常来往

这个问题主要是发生在拥有许多子公司的企业,每个子公司的系统都是独立的,下面主要以国内银行业为例。以前国内的银行业没有搞集中建设,每家银行的各个地方分行都单独建设和维护自己的核心业务系统,都各自配备开发人员和维护人员。

同时在运行维护方面,对故障的解决,完全依靠运行维护部门的工程师的上门服务。不管问题大小,工程师都要来回去现场解决。遇到一些技术难度大的问题,如果工程师的水平高,处理起来就快;如果水平低,甚至花上几个小时,可能也解决不了。

虽然国内银行业的IT运行维护管理水平,有点接近国外80年代末90年代初银行业的水平,银行IT结构上都采用了大集中模式。从硬件设备上来看,国内银行不比别人差,甚至还有些领先,但IT运维管理还没达到国外当时的水平,尤其是呼叫中心、客户服务方面。”

结束语

从上面三个现状来看,主要是有关软性方面的。的确如此,国内借着近十几年高速发展,硬件方面的发展取得了重大进步,某些方面的水平甚至是超过了国外的水平,并且IT硬件的生产厂商也是出现了很多与国外厂商同等秀舞的水平,如华为、中兴等。但是往往是硬件易学,知识技巧难寻。这不仅与国内教育环境有关外,还与知识经验的继承有关。

管理要动态匹配业务需求

IT部门还会经常联合HR、法务等部门一起做跨部门的沟通,面对的对象是各部门的管理层,让他们理解企业的IT策略。

所谓的IT是对整个行业的称呼

IT是信息技术的简称,Information Technology,指与信息相关的技术。不同的人和不同的书上对此有不同解释。但一个基本上大家都同意的观点是,IT有以下三部分组成:

-----传感技术 这是人的感觉器官的延伸与拓展,最明显的例子是条码阅读器;

-----通信技术 这是人的神经系统的延伸与拓展,承担传递信息的功能;

-----计算机技术 这是人的大脑功能延伸与拓展,承担对信息进行处理的功能。

所谓信息化是用信息技术来改造其他产业与行业,从而提高企业的效益。在这个过程中信息技术承担了一个得力工具的角色。

顺便说一句何谓IT产业,有一个大致的分类,可以供大家参考:

IT基础技术的提供 IC研发、软件编写 如INTEL、MS等

IT技术产品化 元器件、部件、组件制造 如精英、大众等

IT产品集成化 计算机及外设制造商 如联想、IBM

IT产品系统化 解决方案、信息系统 如华为、HP

IT产品流通 渠道、销售 如神州数码

IT产品服务 咨询服务和售后服务 如蓝色快车

IT产业舆论支持 IT类媒体 如CCW、CCID

IT产业第三方服务 各种需要配套的服务 如法律咨询、PR服务

IT后备人员培养 各种院校 如计算机专业

IT产业合作组织 各种协会、集会

如上所述,IT行业分涉及方面,最常见的软件开发,应用集成等等

如果单从软件开发来讲,你即使目前毕业了也做不了开发,还需更进一步的学习

1、Ewei工单系统+在线技术支持,让IT运维管理高效运转

首先可以将所有员工都纳入到Ewei工单系统,根据部门分好组。并在这个系统中创建、分派和处理工单。公司各部门遇到系统、软件、硬件、网络等BUG问题可直接在易维工单中创建工单,工单根据服务目录智能分派到相对应的IT部门,工程师收到工单任务,会对其故障做出处理,处理完毕再反馈回相应的渠道。

在此过程中,发起者无需不断地催单、跟单,处理人员也无需不断地反馈处理进度。且不管是IT运维问题还是公司内部其他问题,都可通过Ewei Helpdesk建立工单,分派给需要处理的部门,提高协同工作效率。

此外,多元化的在线技术支持可帮助IT人员省去亲临现场的任务,直接与发起者建立起远程控制邀请,由于占用带宽少,即使是在网速并不是很好情况下,IT人员也能轻松地通过远桌为其公司内部员工处理问题,远程结束后系统也会自动生成工单存档。

最后,每一张工单都有迹可循,未处理的工单系统会自动报警提醒工程师,根本不会出现漏处理情况。易维工单不仅打通了内部服务流程,其整个处理人、响应和处理时长、处理进度、反馈结果,这些状态和信息过程都能一目了然。快速提高IT运维管理,促进企业内部正常运转。

2、通过Ewei帮助中心建立起强大的知识库,开启自助服务模式

为了进一步维护好企业内部IT运维工作,减轻IT人员工作,可利用易维帮助台的帮助中心,建立起建立完善的知识库,将常规的、简单的IT问题分档上传。便于各部门查阅、按照文档内容进行 *** 作、解决简单的IT问题。

一旦知识库成为企业的百宝箱,企业内部员工遇到常规的IT问题可以直接通过关键字检索查询文档,找到答案。同时,为IT部门在工作上起到了很好的支撑作用,也开启了自助服务模式,减轻任务,提高工作效率。

IT服务是大概念,可分为建设和运维(运行维护)两部分。对项目建设来说,容易被大众接受。

IT运维的重要性:

就是通过结构化的综合布线系统和计算机网络技术,将各个分离的设备(如个人电脑)、功能和信息等集成到相互关联的、统一和协调的系统之中,使资源达到充分共享,实现集中、高效、便利的管理。系统集成实现的关键在于解决系统之间的互连和互 *** 作性问题,它是多厂商、多协议和面向各种应用的体系结构,需要解决各类设备、子系统间的接口、协议、系统平台、应用软件等与子系统、建筑环境、施工配合、组织管理和人员配备相关的面向集成的问题。

IT运维的必要性:

第一,所有的电子产品(硬件设备)都有寿命问题,而信息系统包含大量不同种类、不同功能、不同性能的设备,每种设备的寿命各不相同,长的5—10年、短的3—5年,对信息系统而言,几乎在项目建设完成后即需进入项目运维期,而对某些建设周期需要很多年的信息系统来说,在项目建设后期,便要对前期建设的项目进行运维。这里还没有考虑设备发生故障的情况,而设备发生故障是一定的,只是发生的概率大小而已。对单台设备来说,也许几年不发生一次故障,但对包含数百、数千甚至数万台(套)设备的信息系统而言,故障发生的概率要高很多。

第二,硬件设备更换、升级导致被动运维。由于硬件寿命及技术进步(摩尔定律:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。这一定律揭示了信息技术进步的速度),硬件产品会不断升级,导致原来使用的各种软件需被动升级,而系统软件升级也会导致应用软件必须进行升级改造以适应新环境。

第三,系统软件、工具软件由于自身存在各种缺陷(业内称为Bug,现在各种软件都极为庞大、复杂,要在编程中完全杜绝Bug几乎不可能),需要主动修正和完善。

第四,除上面所说的由于运行环境改变而需要被动升级应用软件外,还有就是自己主动升级。主要是随着时间的推移,对系统功能有新要求,或者是政策变化,需要系统功能跟着改变,所有这些问题都需要对系统进行运维,或者说需要升级、改造,不断完善。

第五,应用软件同系统软件一样,其本身也存在各种缺陷需修正和完善,而且应用软件是直接目的用户,不像硬件和系统软件对用户是“透明”的,是在后台发挥作用,有时仅是使用人员因对使用界面不习惯,都需作修正、完善。

何谓IT运维管理?在了解这个概念之前,我们首先需要了解一下什么是IT管理?

天天客服IT运维管理中心专家龙少文解释:IT管理是在信息化运营阶段通过运维管理制度的规范,IT管理系统工具的支持,引导和辅助IT管理人员对各种IT资源进行有效的监控和管理,保证整个IT系统稳定、可靠和永续运行,为业务部门提供优质的IT服务,以较低的IT运营成本追求业务部门较高的满意度。

简而言之,可以理解IT运维管理为:在网络的基础设施建设完成之后,整个网络处于运行状态,IT部门采用相关的管理方法,对运行环境(包括物理网络,软硬件环境等)、业务系统等进行维护管理,我们把这种IT管理的工作简称为IT运维管理。

IT运维管理包含内容

IT运维是IT管理的核心和重点部分,也是内容最多、最繁杂的部分,主要用于IT部门内部日常运营管理,涉及的对象分成两大部分,即IT业务系统和运维人员。其管理内容又可细分为七个子系统:

第一、设备管理:对网络设备、服务器设备、 *** 作系统运行状况进行监控,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理;

第二、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复;

第三、业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理,主要关注该业务系统的CSF(关键成功因素CriticalSuccessFactors)和KPI(关键绩效指标KeyPerformanceIndicators);

第四、目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;

第五、资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;

第六、信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127中控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;

第七、日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段IT运行维护管理的每一个子系统中都包含着十分丰富的内容,实现完善的IT运维管理是企业提高经营水平和服务水平的关键。

IT运维管理面临的难题

IT运维管理是一门探讨如何提高网络应用性能的课题,怎样利用网络管理做到企业IT基础设施建设的管理、合理分配网络资源、保障生产业务、对网络规划和新业务上马提供支撑,而其最核心的目的是保障企业生产业务。

日常IT运维管理面临诸多难题,具体体现在以下多个方面:

网络设备

在企业IT基础设施的搭建过程中,底层的网络设备厂商和类型多样且复杂。随之而来的问题是:如何将不同厂商的网络和应用管理产品在界面级、消息

级和数据级集成起来实现统一管理?如何让IT管理员了解到整个网络全局的运行情况、发展趋势和可能存在的故障隐患点,以便及时采取相应措施,实现事前管

理。

拿曾经碰到过的一个典型客户来说,它的网络中有11种厂商的路由交换设备,还有存储设备,安全设备,UPS等。同时还拥有:小型机,服务器等,上层的业务系统有OA和CRM等。这样大而复杂的一个网络环境,该怎么管呢?

科学的运维管理思路告诉我们,首先需要解决的是对IT基础设施的管理,管理范围要能覆盖到机房所有硬件设备。这一点是前提和基础。其次,才是对各种应用系统做到很好的监控。最后,才能为业务系统提供足够的保障。

网络流量

在绝大多数的企业网络中,存在不同程度的网络延迟,造成重要业务和应用时断时续,这直接成为企业业务的杀手。另外,网络的带宽也是企业关心的重

点。比如,哪个时间段很拥挤,哪个时间段很空闲,有没有规律,怎么样去调查拥塞的原因,网络带宽都是被谁占用了,是被哪些客户端、哪些应用或者异常应用所

占用了。这些都是摆在每一个企业运维管理领域中很实际的问题。

 该如何很好的解决这些问题呢?

根据多年的运维管理经验得出,对于这种情况,需要采用流量分析的方式。通过对出口流量或者监控对象进行采集,进行24小时实时的监控和分析,可

以对流量进行多角度多层次的挖掘分析,比如按照流量、数据包个数、连接数、协议等类别分析当前网络的负载情况,为网络的优化配置提供参考。通过报表分析展

现流量特征,让IT管理员明白流量被谁、被何种应用、被何种异常行为占用得怎么样。

IT运维管理怎么样帮助IT管理员判断和控制安全问题,也就是作为与防病毒、防火墙、IPS等安全产品不同的角色,从网络的整体情况要能够判断未知的安全问题,并提供修复方案,

在不影响正常网络运行状况下将安全问题防患于未然。如果IT管理员能针对异常行为的特征建立自动告警,在某些安全攻击出现前发现故障隐患,并提供连动的判

断和处理机制,这样IT管理员可以及时采取了措施避免业务遭受损失。如果能在对问题特征自动告警的同时,自动记录问题的原始数据以供事后分析,这样IT管

理员可以再现数据异常行为、捕捉网络数据异动入侵记录,对症下药制订策略防止问题的再次发生。

业务系统

针对日益复杂的业务系统,现有的运维管理系统更多的强调的是功能的展现。比如,从业务主机负载、数据库服务器负载、数据库、中间件、应用系统、

网际流量、进程状况等等不同角度实施联合监控,强调的是性能参数指标的多少,或者是界面的美观程度。当然,这是落实业务系统管理环节所采用的方法。

但事实上,作为企业自身来说,无论采用哪种监控也好,IT管理手段或者运维管理系统也罢,其核心总是需要围绕保障和改进企业的业务系统。

 这就提出一个问题,如何来保障又如何改进企业的业务系统呢?

首先,需要了解清楚业务系统所涉及的具体环节,针对每一个环节进行管理落实。按照科学运维管理的建设思路,分为:用户-网络-硬平台-软平台-

业务系统这五个环节。需要从这五个环节所涉及到的五个方面去做工作。这五个方面分别是:全局的性能管理、故障和事件管理、资源的使用状况管理、安全管理和

数据分析管理。其次,通过性能和历史数据的反映,又可以做到对业务系统提供改进决策的指导。

当然,对于如何保障和改进业务系统这个问题,目前业界众说纷纭,没有统一的标准。但有一点是肯定的,就是需要从企业用户的角度出发,通过明确的管理思路作为指引,使用软件+服务的方式和企业用户共同探索和研究,最终达到对业务的保障和改进。

当前IT运维管理的任务

在企业网络运维早期,IT运维管理侧重于网络、硬件等设备。随着业务系统涉及的环节日益增多,单一的网络管理已经不足以满足管理需求,越来越多的企业已经将关注点从单一网络转变到当前的业务系统,落实保障业务系统的各个环节成为重中之重。

因此,我认为,当前国内用户最关心的莫过于如何保障业务系统的正常运行。IT运维系统应该从业务角度切入,以业务为导向,通过对整个业务系统的关注,落实业务系统的各个环节,从而来达到保证业务系统稳定运行和透明化管理的目的。

以上就是关于ITIL如何解决企业IT管理的痛点全部的内容,包括:ITIL如何解决企业IT管理的痛点、如何应对大数据时代的运维挑战、IT运维的管理现状等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/8826555.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-22
下一篇 2023-04-22

发表评论

登录后才能评论

评论列表(0条)

保存