伴着IT在企业中的作用日益明显,IT建设和IT运维同时成为了企业效率的加速。同时,计算机硬件系统和软件系统的运维已成为了各行各业单位,尤其是信息服务部门普遍头痛的事情。本文以下内容总结几个头痛的主要因子,拿出来供大家参考指导,并接下来的系列课题中会对针对这些现状提出改进措施 。
现状一:IT运维人员成本偏高
据专业调查,大多数CIO表示最关心的是IT运维成本过高。原因是在过去的5年中,很多企业都实施了很多IT系统,使得IT运行越来越复杂,也越来越难管理。同时,其中有50%的受访CIO认为IT运维成本过高的一个原因是IT运维的自动化做得还不够好,依靠手工流程来管理,不但使到运维效率不高,而且人力成本更是花费惊人。
同时,另一家国际知名调查机构Gartner调查发现,在IT运维成本中,源自技术或产品(包括硬件、软件、网络等)成本其实只占20%,而流程维护成本占40%,运维人员成本占40%。流程维护成本包括日常维护、变更管理、测试成本等;人员成本包括训练、教育、人员流失、招聘成本等。
从图中,我们可以看出, “流程维护”类和“运维人员”两者都与软性方面的成本相关非常紧密。而且三者的关系可以用下图来表示:
备注:C类成本的大小很大程度取决于B和D类。
现状二:处在“救火式”的IT运维控制
国内在IT运维过程中,IT员工大多数只是处在被动低效率手工救火的状态,只有当事件已经发生并已造成业务影响时才能发现和着手处理。这种被动“救火”会导致:①IT运维人员终日忙碌,IT运维人员日常大部分时间和精力是处理一些简单重复的问题;②IT运维本身质量很难提高;③再加上故障预警机制的不完善,往往是故障发生后或报警后才会进行处理,不但事倍功半而且故障还常常会出现恶性连锁反应;④IT部门和业务部门对IT运维的服务满意度都不高。
现状三:简单的自动化程度起了“反作用”
尽管IT运维管理的技术在不断进步,但实际上很多IT运维人员并没有真正解脱出来,主要原因是自动化不高而导致的。技术虽然能够获取IT设备、服务器、网络流量,甚至数据库的警告信息,但成千上万条警告信息堆积在一起根本没法判断问题的根源在哪里。还有,许多企业的更新管理绝大多数工作都是手工 *** 作的。即使一个简单的系统变更或更新往往都需要运维人员逐一登录每台设备进行手工变更,当设备数量达至成百上千时,其工作量之大可想而知。而这样的变更和检查 *** 作在IT运维中往往每天都在进行,占用了大量的运维资源。因此,实现运维管理工作的自动化对企业来说已迫在眉睫。
就如图中一样,所有信息(杂乱)都从各个地方被收集到了这个圆圈(容量不变)里面,信息进去后不能主动流出来。可能会出现的情况:这个圆圈容器装满后会爆破,或者是溢出来;圆圈的运行速度会慢慢降下来,从而导致信息输入的速度也会变慢。
现状四:本是同家兄弟,却不经常来往
这个问题主要是发生在拥有许多子公司的企业,每个子公司的系统都是独立的,下面主要以国内银行业为例。以前国内的银行业没有搞集中建设,每家银行的各个地方分行都单独建设和维护自己的核心业务系统,都各自配备开发人员和维护人员。
同时在运行维护方面,对故障的解决,完全依靠运行维护部门的工程师的上门服务。不管问题大小,工程师都要来回去现场解决。遇到一些技术难度大的问题,如果工程师的水平高,处理起来就快;如果水平低,甚至花上几个小时,可能也解决不了。
虽然国内银行业的IT运行维护管理水平,有点接近国外80年代末90年代初银行业的水平,银行IT结构上都采用了大集中模式。从硬件设备上来看,国内银行不比别人差,甚至还有些领先,但IT运维管理还没达到国外当时的水平,尤其是呼叫中心、客户服务方面。”
结束语
从上面三个现状来看,主要是有关软性方面的。的确如此,国内借着近十几年高速发展,硬件方面的发展取得了重大进步,某些方面的水平甚至是超过了国外的水平,并且IT硬件的生产厂商也是出现了很多与国外厂商同等秀舞的水平,如华为、中兴等。但是往往是硬件易学,知识技巧难寻。这不仅与国内教育环境有关外,还与知识经验的继承有关。
管理要动态匹配业务需求
IT部门还会经常联合HR、法务等部门一起做跨部门的沟通,面对的对象是各部门的管理层,让他们理解企业的IT策略。
IT运维服务可分为IT基础设施运维服务、IT应用系统运维服务、安全管理服务、网络接入服务、内容信息服务和综合管理服务等。
1、折叠IT基础设施运维服务
IT基础设施运维服务对IT基础设施进行监视、日常维护和维修保障。服务涉及的基础设施包括网络系统、主机系统、存储/备份系统、终端系统、安全系统、机房动力及环境等。
2、折叠IT应用系统运维服务
应用系统运维服务对应用系统进行设计、集成、维护及改进。应用系统运维服务涉及的应用系统包括OA及内部办公系统、政府网站、面向企业和组织的应用系统、面向公众的应用系统以及城市管理类应用系统等。
3、折叠安全管理服务
安全管理服务对IT环境涉及的网络、应用系统、终端、内容信息的安全进行管理,包括安全评估、安全保护、安全监控、安全响应及安全预警等服务。
4、折叠网络接入服务
网络接入服务提供网络规划和接入,包括互联网接入服务、专网接入服务等。
5、折叠内容信息服务
内容信息服务对内容信息进行采集、发布、巡检、统计、编辑、信息挖掘以及汇报,为内容信息的获取和进一步处理提供支持。
6、折叠综合管理服务
综合管理服务包括咨询与培训服务、技术支持服务、综合系统服务等。
业务:
一基础网络维护业务
包括 *** 作系统的安装,病毒查杀, *** 作系统密码破解,软件安装(不含软件介质),整机性能优化,共享设备配置,电脑外设安装,软件故障诊断与排除,误删数据恢复,更换零配件(不含配件费)。
二信息化建设服务
1根据客户需求,制订IT建设解决方案。包括从硬件到软件的服务器建设方案,OA、ERP、电子商务、进销存、分销系统等的配套解决方案。
2提供软硬件防火墙、行为管理设备、流控设备的规划及实施。
三数据库运维服务
主动数据库性能管理,快速发现、诊断和解决性能问题,维护高效的应用系统。包括检查数据库系统是否需要应用最新的补丁集,检查数据库空间的使用情况,协助客户进行数据库空间的规划管理,检查数据库性能,确认系统的资源需求,同过改善系统环境的稳定性来降低潜在的系统宕机时间。
四网络营销及微营销服务
企业级电话400、网络营销,企业建站及推广,微营销、微网站的建设、外贸网站推广、电子商务服务外包等。
——————北京海宇勇创科技
所谓 IT运维管理,是指单位 IT 部门采用相关的方法、手段、技术、制度、流程和文档 等,对IT 如硬运行环境(软件环境、网络环境等)、IT 业务系统和 IT 运维人员进行的综合管理。
IT 运维管理主要包括八个方面的管理内容:
1 设备管理。
对网络设备、服务器设备、 *** 作系统运行状况进行监控和管理。
2 应用服务。
对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web 等的监控与管理。
3 数据存储。
对系统和业务数据进行统一存储、备份和恢复。
4 业务。
包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理, 主要关注该业务系统的 CSF(关键成功因素 Critical Success Factors)和KPI(关键绩效指 标Key Performance Indicators)。
5 目录内容。
该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理。
6 资源资产。
管理企业中各 IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互。
7 信息安全。
信息安全管理主要依据的国际标准是 ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和 127种控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等。
8 日常工作。
该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段。
运维,更偏向于业务产品的支持,偏向于背后的英雄,运维团队需要为业务的稳定性,成本等方面负责!
企业需要的IT运维体系,本质上也是需要从稳定性、成本的角度来建立。
(1) 稳定性方面
稳定性,是反应服务访问质量差甚至无法访问的指标。业界流行的的稳定性公式是,服务总在线时间/服务总时间,具体指标数据以几个9表示,比如一般的云计算服务提供上,承诺的稳定性指标是3个9:999%(意味着每年宕机时间不超过875小时),而对于大型互联网公司的业务,对于运维的指标则是9999%(全年宕机时间不超过52分钟),甚至99999%(全年宕机时间不超过8分钟)。
稳定性方面,需要什么样的技术体系支撑呢?
监控体系。现在开源软件已经让企业的运维能力大幅提升,如zabbix,nagios等,已经被很多企业广泛使用。同时,随着人工智能的兴起,监控的智能化精细化水平,也在不断提升,比如,传统的监控无非是发现异常了之后报警,但加入智能化之后,则可以自动分析异常的根本原因在哪里,基于此则可以继续做自动的恢复,避免人工成本。
基础技术体系。包括硬件(服务器,网络等), *** 作系统/内核等,也直接影响到业务的稳定性。现在云计算的技术已经非常成熟,服务器与网络方面可以由类似openstack,cloudstack等IaaS平台管理, *** 作系统/OS等则可以通过docker,以及各类PaaS平台进行维护与管理,实现稳定性的保障。
安全体系。随着现在互联网的飞速发展,伴随而来的网络攻击也越来越疯狂,根据普华永道的调查,针对中国公司的网络攻击频率两年内已经提升了两倍,这也使得安全成为互联网架构中必不可少的环节,waf应用防火墙,数据清洗,防cc,ddos攻击等安全体系,也是必备的技术体系之一。
(2) 成本方面
计算成本。即托管企业运行软件所需要的服务器成本。现在云计算厂商提供的IaaS产品也是已经非常成熟,而且价格也在不断地下调,2016年10月,阿里云宣布了大量云产品的降价,一年内就下降十几次,也使得企业的成本控制方便可以越来有利。
人力成本。包括运维人力,研发人力,运维人力的主要投入来自于业务稳定性的保证,比如,服务异常之后的故障恢复,容灾与服务重建等。业务研发中,业务本身的迭代效率与质量,也间接影响了研发的成本。这方面则可以通过PaaS平台的技术手段来解决。
(3) 商业化
商业化是企业运维体系的更上一层。企业IT运维是每个企业必不可缺的环节之一,因此,运维相关的产品也逐渐受到企业的重视。比如应用性能分析厂商(new relic),则是提供了优化服务运维质量的有效方案,监控等产品也是运维最受欢迎的产品之一。
AirDroid Business是一种移动设备管理(MDM)和企业移动应用程序(EMA)解决方案,它能帮助企业管理设备、应用程序和数据。
使用AirDroid Business,企业管理员可以集中管理所有设备,例如监控设备的状态、远程锁定、擦除设备数据、安装、卸载应用程序和批量分发应用程序。此外,企业管理员可以设置设备策略并监视设备使用情况,以确保设备在符合企业安全标准的情况下进行 *** 作。
另外,AirDroid Business还允许企业创建定制化应用程序,并将它们分发给自己的员工。企业管理员可以自己设计应用程序,应用程序将仅能被员工使用,而无法被外界下载。企业员工可以方便地访问这些应用程序来帮助提高工作效率,并可以随时随地访问企业数据。
除了设备管理和应用程序管理外,AirDroid Business还提供了其他移动企业管理解决方案,例如:
1 远程支持:管理员可以远程控制设备,从而解决设备上出现的问题或错误。这是一种快速响应客户需求并减少对设备的干预的有效方式。
2 设备安全:企业管理员可以设置设备策略,以确保设备的安全,并防止有害软件影响企业数据。此外,管理员可以设置远程锁定和擦除设备功能,从而保护企业数据不被泄露。
3 设备跟踪:企业管理员可以追踪设备的位置和状态,以便在需要时快速响应,从而提高设备的安全性和管理效率。
4 自动化 *** 作:AirDroid Business允许企业管理员设置自动化 *** 作,从而减少业务流程中的手动工作量。例如,自动化下发更新、应用程序安装、IT支持事件等。
AirDroid Business提供了完整的移动企业管理解决方案,以帮助企业更好地管理移动设备、应用程序和数据。申请14天免费试用
由于信息技术的渗透性和先导性,信息技术已成为国内外企业战略决策的制定和调整、生产经营过程中的计划、组织、管理和控制不可或缺的重要工具以及公司核心技术的主要载体,信息技术促进了生产经营过程的集成化和科学化,从而成为各公司降低成本、维持技术领先地位的战略举措。
近年来,国内外各企事业单位都十分重视信息化建设,把加快信息化建设作为提高生产经营管理水平、促进业务流程优化、加强内部控制、提高决策质量和效率的重要手段。结合中国石油发展战略和业务需求,中国石油出台了统一的“十一五”信息技术总体规划,F5(企业信息系统管理)项目便是“十一五”信息技术总体规划中的一项,目标是建立集成的监控管理平台和统一、完善的运维管理体系,提高中国石油信息技术基础设施的可靠性和性能,从而保证中国石油各业务系统的高可用性,彻底改善IT服务的管理水平,提高客户满意度,降低IT服务支持成本。
被动的传统IT运维管理
市场研究机构Gartner调查发现,在导致IT基础设施出现故障的原因中,源自技术或产品方面的因素其实只占了 20%,而因为运维管理方面的原因则占到80%,可见IT系统运维及管理是相当重要的。企业每年对IT部门投资都不少,但是得到的效益却没有体现,问题仍然时常发生,感觉好像所有的投入都打了水漂。
企业的IT运维部门是一个吃力不讨好的部门,因为IT运维就是在后台默默地保证信息系统的正常运行,只有在问题发生的时候才想到还有IT部门的存在。这种现象是由于IT运维管理还处于传统模式,即无相应的运维监控软件或者是仅仅单独使用某项监控软件而没有联合使用。这种传统的IT运维管理是被动的管理,是孤岛式的管理,是与业务应用没有联动的管理。
1被动管理
传统的IT运维管理是救火式的管理。通常是用户先于IT人员发现问题,然后再找到IT部门要求解决问题。这是由于传统的IT管理采用人工方式管理基础设施,网络管理是从各种IT基础设备出发的,仅仅是保障各类IT设备如服务器、数据库、存储设备、交换机等等基础设施的正常运行。
不采用任何管理软件,仅仅靠运维人员定期轮询,或者执行某项命令来检查设备,在系统规模较小时,只要参与运维的技术人员足够负责,人工运维方式是可以满足日常运维需要的。但是,当应用系统达到一定的规模后,这种运维方式的弊端就暴露出来了。轮询一遍要花费几个小时,这样,轮询周期越长也就代表越需要更久才能发现故障。这种被动式管理IT导致有了问题不能及时发现。
2 无关业务、孤岛管理
有些企业虽然采用某一种或几种监控软件来监控IT基础设施,但这些监控软件都各自独立运作,没有进行对业务的整合监控。如果用户投诉业务应用不畅通,很难定位故障源,到底是网络、应用程序、数据库还是其他后台系统出了问题,或者是各部门踢皮球,都说自己所负责的设备正常
好一些的IT主管会把各个部门集合到一起开会,讨论问题根源。传统的IT运维管理方式是各类设备的管理各自为政,丝毫没有关联性。处理故障不便于追根溯源。每个人的精力有限,在专业应用系统赖以生存的各基础设施支撑单元上很难做到专、精、准的多面手角色,加之由于管理范围的界定和监控手段的限制,运维人员很难直接判定问题是出在基础网络、系统服务器、数据库还是应用系统自身,故障难以定位将直接导致业务恢复时间的推迟,影响业务系统的正常运行,大大降低服务质量。
将IT运维与业务相关联
IT运维是在后台默默地保证各项业务应用系统的正常运行。IT运维工作是无形的,怎样把这种无形的运维变为有形、甚至量化,这就要把IT的运维与业务相关联。传统的IT运维管理中,基础设施的运维工作不能和业务相结合,仅仅是在设备管理的层面上。这就导致IT管理的成绩没有体现。想想看,如有业务应用不正常,那网络或者服务器之类的任何一种基础设备的正常运行又有什么用呢业务应用是“1”,设备是“0”,没有了正常通畅的业务应用,那其他的都是空谈。只有在业务应用畅通的前提下,基础设施管理才有意义,才能体现IT运维管理的价值。
因此我们需要帮助企业IT:部门了解用户使用感受,关联真实用户感受和系统性能,指导问题事件定位和原因诊断 。
企业信息化发展过程首先是基础架构建设阶段,这个阶段主要是采购一些硬件和应用软件。随着采购的不断扩大,企业的IT组件不断完备,IT系统初具规模,这就产生了IT运维和管理的要求,即网络和系统监控(NSM)阶段,监控网络连通性和系统可用性,此阶段主要还是对IT设备的监控。随着企业业务日趋复杂,IT系统进一步扩大,这时就产生了对IT服务流程进行管理的需求,上升到第三阶段,即IT服务管理(ITSM)的阶段。以上三个阶段都是IT间接产生业务价值的阶段,对业务的顺畅起辅助监控的作用。
企业业务系统对IT系统依赖的不断增强,企业开始关心IT服务对业务带来的影响,强调从业务目标角度出发来管理IT,也就是到达第四个阶段――IT与业务融合的阶段,即BSM(Business Service Management,业务服务管理)阶段。企业可以根据业务目标对IT服务进行调整,以确保IT能够支持业务目标,从而直接产生业务价值(如图2所示)。
如今各类重要的IT应用系统相继在中国石油发挥着举足轻重的作用,所以IT应用系统的可用性尤其重要,例如ERP、OA、邮件、门户等各类重要的系统如果出现中断,都会给企业造成大量的经济损失,所以除了需要对各类应用系统部署冗余的设备以备保证其高可用性,同时也需要对应用系统进行监控和管理,并且进行关联管理。业务系统的可用性是由底层的各类基础设施的状态所决定的,因此建立一个有效的业务模型,将与某个业务相关的底层IT基础设施关联起来,该业务模型能够有效地定位故障根源。这样ERP的管理员只需要关心ERP业务的可用性,而没有必要去关注每台主机的性能参数和启动的进程,不但大大节约了运维时间,而且也提高了运维效率,使故障持续时间大大缩短了。
基于BSM的IT运维
当前中国石油IT运维管理的需求就是从业务出发,建立基于BSM解决方案的新型IT运维。
新型的IT运维管理系统要做得到的就是基于BSM架构的业务管理。
首先,要实时掌控最终用户对IT服务的使用体验,根据制定好的SLA(Service Level Agreement,服务等级协议)来管理业务服务的质量,这样就可以根据业务影响和SLA来对IT服务进行管理。
其次,通过端对端的应用交易时间测量,实现业务要求端对端的可见性;从最终用户的角度,来测量业务服务的响应性能,主动帮助运维人员在第一时间发现问题,以便在问题对用户造成不利影响之前,及时得到隔离、诊断和修复,把它们对业务的干扰降到最低。
第三,提供业务服务、应用及底层IT系统构架部件之间的映射关系。这种解决方案通常会基于一种称为CMDB(Configuration Management Database,配置管理数据库)来实现。通过服务依存关系映射技术,来展现业务服务、应用和底层IT系统构架部件之间的动态关系,这样就增进了对各种IT元素的掌控和理解。
第四, 借助业务服务与IT基础设施的依存关系,对告警事件进行管理。当IT系统的组件产生告警时,结合收集上来的底层的IT系统告警事件,对它们进行过滤、关联、聚合,根据对业务服务影响的严重性,来进行排序处理。
传统意义上的CMDB是服务流程中的一部分,是ITIL中最重要、最核心的概念之一,在以业务为核心的IT运维中,CMDB也是业务建模的主要工具。CMDB通过自动发现工具收集和一定范围的IT基础架构基础信息,包括配置项和关系,建立IT基础架构模型;并通过端到端的业务服务拓扑图来可视化展示业务系统所有部件和关联关系。
把这四方面的功能整合起来,从最终用户的角度来衡量业务影响和风险;自动发现业务服务、应用和底层IT系统构件,并建立依存关系;理解用户感受,监控用户业务响应时间 ,在用户受影响之前发现问题,以求满足下列功能:
1 通过基于角色的业务视图,提供业务流和服务的可见性;
2 从最终用户的角度来衡量业务影响和风险;
3 设置和检测业务过程的SLA,了解应用性能对业务的影响;
4 24×7小时端到端监控,从浏览器到后台实时监控所有交易;
5 理解用户感受,监控用户业务响应时间 ,在用户受影响之前发现问题;
6 主动发现和按优先级管理关键业务问题;
7 通过自动把业务和底层运营信息建立关联来缩短平均问题修复时间;
8 自动发现业务服务、应用和底层IT系统构件,并建立依存关系;
9 通过联合的CMDB,来为IT环境提供一个“统一的真实数据”视图,这样就可以为用户提供一个主动的、以业务为中心的BSM解决方案,帮助用户极大地改善业务服务的性能和可用性,降低服务突然中断带来的风险。
提升IT部门的作用
以前,IT运维部门救火队式的混乱状况导致无法判断IT运维总体表现的好坏。而IT部门又是公认的成本中心,这就导致了在很多企业中IT部门总是承受着很多批评,IT人员的工作热情也不高。
而现在,IT运维部门实现了主动发现问题、提前处理故障;IT运维管理与实际的业务应用挂钩,IT运维部门的工作由无形化为有形;促进IT部门从成本中心向利润中心转变,这一切既有利于IT人员发挥其工作热情,也有利于IT部门在整个企业地位的提升。
中石油的IT运维管理就是要基于BSM模式来建设,F5项目就是要实现基于业务来管理IT,也就是要提高信息技术基础设施的可靠性和性能,降低支持成本,对基础设施的规划进行最佳的决策和采用更好的系统支持策略。同时,获取与业务运行相一致的信息技术服务与实践,整合网络、系统、数据库和应用系统管理等关键业务,从而服务于数据大集中趋势下数据中心运维模式的建立和各专业应用日常运维的需要。
以上就是关于IT运维的管理现状全部的内容,包括:IT运维的管理现状、IT综合运维服务外包服务包括哪些内容、IT运维都包含什么工作内容等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)