CIO如何规范IT系统运维管理

CIO如何规范IT系统运维管理,第1张

IT运维管理包含:

一、设备管理:对网络设备、服务器设备、 *** 作系统运行状况进行监控,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、WEB等的监控与管理;

二、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复;

三、业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理,主要关注该业务系统的CSF(关键成功因素CriticalSuccessFactors)和KPI(关键绩效指标KeyPerformanceIndicators);

四、目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;

五、资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;

六、信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127中控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;

七、日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段。

IT运维是IT管理的核心和重点,也是内容最多、最繁杂的部分,每一个子系统中都包含着十分丰富的内容,也因此被很多人称之为“IT运维管理就像一个什么都能装的箩筐”。但通过梳理,你会发现,其实IT运维管理也有依有据,有规律可寻。

IT运维管理是时下IT界最热门的话题之一随着IT建设的不断深入和完善,计算机硬软件系统的运行维护已经成为了各行各业各单位领导和信息服务部门普遍关注和不堪重负的问题由于这是一个随着计算机信息技术的深入应用而产生的新课题,因此如何进行有效的IT运维管理,这方面的知识积累和应用技术还刚刚起步对这一领域的研究和探索,将具有广阔的发展前景和巨大的现实意义。

所谓IT运维管理,是指单位IT部门采用相关的方法、手段、技术、制度、流程和文档等,对IT软硬运行环境(软件环境、网络环境等)、IT业务系统和IT运维人员进行的综合管理。

企业将IT部门的职能全部或部分外包给专业的第三方IT外包公司管理,集中精力发展企业的核心业务。简单的说就是企业在内部专职IT运维人员不足或没有的情况下,将企业的IT外包服务流程,包括全部办公硬件、网络及外设的维护工作转交给专业从事IT运维的公司来进行全方位的维护。

IT服务是大概念,可分为建设和运维(运行维护)两部分。对项目建设来说,容易被大众接受。

IT运维的重要性:

就是通过结构化的综合布线系统和计算机网络技术,将各个分离的设备(如个人电脑)、功能和信息等集成到相互关联的、统一和协调的系统之中,使资源达到充分共享,实现集中、高效、便利的管理。系统集成实现的关键在于解决系统之间的互连和互 *** 作性问题,它是多厂商、多协议和面向各种应用的体系结构,需要解决各类设备、子系统间的接口、协议、系统平台、应用软件等与子系统、建筑环境、施工配合、组织管理和人员配备相关的面向集成的问题。

IT运维的必要性:

第一,所有的电子产品(硬件设备)都有寿命问题,而信息系统包含大量不同种类、不同功能、不同性能的设备,每种设备的寿命各不相同,长的5—10年、短的3—5年,对信息系统而言,几乎在项目建设完成后即需进入项目运维期,而对某些建设周期需要很多年的信息系统来说,在项目建设后期,便要对前期建设的项目进行运维。这里还没有考虑设备发生故障的情况,而设备发生故障是一定的,只是发生的概率大小而已。对单台设备来说,也许几年不发生一次故障,但对包含数百、数千甚至数万台(套)设备的信息系统而言,故障发生的概率要高很多。

第二,硬件设备更换、升级导致被动运维。由于硬件寿命及技术进步(摩尔定律:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。这一定律揭示了信息技术进步的速度),硬件产品会不断升级,导致原来使用的各种软件需被动升级,而系统软件升级也会导致应用软件必须进行升级改造以适应新环境。

第三,系统软件、工具软件由于自身存在各种缺陷(业内称为Bug,现在各种软件都极为庞大、复杂,要在编程中完全杜绝Bug几乎不可能),需要主动修正和完善。

第四,除上面所说的由于运行环境改变而需要被动升级应用软件外,还有就是自己主动升级。主要是随着时间的推移,对系统功能有新要求,或者是政策变化,需要系统功能跟着改变,所有这些问题都需要对系统进行运维,或者说需要升级、改造,不断完善。

第五,应用软件同系统软件一样,其本身也存在各种缺陷需修正和完善,而且应用软件是直接目的用户,不像硬件和系统软件对用户是“透明”的,是在后台发挥作用,有时仅是使用人员因对使用界面不习惯,都需作修正、完善。

从IT系统实施到系统上线,经历了漫长辛苦的过程。好不容易实施结束,以为可以休息一段时间了,谁知日常运维工作却越来越多,让他疲于奔命。一直以来,公司把IT专项资金投入在着重解决从无到有的基础设施和系统的构建,然而却忽视了系统建设完成以后的运行维护。随之而来的是,信息化的运维压力和挑战逐渐凸现出来,已经成为影响信息系统应用效果的主要瓶颈。当系统进入运维期后,IT部门就像救火队一样,不知道什么时候、什么地方会出现“火”情。虽然作为CIO,一些具体的事情不需要陈贤本人去做,比如系统参数的调整,订单的排程等,但是IT 管理、系统运行维护、项目管理等工作他还是要一一过问。传统被动的、孤立的、分散的“救火队”式IT运维管理模式,让IT部门疲惫不堪。而且,随着公司业务模式的复杂化和多样化,更带来IT运营环境的复杂性和不确定性。在IT运维系统时,IT部门普遍面临多种问题。主要有以下几个方面:(1)运维人员被动救火,工作效率低下在IT运维过程中, IT员工工作太被动,只有当事件已经发生并已造成业务影响时才能发现和着手处理。这种被动“救火”不但使IT服务人员终日忙碌,也使IT服务本身质量很难提高,导致IT和业务部门的满意度都不高等。(2)流程规范不足,没有形成闭环跟踪在运维流程方面,IT部门一直处于原始的状态。例如在事件处理流程上,存在以下几种典型的问题:①没有明确的事件升级标准,例如满足怎样的条件后,事件必须从一线转到二线支持工程师,再转到三线研发工程师处理。②没有事件的有限级定义标准,没有建立优先级和解决时限的关联关系,从而不能保证事件解决的实效性和 IT 资源的有效利用。③事件产生后没有明确而唯一的责任人,从而缺乏有效对事件监控和跟踪机制。④没有统一的 IT 服务管理对事件受理的界面,没有事件完整记录、没有及时反馈。这些都使事件/服务请求处理过程中没有形成严格的闭环管理;没有建立明确的重大或紧急事件处理流程,从而不能保证在相应事件发生后有效及时地处理。对事件处理过程的记录比较分散,随意性很大,没有控制。更没有严格规范的流程政策和控制手段,使之存在太多的漏洞。整体运行维护情况无法一目了然,不能够清楚地知道各位员工的工作情况和工作状态,从而缺少对流程有效的监控和跟踪。(3)缺乏运维技术工具企业缺乏诸如事件监控和诊断工具等技术工具,事件不能在技术工具的支持下得到主动、快速处理。事件和工作任务在分派过程中没有相应的技术工具记录所有历史信息,不便于跟踪和分析;配置管理信息没有相关工具支持,以便为配置元素建立复杂的关系、状态等属性和提供相应查询功能。总的来说,目前诸多企业在IT系统运维方面并没有高度重视,前期规划仅为解决短期IT建设问题。但随着企业规模的不断扩大,IT系统涉及的设备种类越来越多,对全系统的运营和维护管理提出了近乎苛刻的要求,而相对的则是IT运维的原始和落后的手段。建立运维制度,关键在于规范我们可以看出,在企业信息化发展到一定阶段,建设重点应该要从系统实施转向以应用运维提升为主,运维质量保障、安全机制变得重要起来,这时除了技术的保障以外,制度保障越显得重要。作为CIO,应首先是一位管理专家,其次才是技术专家。由此,建立完善的IT运维制度是最主要的工作内容,是企业信息化有效执行和监督的立足点。IT部门本身管理不好,就不可能为业务部门提供满意的IT服务,业务部门对IT部门的满意度就会低,满意度低又会影响IT投资及新项目的开展,使IT部门陷入困境。所以建立高效规范的IT运维机制,是CIO走向战略管理的第一步。

经过几十年的发展,it行业在当前互联网技术的推动下,进入了一个资源高度整合的时代,即系统化和智能化的时代。运行维护服务也将向组织化、标准化、专业化、智能化方向发展。

相比其它相关行业发展来说,IT运维服务的智能化管理更具得天独厚的优势,因为IT系统设计本身问题就是一个基于企业数字化、数据化和网络化的,而这几个方面要素恰恰是一切智能化的基础。

手工——机器——自动化——智能化,这种生产方式的演进,其目的就是逐步用机器取代人工,最大限度地把人从繁复的、非创造性的劳动中解放出来,以提高生产质量、降低生产成本。智能化对于IT运维服务来说,同样具有非凡的划时代意义。它不仅能大幅度地降低服务成本、提高服务质量的稳定性,还为商业竞争构筑越来越高的技术门槛。

在长期的运维管理实践中,人们开发出各种运维管理工具,如信息安全系统、负载均衡系统、上网行为系统、网络监控系统、运维审计系统、日志审计系统等等。越来越多诸如此类系统的出现,标志着运维管理进入类似制造业的机器生产时代。下一个阶段的发展趋势应该是将这些系统在业务流程和数据上进行整合,朝着自动化与智能化方向挺进。以便更大程度地取代人工,消除人工服务所带来的非标准和质量不稳定的隐患,并进一步地提高服务效率、降低服务成本。

智能化是建立在大数据基础上的,首先要解决的是运维数据的智能采集。根据客户单位的业务需求,确定运维服务的总体目标,明确需要收集哪些数据?是怎么收集这些数据的?收集这些数据的方法是什么?如何确定不同类型数据的采集频率?如何分类和存储数据?

其次是大数据挖掘。设计运维数据分析模型,从海量历史数据中准确找出IT系统存在的问题。以监控系统为例,大部分客户都购买了网络监控系统,证明实际工作中存在这样的刚性需求。但实际上,大多数客户并没有很好地使用这个系统,主要是因为这些系统在数据准确性上并不理想,对大数据的分析和提取也比较薄弱。由于营销的需要,监控系统开发商把主要精力都放在新功能的开发和数据的展示上,对数据的准确性及分析挖掘缺乏深入研究,因而使得监控系统的实用性大打折扣。

然后是如何集成各种 *** 作工具和它们生成的数据的问题。如何将各种运行维护管理工具集成为一个智能化的运行维护管理平台,充分发挥其整体价值。对于需要人工干预的事件,还需要与服务流程管理系统进行接口,以实现人机服务的集成,实现服务流程的智能化。与运维的组织化、标准化、专业化一样,智能化运维也是运维服务行业发展的大趋势。 谁能顺应这一趋势,把握这个发展机遇,谁就赢得了未来!

本文摘要节选自来源于

>

IT智能运维必须以大数据为基础,所以企业必须具有采集IT全层级数据的能力,并能实现数据融合,结合机器学习、智能算法,对IT运维实现洞察,获得预见性。

现在推IT智能运维的服务商国内有几家,我比较认可博睿数据提出的数据为本的理念,没有数据就是无水之源,所以企业别被概念忽悠,先踏实做数据采集和融合,智能运维是水到渠成的事

以上就是关于IT运维管理包含哪些内容全部的内容,包括:IT运维管理包含哪些内容、IT运维的重要性、必要性、CIO如何规范IT系统运维管理等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/8811978.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-21
下一篇 2023-04-21

发表评论

登录后才能评论

评论列表(0条)

保存