运维,更偏向于业务产品的支持,偏向于背后的英雄,运维团队需要为业务的稳定性,成本等方面负责!
企业需要的IT运维体系,本质上也是需要从稳定性、成本的角度来建立。
(1) 稳定性方面
稳定性,是反应服务访问质量差甚至无法访问的指标。业界流行的的稳定性公式是,服务总在线时间/服务总时间,具体指标数据以几个9表示,比如一般的云计算服务提供上,承诺的稳定性指标是3个9:999%(意味着每年宕机时间不超过875小时),而对于大型互联网公司的业务,对于运维的指标则是9999%(全年宕机时间不超过52分钟),甚至99999%(全年宕机时间不超过8分钟)。
稳定性方面,需要什么样的技术体系支撑呢?
监控体系。现在开源软件已经让企业的运维能力大幅提升,如zabbix,nagios等,已经被很多企业广泛使用。同时,随着人工智能的兴起,监控的智能化精细化水平,也在不断提升,比如,传统的监控无非是发现异常了之后报警,但加入智能化之后,则可以自动分析异常的根本原因在哪里,基于此则可以继续做自动的恢复,避免人工成本。
基础技术体系。包括硬件(服务器,网络等), *** 作系统/内核等,也直接影响到业务的稳定性。现在云计算的技术已经非常成熟,服务器与网络方面可以由类似openstack,cloudstack等IaaS平台管理, *** 作系统/OS等则可以通过docker,以及各类PaaS平台进行维护与管理,实现稳定性的保障。
安全体系。随着现在互联网的飞速发展,伴随而来的网络攻击也越来越疯狂,根据普华永道的调查,针对中国公司的网络攻击频率两年内已经提升了两倍,这也使得安全成为互联网架构中必不可少的环节,waf应用防火墙,数据清洗,防cc,ddos攻击等安全体系,也是必备的技术体系之一。
(2) 成本方面
计算成本。即托管企业运行软件所需要的服务器成本。现在云计算厂商提供的IaaS产品也是已经非常成熟,而且价格也在不断地下调,2016年10月,阿里云宣布了大量云产品的降价,一年内就下降十几次,也使得企业的成本控制方便可以越来有利。
人力成本。包括运维人力,研发人力,运维人力的主要投入来自于业务稳定性的保证,比如,服务异常之后的故障恢复,容灾与服务重建等。业务研发中,业务本身的迭代效率与质量,也间接影响了研发的成本。这方面则可以通过PaaS平台的技术手段来解决。
(3) 商业化
商业化是企业运维体系的更上一层。企业IT运维是每个企业必不可缺的环节之一,因此,运维相关的产品也逐渐受到企业的重视。比如应用性能分析厂商(new relic),则是提供了优化服务运维质量的有效方案,监控等产品也是运维最受欢迎的产品之一。
IT运维管理系统中,信息化管理体系建设包含哪些内容?
IT运维管理体系要真正发挥效益,避免“为技术而技术”,需要融合人、流程、技术。根据信息化的发展要求,配套的管理措施应包括组织模式、管理制度、管理流程、绩效考核、运维费用、技术支撑等内容。
组织模式:中心从全局的角度定位IT运行维护和服务工作,将中心目前分散进行的各项IT运行维护和服务的工作职能逐渐整合,进行集中统一管理,统一调度IT运行维护和服务的技术力量,并结合中心实际情况和管理需要进行配套的组织机构的设置和逐步完善。第一,成立IT运维管理领导小组。初期可以成立由中心领导和各处(室)负责人组成的IT运维管理协调小组,从总体上负责IT运行维护和运维管理的统一组织协调,监督检查各处室服务质量;将来根据IT运维管理发展,可以成立由部领导、中心领导和业务司局领导组成的信息化治理领导小组。第二,建立面向用户的服务接口。初期以服务台为统一服务接口,不断扩充与完善服务台的功能,统一受理客户的IT服务请求,记录事件和一线解决,对解决不了的较为专业的事件派发给专业的二线技术人员,各相关处室提供二线技术支持,并明确相关技术支持人员及职责;将来逐步建立独立的IT运行维护和服务机构(运维中心),专门负责IT运维和服务工作,合理划分建设与运维的边界,实现建设与运维的分离。第三,设置合理的组织机构。初期保持目前组织机构和职责不变,进一步理顺关系;将来随着信息化发展和管理成熟度的不断提升,逐步建立起完全适应体系运行的IT治理组织机构;
管理制度:管理制度是指IT运行维护和服务工作必须遵循的内部管理规定,用于提高工作的协调性和管理的有效性。借鉴IT运维管理体系国际标准标准ISO20000要求,管理制度分为 “总办法”、“分办法”、 “实施细则或 *** 作指南”和“配套表单”四个层次,见图13-6。
资料来源:中国IT治理研究中心(ITGov),网址:>
IT智能运维必须以大数据为基础,所以企业必须具有采集IT全层级数据的能力,并能实现数据融合,结合机器学习、智能算法,对IT运维实现洞察,获得预见性。
现在推IT智能运维的服务商国内有几家,我比较认可博睿数据提出的数据为本的理念,没有数据就是无水之源,所以企业别被概念忽悠,先踏实做数据采集和融合,智能运维是水到渠成的事
经过几十年的发展,it行业在当前互联网技术的推动下,进入了一个资源高度整合的时代,即系统化和智能化的时代。运行维护服务也将向组织化、标准化、专业化、智能化方向发展。
相比其它相关行业发展来说,IT运维服务的智能化管理更具得天独厚的优势,因为IT系统设计本身问题就是一个基于企业数字化、数据化和网络化的,而这几个方面要素恰恰是一切智能化的基础。
手工——机器——自动化——智能化,这种生产方式的演进,其目的就是逐步用机器取代人工,最大限度地把人从繁复的、非创造性的劳动中解放出来,以提高生产质量、降低生产成本。智能化对于IT运维服务来说,同样具有非凡的划时代意义。它不仅能大幅度地降低服务成本、提高服务质量的稳定性,还为商业竞争构筑越来越高的技术门槛。
在长期的运维管理实践中,人们开发出各种运维管理工具,如信息安全系统、负载均衡系统、上网行为系统、网络监控系统、运维审计系统、日志审计系统等等。越来越多诸如此类系统的出现,标志着运维管理进入类似制造业的机器生产时代。下一个阶段的发展趋势应该是将这些系统在业务流程和数据上进行整合,朝着自动化与智能化方向挺进。以便更大程度地取代人工,消除人工服务所带来的非标准和质量不稳定的隐患,并进一步地提高服务效率、降低服务成本。
智能化是建立在大数据基础上的,首先要解决的是运维数据的智能采集。根据客户单位的业务需求,确定运维服务的总体目标,明确需要收集哪些数据?是怎么收集这些数据的?收集这些数据的方法是什么?如何确定不同类型数据的采集频率?如何分类和存储数据?
其次是大数据挖掘。设计运维数据分析模型,从海量历史数据中准确找出IT系统存在的问题。以监控系统为例,大部分客户都购买了网络监控系统,证明实际工作中存在这样的刚性需求。但实际上,大多数客户并没有很好地使用这个系统,主要是因为这些系统在数据准确性上并不理想,对大数据的分析和提取也比较薄弱。由于营销的需要,监控系统开发商把主要精力都放在新功能的开发和数据的展示上,对数据的准确性及分析挖掘缺乏深入研究,因而使得监控系统的实用性大打折扣。
然后是如何集成各种 *** 作工具和它们生成的数据的问题。如何将各种运行维护管理工具集成为一个智能化的运行维护管理平台,充分发挥其整体价值。对于需要人工干预的事件,还需要与服务流程管理系统进行接口,以实现人机服务的集成,实现服务流程的智能化。与运维的组织化、标准化、专业化一样,智能化运维也是运维服务行业发展的大趋势。 谁能顺应这一趋势,把握这个发展机遇,谁就赢得了未来!
本文摘要节选自来源于
>
ITSM更多是标准化、规范化。
至于效率,个人认为,提升的方式就是输入输出标准了,能够提高各个接口衔接的效率。
至于整体运维效率的提升,还需要从制度、标准、人员、平台等维度综合考虑。
运维是运维从业人员,负责维护并确保整个服务的高可用性,同时不断优化系统架构提升部署效率、优化资源利用率提高整体的ROI。
无论做什么运维,运维工程师最基本的职责都是负责服务的稳定性,确保服务可以724H不间断地为用户提供服务。在此之上运维工程师的主要工作职责如下:
1、质量:保障并不断提升服务的可用性,确保用户数据安全,提升用户体验。
2、效率:用自动化的工具/平台提升软件在研发生命周期中的工程效率。
3、成本:通过技术手段优化服务架构、性能调优;通过资源优化组合降低成本、提升ROI。
扩展资料
运维人员的要求特别严苛,因为运维人员针对不同的问题,需要不断的补充扩大自己的知识和研究范畴。
在初级阶段,优秀运维人员会体现出格外出众的主动性和责任心,面对陌生的业务会主动学习和拓展自己对业务对认识和相应的知识范畴,以能够足够的胜任业务的独立维护。
在逐步的发展阶段中,注重总结反省的工程师会逐渐成长为高阶运维人员,通常他们会有比较体系化的服务运维理解。也有一部分工程师由于出色的项目管理规划能力,逐渐成为项目经理。
再进一步的发展,高阶的运维人员对于产品的理解将非常的透彻,因而在这种情况下,高阶运维人员甚至可以成为产品的产品经理、产品研发的咨询顾问,在产品功能的设计与开发中起到至关重要的角色。
在IT服务管理和运维自动化这个领域,业界近年来的发展比较快。从IT服务管理(ITSM)、数据中心自动化(DCA)到开发运营一体化(DevOps),相关概念和理论不断涌现。从IBM、BMC、HP等传统厂商各类工具产品纷纷面世到Puppet、Ansible、Saltstack等开源解决方案风起云涌,各类工程实践也是精彩纷呈。
说到运维分为哪几种,首先有必要先讨论一下运维的定义。通常我们把运维的含义界定为数据中心各专业技术岗位的日常运维工作,具体而言,就是各专业技术岗位人员与各类软硬件运维对象进行交互 *** 作的活动。
所以在过去,运维是个专业密集型、知识密集型工作,直到今天,它在一定程度上还是劳动密集型工作。从运维行业的发展趋势来看,运维工作从早期的人工运维,到自动化运维,如今已走向了智能运维。现在,越来越多的企业意识到,智能运维是一种全新的数字化运维能力,企业基于已有的运维数据,通过机器学习方式从而解决自动化运维无法解决的问题,这也将是数字化转型的必备能力。因为智能运维能够帮助企业快速发现异常、有效诊断问题根因、以业务为导向地进行运营分析和决策、持续有力地提升运维数据质量。
现在,智能运维发展正如火如荼,Gartner预见其为下一代运维,认为到2022年将有近50%的企业用户部署智能运维。
其实这个过程和手机的发展历史很像。一开始我们惊喜的称呼iPhone为“智能手机”,而今天再没有人叫它“智能手机”因为这就是手机该有的样子。所以运维也是如此,在企业数字化转型大潮中,“智能”是运维本该有的样子。
内容来源于国内领先的智能运维AIOps落地解决方案供应商擎创科技。
以上就是关于企业究竟需要什么样的IT运维全部的内容,包括:企业究竟需要什么样的IT运维、IT运维管理系统中,信息化管理体系建设包含哪些内容、什么是IT智能运维等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)