企业将IT部门的职能全部或部分外包给专业的第三方IT外包公司管理,集中精力发展企业的核心业务。简单的说就是企业在内部专职IT运维人员不足或没有的情况下,将企业的IT外包服务流程,包括全部办公硬件、网络及外设的维护工作转交给专业从事IT运维的公司来进行全方位的维护。
IT运维工程师岗位职责为满足公司的快速发展,提升业务部门网络办公效率,提升IT服务意识,IT运维工程师按照SLA协议承诺受理公司用户提交的IT服务请求,包括用户使用网络、服务器、电脑终端及周边设备等设施过程中软硬件维护、事件处理、 *** 作指导、资讯指导等,提供规范、稳定、持续、高质量的IT可用资源和服务。
一、分担部门KPI指标,实现部门SLA承诺
1、事件管理通过主动积极服务或热线电话和邮箱受理等公司用户提交的IT服务请求;及时记录所有用户的事件,保证记录完整率达标;在SLA承诺的时间内响应用户的事件,响应及时率达标; 对用户事件进行规范的分类、分级,并按事件级别不同要求进行响应和处理;在承诺的时间内处理用户事件,或按规范传递给高一级技术支持,保证事件处理及时率达标;综合运用服务规范、沟通技巧和专业技能处理用户事件,并记录处理过程及方案,保证事件处理平均时间达标; 规范跟踪用户事件的处理进展,最终关闭事件或提交BUG立项,保证事件解决率达标;定期抽样回访用户和汇总用户意见,进行自我批判和持续改善用户满意度,保证用户满意度达标,用户投诉率在承诺范围以内;承诺日平均事件处理数量,主动接管处理事件,高峰期需要灵活调整事件平均处理时长; 运维值班人员按规范跟踪突发事件以及通报相关人员,保证跟踪正确率达标;对本岗负责的事件跟踪处理,根据事件处理经验,提出合理化建议,将各类隐患消除在可控范围内;养成良好工作习惯,做到事前有计划、事中有控制、事后有反馈、完成有记录;
2、配置管理 IT资产配置管理:对IT资产生命周期进行管理,包括分类统计、预购、选购审核、转移审核、报废审核,保证配置管理正确率达标;建设案例库:累积和提炼工程师的事件处理经验制作成案例,并持续丰富运维案例库供查询,案例覆盖已知事件的比率达标,不断提高运维工程师工作效率; IT系统配置信息管理:定期更新网络及应用系统描述信息及技术支持信息配置,保证最新;
3、问题管理对事件进行统计分析,找出疑难、重复发生的事件,纳入问题管理流程,分析问题产生的根本原因,确定可能解决的方案,需要修改网络或应用系统配置时提交变更申请触发变更管理流程。
4、发布管理运维值班人员按规范统一发布信息部网络及应用系统正式公告、变更公告、特殊公告等,正确率达标;
二、其他运维工作承担新员工导师工作,辅导新员工快速熟悉公司文化、环境、工作岗位及提升技能,为新员工顺利通过试用期提供保障;持续反省自身的工作、总结工作中存在的不足和可改善之处,积极对部门运作提出改善建议; 积极参加公司重点应用项目的培训并按事件管理规范提供支持,如SAP、OA系统等;应部门发展需要在不影响现有工作的基础上主动承担其他项目支持,如网络、服务器,程控交换机等;共享个人的技术经验,主持运维内部讲座; 积极参加信息部各类培训,有计划地进行自我学习,不断提升自身专业技能;对重点维护设备进行定期巡检并记录,巡检及时率和正确率达标;
三、其他工作担任IT讲师,应其他部门邀请提供IT技能培训,提高其他部门办公人员的IT *** 作 水平; 贯彻执行公司理念,积极完成上级分配的临时任务;
桌面运维工程师,即负责用户终端的管理及日常维护的人员,工作内容主要分为两个方面:一是对设备的分配调动进行管理并妥善记录。二是对终端进行软件安装和策略应用。
在千人以上的企业,桌面运维工程师所发挥的作用是非常重要的,主要职能包括以下几点:
硬件维护
主要包括打印机/PC机/笔记本电脑/考勤机等终端设备的调配及维护。桌面运维工程师要负责记录设备的唯一标识及使用人员。在员工入职时要负责笔记本电脑等个人配件的分配,以及考勤卡的分配等事宜。在员工离职时要负责对设备进行收回及初始化。在工作过程中如设备出现硬件故障应向财务进行申报及更换故障元件。
软件维护
软件方面主要负责 *** 作系统的安装,常用软件的安装及域和安全策略的管理,其中 *** 作系统应有统一的Ghost盘进行安装以节省软件的时间。如果公司有AD域,应将设备加入域,并在域中登记详细的员工信息,统一桌面安全策略以保证员工在使用计算机进行工作时的安全,预防安装未知软件所造成的危害。除此以外还要负责公司领导的“个性化软件需求”。一个专业的桌面运维人员要善于定制软件的规则及策略以方便日后的维护工作。
通讯终端的管理
包括网络电话,视频会议终端等设备的安装及管理。分配座机号并更新通讯录也是桌面运维工程师需要负责的工作。
APEX IT运维和服务管理系统 提供了“无缝式IT监控系统”功能,其系统架构清晰,采用模块化的设计理念,各功能模块既可独立运行、松散耦合;亦可整体功能无缝衔接覆盖整个业务系统,灵活的自由组合真正实现个性化的IT无忧运维。
APEX IT运维和服务管理系统主要由综合运维管理平台OSSWorks、网络管理NetManager、应用管理ApplicationsManager、流量管理FlowManager、桌面安全管理DeskTopManager等五个产品组成:
OSSWorks:遵循ITIL标准规范,结合国内管理模式,提供服务台、个人桌面管理、事件管理(突发故障管理)、问题管理、IT资产配置管理、变更与发布管理、知识库等功能,实现了一体化的IT运维支撑平台。
NetManager NETMANAGER:实现了对交换机、路由器、防火墙等设备的全方位管理,提供了丰富的拓扑、配置、资产、故障、性能、事件、流量、报表等网络管理功能。
ApplicationsManager: 实现了对多种系统及上层应用监控管理功能,包括服务器、数据库、邮件服务器、WEB服务器、应用服务器、 *** 作系统、网站监控等。
FlowManager:提供网络流量监测、流量门限、协议分析、Web上网行为审计等功能。结合NetFlow网络流量分析器实现更为细化、便捷的全网流量分析功能。
DesktopManager:提供资产管理、桌面安全策略管理、软件和补丁分发、文件访问控制等功能,确保PC应用环境的稳定性与安全性。
通过Apex IT运维和服务管理模块可以实现对IT资源的全面、可视化、统一管理。
运维,更偏向于业务产品的支持,偏向于背后的英雄,运维团队需要为业务的稳定性,成本等方面负责!
企业需要的IT运维体系,本质上也是需要从稳定性、成本的角度来建立。
(1) 稳定性方面
稳定性,是反应服务访问质量差甚至无法访问的指标。业界流行的的稳定性公式是,服务总在线时间/服务总时间,具体指标数据以几个9表示,比如一般的云计算服务提供上,承诺的稳定性指标是3个9:999%(意味着每年宕机时间不超过875小时),而对于大型互联网公司的业务,对于运维的指标则是9999%(全年宕机时间不超过52分钟),甚至99999%(全年宕机时间不超过8分钟)。
稳定性方面,需要什么样的技术体系支撑呢?
监控体系。现在开源软件已经让企业的运维能力大幅提升,如zabbix,nagios等,已经被很多企业广泛使用。同时,随着人工智能的兴起,监控的智能化精细化水平,也在不断提升,比如,传统的监控无非是发现异常了之后报警,但加入智能化之后,则可以自动分析异常的根本原因在哪里,基于此则可以继续做自动的恢复,避免人工成本。
基础技术体系。包括硬件(服务器,网络等), *** 作系统/内核等,也直接影响到业务的稳定性。现在云计算的技术已经非常成熟,服务器与网络方面可以由类似openstack,cloudstack等IaaS平台管理, *** 作系统/OS等则可以通过docker,以及各类PaaS平台进行维护与管理,实现稳定性的保障。
安全体系。随着现在互联网的飞速发展,伴随而来的网络攻击也越来越疯狂,根据普华永道的调查,针对中国公司的网络攻击频率两年内已经提升了两倍,这也使得安全成为互联网架构中必不可少的环节,waf应用防火墙,数据清洗,防cc,ddos攻击等安全体系,也是必备的技术体系之一。
(2) 成本方面
计算成本。即托管企业运行软件所需要的服务器成本。现在云计算厂商提供的IaaS产品也是已经非常成熟,而且价格也在不断地下调,2016年10月,阿里云宣布了大量云产品的降价,一年内就下降十几次,也使得企业的成本控制方便可以越来有利。
人力成本。包括运维人力,研发人力,运维人力的主要投入来自于业务稳定性的保证,比如,服务异常之后的故障恢复,容灾与服务重建等。业务研发中,业务本身的迭代效率与质量,也间接影响了研发的成本。这方面则可以通过PaaS平台的技术手段来解决。
(3) 商业化
商业化是企业运维体系的更上一层。企业IT运维是每个企业必不可缺的环节之一,因此,运维相关的产品也逐渐受到企业的重视。比如应用性能分析厂商(new relic),则是提供了优化服务运维质量的有效方案,监控等产品也是运维最受欢迎的产品之一。
1 负责日常系统维护,及监控,提供IT软硬件方面的服务和支持,保证系统的稳定。
2 参与设计、审核、优化公司IT系统以及各应用系统的体系架构;
3 全面负责公司运维项目的系统升级、扩容需求与资源落实,配合开发需求,测试、调整运维平台;
4 负责网络以及服务器的网络设置、维护和优化、网络的安全监控、系统性能管理和优化、网络性能管理和优化;
5 建立面向开发部门,业务部门的服务流程和服务标准;
6 负责IT运维相关流程的规划、设计、推行、实施和持续改进;
7 负责内部分派下发,对实施结果负责。
8 负责日常网络及各子系统管理维护。
9 负责设计并部署相关应用平台,并提出平台的实施、运行报告。
10 负责配合开发搭建测试平台,协助开发设计、推行、实施和持续改进。
11 负责相关故障、疑难问题排查处理,编制汇总故障、问题,定期提交汇总报告。
12 负责网络监控和应急反应,以确保网络系统有724小时的持续运作能力。
运维的技术方向
服务监控技术:包括监控平台的研发、应用,服务监控准确性、实时性、全面性的保障
服务故障管理:包括服务的故障预案设计,预案的自动化执行,故障的总结并反馈到产品/系统的设计层面进行优化以提高产品的稳定性
服务容量管理:测量服务的容量,规划服务的机房建设,扩容、迁移等工作
服务性能优化:从各个方向,包括网络优化、 *** 作系统优化、应用优化、客户端优化等,提高服务的性能和响应速度,改善用户体验
服务全局流量调度:接入服务的流量,根据容量和服务状态在各个机房间分配流量
服务任务调度:服务的各种定时/非定时任务的调度触发及状态监控
服务安全保障:包括服务的访问安全、防攻击、权限控制等
数据传输技术:包括p2p等各类传输技术的研发应用,也远距离大数据传输等问题的解决
服务自动发布部署:部署平台/工具的研发,及平台/工具的使用,做到安全、高效的发布服务
服务集群管理:包括服务的服务器管理、大规模集群管理等
服务成本优化:尽可能降低服务运行使用的资源,降低服务运行成本
数据库管理(DBA):通过设计、开发和管理高性能数据库集群,使数据库服务更稳定、更高效、更易于管理。
平台化的开发:类docker和google borg平台的开发管理,及服务接入技术
分布式存储平台的开发优化:类google gfs等分布式存储平台的研发及服务接入
IT运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的业务能够 7×24 小时为用户提供高质量的服务。
运维人员对公司业务所依赖的基础设施、基础服务、线上业务进行稳定性加强,进行日常巡检发现服务可能存在的隐患,对整体架构进行优化以屏蔽常见的运行故障,多数据中接入提高业务的容灾能力。
通过监控、日志分析等技术手段,及时发现和响应服务故障,减少服务中断的时间,使公司的业务符合预期的可用性要求,持续稳定地为用户提供务
IT运维是IT管理的核心和重点部分,也是内容最多、最繁杂的部分,该阶段主要用于IT部门内部日常运营管理,涉及的对象分成两大部分,即IT业务系统和运维人员,该阶段的管理内容又可细分为七个子系统:
■设备管理:对网络设备、服务器备、 *** 作系统运行状况进行监控
应用/服务管理:对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理
■数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复
■业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理,主要关注该业务系统的CSF(关键成功因素CriticalSuessFactors)和KPI(关键绩效指标KeyPerformanceIndicators)
■目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理
■资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互
■信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127中控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等
■日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段IT运行维护管理的每一个子系统中都包含着十分丰富的内容,实现完善的IT运维管理是企业提高经营水平和服务水平的关键。运行/维护阶段与服务/支持阶段的分界线为前者是面向IT部门内部的管理,而后者是面向业务部门、企业中的其它人员或直接面向客户。
以上就是关于IT运维服务的简介全部的内容,包括:IT运维服务的简介、IT运维都包含什么工作内容有了解的吗、IT桌面运维人员的工作内容是什么,为什么对企业等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)