IT管理和运维工作涵盖了各行业的各岗位中,如何提高工作效率,规避风险,更好的做好IT管理和运维工作,已经成为一个不断探索和研究的新兴课题。笔者认为,应从两个层面加强和完善IT管理和运维工作,可以改善IT运维工作的现状。
方法/步骤
转变IT运维管理工作方式和理念。强调从技术型向管理型转变。各企事业单位的应用系统和网络系统已经成支撑业务正常运转的重要基础,保证应用系统和网络系统的正常运行和使用成为了IT运维工作的重中之重。IT运维部门的职能应当从传统的重服务轻管理,逐步转变为服务与管理并行,规范化与人性化相辅相成的模式,以适应现代化信息的工作模式。
建立完善的内部信息共享平台。从基础设施。应用系统和业务服务三个方面打造完善的信息共享和资源监控平台。能建立有效的信息资源库,减低对关键技术人员的依赖,为日常IT运维和 管理工作提供有效的保障:基础设施管理方面,对网络,应用系统软、硬件等资源进行细化管理,详细记录电子设备的出入库、维保、报废等环节。保证资源的有效 利用;应用系统管理方面,对于各类应用系统的备份,日常维护进行有效管理控制,保证所有应用系统数据的一致性、准确性、及时性、可用性和完整性,并根据实 际需要不断进行改进、完善或更新;业务服务管理方面,尽可能的记录所有的事件要素,包括问题描述、解决方案、 *** 作人员等等。使得部门对人员的考核有了量化 的标准,同时这个过程也有助于知识积累,形成有效的知识库,可以极大地减少对关键人员的依赖,降低人员流失的风险。
清理、简化现有IT运维管理制度。形成适合企事业单位管理实际的制度体系。以建立完整、规范、有效的内部规章制度体系为目标,紧密联系工作实际,按照适用、可行、合法、有效的原则,对现有规章制度进行全面的自查和清理。按照IT运维管理工 作的职能分工分层次、分步骤地对制订的各项内部管理制度规程进行分类清理,从制度内容的适用性、可行性、依据和效力的合法性、执行的有效性等方面进行了逐 条审核,并结合实际工作,对上级部门制订的内部管理制度与当前实际工作不符的情况进行修订和完善。逐步摈弃传统的“人管人”的工作模式,形成以制度带动 人,以制度带动工作的长效机制。
建立例行巡查和通报制度。IT运维部门的负责人和业务主管可通过内部信息共享这一平台,对业务进行有效的 监督。一是定期对记录的相关事项进行巡查,审计已登记发生事项的规范性。二是对正在发生的事件实时跟踪,及时了解事件的进展状况。规范各个流程的 *** 作,从 源头避免业务差错的发生。三是建立采集问题,核实整改问题及问题通报三个环节的通报机制,以提升力IT运维管理的效率。
加强与内部审计部门的业务合作。内部控制审计对组织治理、风险管理、改善控制效率和效果等方面有很大的促进作用。IT运维部门可配合内部审计部门进行运维管理,将内部控制审计作为常态化审计类型,通过这种方式,突出内控特点,运用规范的审计方法和评价体系,注重从控制、风险、管理等宏观层面查找问题、提出建议,以达到促进IT运维管理工作,完善内控和加强管理的目的。
通过内部审计部门,加强督导、整改等工作的实效。在IT运维管理工作的过程中,不仅要发现问题解决问题,更重要的是要形成完善的IT运维管理工作规范和流程,在这点上。可以通过内部审计部门对企事业单位内部进一步规范制度、程序和方法,形成对风险进行事前防范、事中控制、事后监督和纠正的动态过程和机制,强化重要业务环节的风险控制。加大检查力度,切实有效地推进督导、整改工作,建立内控管理的长效机制。
加强与内部审计部门的沟通交流和人员培训,培养复合型管理人员。定期组织IT运维人员和内部审计人员进行学习交流,探讨内控管理中存在的问题,交流内控管理的心得体会,充分发挥IT运维的技术优势和内控的管理优势,通过良好的内部沟通机制和完善的信息共享平台,建立内部控制体系运行网络和内部控制管理组织体系。
如何提升IT运维工作便利性
方法/步骤1结合IT运维中的重点难点热点问题,深入推进IT运维自动化工具的开发。
2实现设备的远程监控和批量 *** 作、资源变更的自动发现等功能。
3安全整治完善批量化运维 *** 作的手段,适配更多相对复杂的场景,完善自运行、自验证的相关功能。
4建立智能分析、故障预判发现等单场景、多场景的智能运维能力。
5进一步推进口令集中管理范围,实现强制性的统一认证、密码的动态化管理。
6建立账号及口令管理的长效机制,消除弱口令。实现自动化运维能力,单场景、多场景的AI运维能力
7基础设施信息通过手机应用等方式,实现CMDB的IP、归属等信息的方便查询,方便一线日常运营维护。
回答:计算机技术在企业中的应用越来越广泛,从最初的简单计算到初级办公,到现在的大型应用系统,计算机应用越来越来越深入到企业的各个方面,企业对计算机应用系统的依存度越来越高。而基础网络系统(网络设备、线路、服务器、桌面电脑等)则是计算机应用系统的运行保障,就好比是高速公路,路通则信息通,因而基础网络系统的运行情况对现代企业各项活动开展起着非常重要的作用。为了应对基础网络的运维,各企业应用多种管理手段、技术手段对IT运维进行提升,比如划分职能科室(组)、职能人员(网络管理员、网络安全员、系统管理员、数据库管理员、现场管理等岗位)是管理手段,应用ITSM(IT服务流程管理)、桌面安全管理、网管、活动目录服务等系统是技术手段。其中有的职能重复,有的系统交叉,本文以的笔者所在企业IT运维现状为背景,探讨IT运维的发展模式,旨在优化大型企业IT运维模式,更好地为企业服务。
1 IT运维现状分析
不同企业IT运维方式大不相同。由于不同地域,不同行业计算机应用发展水平不同,造成不同企业的管理模式大不相同,比如银行系统,由于计算机普及应用较早,地域分布较广,计算机应用及运维发展较快;而某些大型企业,由于管理者偏重主营产品,忽视在IT基础设施及应用系统上的投入,因而IT运维服务处于较低水平。
同一个企业IT运维方式也存在差别。同一企业,如果规模较大,二级单位较多,由于管理方式差别,运维模式也有较大不同。比如有些企业维护人员多,有些少,有些企业采用传统方式运维,有些企业则重视应用先进的管理系统等,这些原因造成同一企业内部的差别。
2 理顺思路,建立合适的IT运维架构
IT运维的目的
IT运维的目的主要有三个:第一个是提供一个稳定高效的基础网络平台,为各种计算机应用系统的正常运行提供保障;第二个是为客户提供满意的服务,使客户端与计算机相关的故障能快速地得到解决;第三个是节省人力,提高工作效率,快速处理基础网络的故障。正是基于这样的目的,所以企业在基础网络方面不断加大投入,在管理上不断创新。
分析企业目前各个应用系统
基础网络是为应用服务的,所以我们可以分出哪些系统是属于基础网络的,哪些系统是属于企业应用类的,比如某大型企业的信息系统中,ERP、MES、LIMS等系统是属于应用服务类系统,直接面对终端用户,而网管系统、桌面安全、ITSM、数据存储备份等则是属于基础网络类的,其中ITSM是直接为用户提供服务接口的,其它则是作为IT基础管理系统。对于应用服务类的系统我们要分析其可能故障,并理清解决的流程;对于基础网络类的系统,我们则要将其置于流程之中,理清如何协作才能更好地为用户层的应用系统服务。
建立合适的IT运维架构
传统的运维框架很简单,基本是负责人制,碰到运维方面的问题时由负责人分配工作,这样的方式初期运作简单高效,但随着企业规模的扩大及计算机应用的普及,传统作业方式受很多因素影响,比如分配工作难、耗费人力多、处理问题能力要求高、工作量大等,所以企业迫切需要新的IT运维模式。
某大型国有企业,对基础IT运维相当重视,近几年相继在各分公司推广部署桌面安全系统、防病毒系统、网管系统等,各分公司也针对企业实际情况上做了一些很好的系统,比如某大型企业应用的ITSM系统、上网行为管理系统,这些系统之间有些重复,但各有侧重,那么如何使各系统有机结合,建立一个合适的IT运维框架则是必要的。笔者从某大型企业IT运维现状出发,提出一种IT运维架构,仅供讨论,如图1所示。
图1中ITSM为用户服务接口,内控则是管理接口,用户端的问题进入ITSM系统后,按问题分类或业务分工进入相应的基础网络系统或应用系统处理,各系统也需要分别建立相应的运维架构,比如防病毒系统可以建立。
图1 IT运维架构
如图2所示的运维架构。经各系统处理完后反馈给用户并进行归档,内控则对整个运维过程进行规范化控制。
图2 防病毒体系的三级运维架构
3 优化结构,建立合适的运维流程
分析IT运维需要处理的各种问题。IT运维所需处理的故障种类很多,硬件故障还是软件故障、内部网故障还是外部网故障、系统问题还是病毒问题、用户端问题还是服务器端问题,网络设备问题还是应用系统问题等,列出工作中已遇到过的问题以及可能出现的的问题,通过分析,然后再来建立我们的流程,是建立合理流程的依据。
结合组织结构,建立合适的运维流程。IT部门一般按专业划分科室,比如网络、系统、应用开发、工业控制等,这种划分是以水平层面来管理的,传统管理模式基本都是这种方式,而新的基础IT运维系统要求以专业及技术水平来进行竖直层面的分工,比如ITSM要求一线处理现场基础问题,二线处理复杂问题,经理处理全局问题及疑难问题,从而对不同层次提出了不同的技术要求,因此企业需要在水平与竖直两个层面上找到一个平衡点,来建立合适的管理模式。结合企业实际情况,经过结构优化后,建立各个系统的运维流程,图1的运维架构显示,各个系统之间是相对独立而又相互联系,因此相应的流程必定是相对独立而又相互联系的。
4 防患于未然,注重日常管理工作
建立各系统的管理办法、推广预知维修思维。正如象设备维修由最初的事后维修发展到预知维修模式一样,IT运维模式同样要注重预知维修,即是在问题出现之前,根据一些监测系统(比如网管系统)、日志记录系统等发现异常现象,将故障消灭在萌芽状态。现代企业对计算机信息系统的依赖性越来越高,要求也越来越高,比如某大型企业的MES、ERP、IC卡等系统,要求7 X 24 h工作,任何一次小小的故障都可能造成巨大的经济损失,因此减少信息系统故障率是非常重要的。要做到预知维修,具体到工作中就是要建立各个系统的管理办法,其中要包括异常监测和应急处理等内容,一些关键系统必须有日报,周报或月报。ITSM系统中的常见故障和经验汇总功能即是预知维修思维应用在现代管理上的体现。
建立完善的文档资料。网络系统里的资料再详细,也有出故障甚至丢失的可能,维护良好的文档对于IT运维很有帮助。资料整理除了要求全面,清晰外,还需要满足两个原则,一个是动态更新,过时的资料会误导对事情的了解及判断;第二个是让一个新人能看明白,完全不了解情况的新人(具备专业知识)通过资料能了解现状,则说明这是一份高质量的资料。比如,企业网络连接的文档资料,好的文档的关键不是把每个连接到各个图形的工作站(假设保持最新信息)都进行归档,而是把注意力集中到网络互联(拓扑、交换机和路由器)、服务器、网关和防火墙上。路由器和交换机没有必要用图形(类似设备的图形)表示,用简单的几何形状(如五边形、圆、方块和矩形)表示即可。例如,总使用一个八边形表示一个核心层交换机、用五边形表示汇聚层交换机、用正方形表示接入层交换机。
5 分清责任,建立相应的激励制度
不同的岗位工作方式不同,比如有的现场维护,有的远程处理;不同的技术水平要求不同的待遇,比如ITSM系统中一线技术人员与事件经理责任不同,待遇应该不同,因此企业应当推出相应的奖罚、晋升制度,以激励员工进步。本文着重于运维模式,对此不作进一步探讨。
6 结语
企业为优化生产、提高工作效率、减少成本,采用多种基础网络维护系统和生产应用系统,达到上述目的的同时,也对IT运维模式提出了更高的要求,新的运维模式要求一个清晰的运维架构和合理的工作流程, 同时更要注重日常管理工作和激励机制,这样才能更好地为企业服务。但企业在适应新的系统过程中,必然会出现一些问题,比如员工心态难适应、组织结构难协调、奖罚制度难改变等,这对很多企业是一个挑战。
给你个专业的。(信息安全的运维管理)
725 系统运维管理
7251 环境管理(G3)
本项要求包括:
a) 应指定专门的部门或人员定期对机房供配电、空调、温湿度控制等设施进行维护管理;
b) 应指定部门负责机房安全,并配备机房安全管理人员,对机房的出入、服务器的开机或关机等工作进行管理;
c) 应建立机房安全管理制度,对有关机房物理访问,物品带进、带出机房和机房环境安全等方面的管理作出规定;
d) 应加强对办公环境的保密性管理,规范办公环境人员行为,包括工作人员调离办公室应立即交还该办公室钥匙、不在办公区接待来访人员、工作人员离开座位应确保终端计算机退出登录状态和桌面上没有包含敏感信息的纸档文件等。
7252 资产管理(G3)
本项要求包括:
a) 应编制并保存与信息系统相关的资产清单,包括资产责任部门、重要程度和所处位置等内容;
b) 应建立资产安全管理制度,规定信息系统资产管理的责任人员或责任部门,并规范资产管理和使用的行为;
c) 应根据资产的重要程度对资产进行标识管理,根据资产的价值选择相应的管理措施;
d) 应对信息分类与标识方法作出规定,并对信息的使用、传输和存储等进行规范化管理。
7253 介质管理(G3)
本项要求包括:
a) 应建立介质安全管理制度,对介质的存放环境、使用、维护和销毁等方面作出规定;
b) 应确保介质存放在安全的环境中,对各类介质进行控制和保护,并实行存储环境专人管理;
c) 应对介质在物理传输过程中的人员选择、打包、交付等情况进行控制,对介质归档和查询等进行登记记录,并根据存档介质的目录清单定期盘点;
GB/T 22239—2008
28
d) 应对存储介质的使用过程、送出维修以及销毁等进行严格的管理,对带出工作环境的存储介质进行内容加密和监控管理,对送出维修或销毁的介质应首先清除介质中的敏感数据,对保密性较高的存储介质未经批准不得自行销毁;
e) 应根据数据备份的需要对某些介质实行异地存储,存储地的环境要求和管理方法应与本地相同;
f) 应对重要介质中的数据和软件采取加密存储,并根据所承载数据和软件的重要程度对介质进行分类和标识管理。
7254 设备管理(G3)
本项要求包括:
a) 应对信息系统相关的各种设备(包括备份和冗余设备)、线路等指定专门的部门或人员定期进行维护管理;
b) 应建立基于申报、审批和专人负责的设备安全管理制度,对信息系统的各种软硬件设备的选型、采购、发放和领用等过程进行规范化管理;
c) 应建立配套设施、软硬件维护方面的管理制度,对其维护进行有效的管理,包括明确维护人员的责任、涉外维修和服务的审批、维修过程的监督控制等;
d) 应对终端计算机、工作站、便携机、系统和网络等设备的 *** 作和使用进行规范化管理,按 *** 作规程实现主要设备(包括备份和冗余设备)的启动/停止、加电/断电等 *** 作;
e) 应确保信息处理设备必须经过审批才能带离机房或办公地点。
7255 监控管理和安全管理中心(G3)
本项要求包括:
a) 应对通信线路、主机、网络设备和应用软件的运行状况、网络流量、用户行为等进行监测和报警,形成记录并妥善保存;
b) 应组织相关人员定期对监测和报警记录进行分析、评审,发现可疑行为,形成分析报告,并采取必要的应对措施;
c) 应建立安全管理中心,对设备状态、恶意代码、补丁升级、安全审计等安全相关事项进行集中管理。
7256 网络安全管理(G3)
本项要求包括:
a) 应指定专人对网络进行管理,负责运行日志、网络监控记录的日常维护和报警信息分析和处理工作;
b) 应建立网络安全管理制度,对网络安全配置、日志保存时间、安全策略、升级与打补丁、口令更新周期等方面作出规定;
c) 应根据厂家提供的软件升级版本对网络设备进行更新,并在更新前对现有的重要文件进行备份;
d) 应定期对网络系统进行漏洞扫描,对发现的网络系统安全漏洞进行及时的修补;
e) 应实现设备的最小服务配置,并对配置文件进行定期离线备份;
f) 应保证所有与外部系统的连接均得到授权和批准;
g) 应依据安全策略允许或者拒绝便携式和移动式设备的网络接入;
GB/T 22239—2008
29
h) 应定期检查违反规定拨号上网或其他违反网络安全策略的行为。
7257 系统安全管理(G3)
本项要求包括:
a) 应根据业务需求和系统安全分析确定系统的访问控制策略;
b) 应定期进行漏洞扫描,对发现的系统安全漏洞及时进行修补;
c) 应安装系统的最新补丁程序,在安装系统补丁前,首先在测试环境中测试通过,并对重要文件进行备份后,方可实施系统补丁程序的安装;
d) 应建立系统安全管理制度,对系统安全策略、安全配置、日志管理和日常 *** 作流程等方面作出具体规定;
e) 应指定专人对系统进行管理,划分系统管理员角色,明确各个角色的权限、责任和风险,权限设定应当遵循最小授权原则;
f) 应依据 *** 作手册对系统进行维护,详细记录 *** 作日志,包括重要的日常 *** 作、运行维护记录、参数的设置和修改等内容,严禁进行未经授权的 *** 作;
g) 应定期对运行日志和审计数据进行分析,以便及时发现异常行为。
7258 恶意代码防范管理(G3)
本项要求包括:
a) 应提高所有用户的防病毒意识,及时告知防病毒软件版本,在读取移动存储设备上的数据以及网络上接收文件或邮件之前,先进行病毒检查,对外来计算机或存储设备接入网络系统之前也应进行病毒检查;
b) 应指定专人对网络和主机进行恶意代码检测并保存检测记录;
c) 应对防恶意代码软件的授权使用、恶意代码库升级、定期汇报等作出明确规定;
d) 应定期检查信息系统内各种产品的恶意代码库的升级情况并进行记录,对主机防病毒产品、防病毒网关和邮件防病毒网关上截获的危险病毒或恶意代码进行及时分析处理,并形成书面的报表和总结汇报。
7259 密码管理(G3)
应建立密码使用管理制度,使用符合国家密码管理规定的密码技术和产品。
72510 变更管理(G3)
本项要求包括:
a) 应确认系统中要发生的变更,并制定变更方案;
b) 应建立变更管理制度,系统发生变更前,向主管领导申请,变更和变更方案经过评审、审批后方可实施变更,并在实施后将变更情况向相关人员通告;
c) 应建立变更控制的申报和审批文件化程序,对变更影响进行分析并文档化,记录变更实施过程,并妥善保存所有文档和记录;
d) 应建立中止变更并从失败变更中恢复的文件化程序,明确过程控制方法和人员职责,必要时对恢复过程进行演练。
72511 备份与恢复管理(G3)
本项要求包括:
a) 应识别需要定期备份的重要业务信息、系统数据及软件系统等;
GB/T 22239—2008
30
b) 应建立备份与恢复管理相关的安全管理制度,对备份信息的备份方式、备份频度、存储介质和保存期等进行规范;
c) 应根据数据的重要性和数据对系统运行的影响,制定数据的备份策略和恢复策略,备份策略须指明备份数据的放置场所、文件命名规则、介质替换频率和将数据离站运输的方法;
d) 应建立控制数据备份和恢复过程的程序,对备份过程进行记录,所有文件和记录应妥善保存;
e) 应定期执行恢复程序,检查和测试备份介质的有效性,确保可以在恢复程序规定的时间内完成备份的恢复。
72512 安全事件处置(G3)
本项要求包括:
a) 应报告所发现的安全弱点和可疑事件,但任何情况下用户均不应尝试验证弱点;
b) 应制定安全事件报告和处置管理制度,明确安全事件的类型,规定安全事件的现场处理、事件报告和后期恢复的管理职责;
c) 应根据国家相关管理部门对计算机安全事件等级划分方法和安全事件对本系统产生的影响,对本系统计算机安全事件进行等级划分;
d) 应制定安全事件报告和响应处理程序,确定事件的报告流程,响应和处置的范围、程度,以及处理方法等;
e) 应在安全事件报告和响应处理过程中,分析和鉴定事件产生的原因,收集证据,记录处理过程,总结经验教训,制定防止再次发生的补救措施,过程形成的所有文件和记录均应妥善保存;
f) 对造成系统中断和造成信息泄密的安全事件应采用不同的处理程序和报告程序。
72513 应急预案管理(G3)
本项要求包括:
a) 应在统一的应急预案框架下制定不同事件的应急预案,应急预案框架应包括启动应急预案的条件、应急处理流程、系统恢复流程、事后教育和培训等内容;
b) 应从人力、设备、技术和财务等方面确保应急预案的执行有足够的资源保障;
c) 应对系统相关的人员进行应急预案培训,应急预案的培训应至少每年举办一次;
d) 应定期对应急预案进行演练,根据不同的应急恢复内容,确定演练的周期;
e) 应规定应急预案需要定期审查和根据实际情况更新的内容,并按照执行。2011-10-20
以上就是关于如何做好IT项目的运维管理全部的内容,包括:如何做好IT项目的运维管理、如何提升IT运维工作便利性、如何优化大型企业IT运维模式等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)