现在的企业几乎都是互联网办公,网络一旦出现问题,会对公司业务造成重大损失。而很多公司主业也不是IT,对网络问题不大懂,对于公司的网络问题往往都是请一个运维工程师处理。这些工程师有相应的专业能力,但管理人员的“不懂行”却让运维工作存在很多问题,主要有这五点:
1、缺乏有效的知识积累和共享,造成 *** 作维护效率低下,类似的故障和问题仍然在不断发生,不断解决着,同时一旦某些掌握关键信息和技能的人发生意外状况(如生病,离职等),整个日常维护可能面临严峻的考验。
2、工程师的维护职责不是很清楚,每个人都大概知道自己该做什么,但是某个具体事情到底该谁负责,却没有明细定位。
3、IT网络运维人员大多没有养成记录习惯,每个月汇总报告时,对自己的工作量、所维护系统的整体情况还是一头雾水。而且纸质的故障处理报告信息要素不全,统计和查询都是头痛的问题。
4、运维人员几乎很少能准时下班,处理突发技术故障的事情也时有发生。运维人员往往像“救火队员”一样去处理故障。 在“救火式”的IT管理维护模式下,很难有效地进行服务管理,无法保证IT服务的有效性和一致性,IT管理往往处于无序状态。
5、对于运维工程师的工作绩效缺乏客观考核依据。他们到底做了哪些事情哪些事情还没有做工作完成的时效性怎么样解决问题的质量怎么样这些问题,只能凭印象得出一个个模糊的答案。
如何解决以上问题
如何解决以上提到的问题是目前许多企业用户需要解决的问题,但首要关注的问题应是如何建立专业化分工的IT运维体系。
1、细化用户角色,力求提高运维效率
运维人力分工管理包含人员、岗位、角色等信息,如果这些信息没有统一规划,就无法进行统一配置。网络管理中的角色是根据ITIL标准进行划分的,是把IT运维各种事情(包括人员、资源、突发事故)分成不同级别和不同运维 *** 作,以便有效的配置运维人力资源。因此,对于企业而言,IT运维的专业化分工本质上是对IT运维人力资源配置的优化。例如,明确运维事件分级处理流程,明确运维人员的职责、权限、义务和绩效考核标准。事实上许多实践也证明,明确每种运维事件的专业化分工处理流程,可以大大减少IT运维 *** 作的随意性和混乱性,并能大大提高运维中的人力资源效率。
2、设立IT运维服务台,规范IT流程
在网管软件中,一般提供自助服务和运维服务台,自助服务台的作用是,给用户报故障,评价IT人员解决问题是否负责等。运维服务台是为了确定运维等级和引入优先处理原则。运维服务台主要承担:运行值班、故障监控、接受请求、工单派发及问题解决过程中的监测等工作内容。服务台就像是传统产业生产车间的调度分配员,它会不断的根据事件的等级进行匹配分工和调度。例如发生任何一个突发运维事件时,服务台会先检查并进行分类流转处理。运维人员可分为一线普通维护、二线技术专家和三线厂商专家。一线人员作为第一级问题处理人员,主要解决常规的运维问题;在一线人员不能解决的情况下,二线技术专家将迅速介入问题解决过程;三线技术专家来自产品供应商,由二线技术专家申请三线厂商专家的介入,使问题解决时间能够大大缩短。
3、FAQ和知识库,最大限度节省人力成本
提供FAQ和知识库两种方式,知识库是指对网络运维中的典型故障事件和常见问题解答的自助式处理流程。当出现故障时,用户先在自助式知识库寻找解决方法。如果问题没有得到解决,则用户利用服务台申请维护,用户申请将会移交给相应的负责人,负责人第一时间建立服务档案并一直实时监控,直到问题得到圆满的解决。因此,自助式知识库能帮助运维人员节省大量的时间,从而节省人力成本支出。
最后,专业的事情要用专门的人员来做,还要配合专业的方法。运维工程师是以技术为主的群体,他们往往关注于IT问题本身,主要通过提升自身技术实力来解决问题,不太关注技术之外的事情。这种情况下不可避免的会出现一些问题,这就需要管理人员来解决了。
当前,随着企业数字业务的快速发展和业务量的攀升,企业信息系统架构的升级变迁,以及企业多套业务系统的在线运营,各类监控组件和应用系统间的关系错综复杂,系统运维的难度也急剧增加,且面临着巨大挑战。
在传统运维方式下,数据规模大且离散,数据治理和全面分析能力薄弱且依赖于经验和规则,运维十分被动,解决问题效率非常低下,运维的实用性大打折扣,难以满足当前主动运营的要求。
具体来说有以下几点:
发现问题难:企业在经年累月中布局了诸多监控工具,但是监控手段阈值的设定单一,且一般都是静态阈值,而指标和告警的异常却是多样化的,这样就会造成大量的误报漏报现象。此外,目前绝大多数的监控工具,缺乏趋势预测能力,使得运维局面非常被动,导致发现问题十分困难。
根因定位难:发现问题时一般都是对问题进行定性分析,可能了解到某一告警对应的指标波动是值得关注的,但是并不能因此确定造成这种现象具体根因。而且目前的监控工具,大多缺乏综合根因定界及定位分析的手段,即便对监控进行了集中管理,也难以通过单纯的几种指标进行根因定位。
数据治理难:当数字化建设进行到一定程度的时候,被管理对象的数据量相应的也是水涨船高,数据数量大、类别多且非常分散,很难通过某一指标体系来衡量系统的健康度,也没有一个统一的视角去判断数据质量的好坏优劣。
运营分析难:现有的大多数基础监控工具,多数都是从自己的管理阈例如系统管理、网络管理出发看待问题,缺乏端到端的分析能力,没办法以业务视角从综合运营分析的角度,去看待多样化指标对系统的影响。
而智能运维是一种全新的数字化运维能力,也将是数字化转型的必备能力。智能运维相对于传统运维模式而言,能够在运维数据治理、业务数字化风险、运维人力成本和业务侧影响力四个方面有本质的效能提升。
智能运维相对于传统运维模式而言,能够在四个方面有本质的效能提升:
运维数据治理。通过高性能实时处理的数据平台广泛采集、处理和分析数字化业务运行过程中的多样化运维数据,包括告警、指标、日志、配置以及运维工单等类别,不仅提升了运维大数据的治理能力,优化了数据质量,而且为进一步激活运维数据的价值打下了良好基础;
业务数字化风险。使运维人员不仅提升了历史运维数据的分析能力并且能够对实时数据进行异常检测和问题预判,有效降低数字化业务的运行风险,提升可用性、稳定性;
运维人力成本。使真正意义上的跨域根因定位成为可能,降低对专业运维人员经验技能的依赖,迅速缩短故障排查时间并有效降低人力成本;
业务侧影响力。以业务视角利用多元化数据提高运营分析和决策能力,比如端到端的分析业务交易状态,提供给业务、客服部门及时反馈和决策支持依据,充分增强业务影响力;
智能运维发展正如火如荼,Gartner预见其为下一代运维,认为到2022年将有近50%的企业用户部署智能运维。虽然目前不少企业已经在积极投入建设,也还有一些企业处在迷茫阶段,对这种趋势不太清晰,借用著名作家威廉吉布森的话,“未来已来,只是分布不均。”
将近70%的IT项目会超出预算或者是延期完成,究其原因,往往是缺乏良好的计划、通畅的内部沟通,以及合理的资源分配。
许多IT项目管理顾问和软件提供商经常抱怨,“甲方”总是一再犯下相同的错误。不是IT小组没有遵守标准的项目管理流程,就是没有相应的人员来开展项目,或者没有评估有可能危及项目的风险,也没有确定缓解这些风险的办法等等。诸如此类的错误还有一大堆,足以“致命”。
有业内人士指出,若能避免这些最常见的IT项目管理陷阱,不但会提高项目的成功率,还能提高内部客户的满意度,业务部门也会成为受益者。一个按时、按预算交付的系统,必将提升业务部门的竞争力。
本文列出的14个最常见的项目管理错误,将有助于发现IT项目在哪些环节易出现问题,以便采取某些措施来加以改进。
第1个错误
缺乏拥有相应技能的技术人员。
影响:资源配置不当名列最常见项目管理错误的首位。要是没有为项目配置相应的人员,会毁了项目。
办法:项目管理软件厂商Primavera的CEO Joel Koppelman说:“成功完成项目的关键就是找到具有相应技能的技术人员,再全面的规划也解决不了人手不足的问题。”IT和项目经理需要完全了解项目所有相关人员的技能和工作量,其中包括顾问、承包商和外包商。因为即便他们从事的工作占到了总量的很大一部分,技能评估环节也常常会忽视这群人。另外,IT和项目经理知道了谁在从事什么工作以后,还要弄清楚如何针对众多项目和日常工作来分配资源。
IT基础设施咨询公司GlassHouse Technologies的创办人Richard Scannell说: “虽然项目管理方面有多种组织模式,但运作起来都不咋样。没有简单的办法可以解决资源分配问题。协调好人员和项目的潜在办法就是任命资源经理来负责为每个项目指派人员,并确保人员合理分配到了诸个项目上。”
Scannell建议成立“专家小组”,专家小组的成员专门从事某个特定项目,在一年或者更长的时间内不用承担其他传统的工作职责。
惠普公司软件部门项目组合管理中心的Ken Cheney也建议,应针对项目而不是针对某项任务来分配资源。
Cheney表示,如果很难为项目配备足够人员,那么取消“可自由支配的”项目(比如与业务战略不是紧密相关的项目),也许能腾出一些资源。另外,他建议分析IT人员正在从事的全部项目组合,剔出一些不是很要紧的项目,以减少人员配备。
第2个错误
缺乏经验丰富的项目经理。
影响:要是没有合适的项目经理来掌舵,项目很快就会失去控制。
办法:聘请拥有管理资质的项目经理。
冠群公司北美区服务副总裁Matthew Strazza表示,优秀的项目经理要具备过硬的“软”技能,他们要知道如何让会议顺利进行、管理风险以及如何应对不同利益相关者,其中包括关注功能的业务人员、注重系统安全的IT人员,以及担心预算的财务人员。“如果你没有解决好财务问题,没有管理好每周的预算,没有通知客户所发生的任何变化,很快就会遇到麻烦。” Strazza说。
另外他补充说,优秀的项目经理还要具备技术专长,熟悉所部署的任何一项技术。
第3个错误
IT部门没有一套标准且可重复的项目管理流程。
影响:缺乏一套方法会加大项目风险,会忽视与项目相关的任务,最后项目可能不得不推倒重来,以至于项目无法按时按预算完成。
办法:一套管理方法可以有效管理项目,并且让项目的参与者清楚明白地执行项目有关的所有活动。
项目组合管理解决方案提供商Métier的CEO Douglas Clark建议制订可重复的流程,用于确定范围、安排进度、分配资源及与利益相关者之间的沟通。他说:“这些是需要首先掌控的方面,因为它们可能会给你带来的回报。”
第4个错误
IT部门受制于僵硬的程序。
影响:过于僵硬的程序使项目团队缺乏灵活性,而缺乏灵活性让利益相关者觉得沮丧。
办法:保持灵活,并与项目发起人和利益相关者进行沟通。
纽约市咨询公司Intellilink Solutions的总经理Fumi Kondo曾经看到过软件开发人员与项目经理之间的一次交流,“开发人员告诉项目经理,不需要额外工作量,他就可以为应用软件添加额外功能。但项目经理告诉开发人员不要添加,因为用户并没有要求这些功能。如果是我自己,我会去跟用户多沟通,看看这些功能是否有用,只要不影响预算或者进度,提供更多的功能没什么不好。”
第5个错误
没有跟踪项目出现的变化。
影响:项目预算激增,进度一再延迟。
办法:遵循正规的变更请求流程。
Strazza建议,谁要求变更项目范围(比如添加特性或者功能),谁就要在范围变更文档中解释清楚具体的变更,项目经理要确定该请求对预算和进度会有何影响。项目发起人需要在范围变更请求上签字。
第6个错误
缺少项目状况方面的最新数据。
影响:无法衡量,也就无法管理,也就无法调配资源或者应对项目范围变化。
办法:使用相关软件。
从总体上看,当前我国工程项目管理信息系统主要是按照工程项目的规划、设计、施工、运营等几个阶段进行开发的,但大部分软件系统主要应用在施工阶段,包括造价管理软件,管理软件,质量管理软件、文档管理软件、资源管理软件管理软件等,造成项目各阶段的信息和项目各管理流程信息之间无法实现数据交换工共享。 工程项目管理信息化是一个系统工程,日,事,清涉及到项目管理理念、人员素质、管理模式、IT技术、应用等因素,要多方协调和考虑才能将信息技术整合到工程项目管理和业务之中,以提高工程项目管理效率和管理水平。
以上就是关于IT运维管理当前面临了哪些问题全部的内容,包括:IT运维管理当前面临了哪些问题、传统企业IT运维管理中主要存在哪些问题、项目管理常犯的14个错误等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)