我在一个企业从事系统与网络运维已经长达五年,所从事的工作包括公司电脑的选型、入库登记,系统安装,资产发放,全生命周期的故障维护与硬件升级,资产报废鉴定,报废处置;公司局域网的改造与建设,网络设备的采购,安装与配置,机房数百台服务器的管理;各项业务信息系统或网络、安全管理系统的实施与优化;还要配合领导编制一些信息化的制度,做一些管理方面的工作。
有时候初略一想,感觉自己简直是全才,什么都不会,但是仔细想想,又感觉自己像一个职场打杂的,什么事情都会一点,但是什么又都不是非常精通。因此时时感到困惑,不知未来如何发展。
IT工程师
近来我想了很多,其实类似我这种情况的人员应该不少,因为我们企业本身既不是网络公司,也不是软件公司,而是一个制造业的企业。我们的网络实战水平比不过网络公司的网络工程师,更不具备专业的软件公司的软件开发水平。更多的,我们是协调供应商与公司内部业务部门的关系,使得公司采购的信息系统更贴合公司自身的需求,这本身就是一项管理工作,而走上IT运维这条道路的人很多的初衷都是想着走技术路线的,因此让很多人迷茫设置失望。
信息化建设本身是为了提高企业工作效率,从而节约用工成本,对企业不产生任何销售价值,而且信息化建设周期往往不短,在体现效率之前的相当一段时间里面是得不到企业高层的认可的,相反的是受到各层次人员的阻挠,预算不足,配合度不高,也让很多人感到压力。因此胆小一点的IT工作者,会因为压力而放弃对企业信息化建设的追逐,从而开始按部就班的执行传统的或者说是网管式的工作。公司需要电脑、打印机了,就按照固有流程让业务部门提需求,自己选个型号,采购买回来之后就简单的验收和装机,入库登记好就发放;要不然就是每天在电话前等着别人的召唤,哪里以后问题就往哪里跑。然后日复一日,年复一年的成为了一个职场打杂。
那么如何避免成为职场打杂呢?虽然小编我自己也没有跳出这一个坑,但是我仍然愿意把我的想法和各位小伙伴交流。
首先,传统式的IT运维任然要做好,去各个部门帮别人解决问题正是我们结交各色人员的好时机,虽然我们还是一个名不见经传的小职员,但是哪怕公司董事长也有需要我们帮忙的时候,给各路人马留下一个好的印象,对我们以后的发展总归是有好处的。
第二,我们做了好事也不能不留名,我们需要让别人知道我们,我们还需要和雷锋一样把一件件故障事件,服务请求都记录下来,最好是有一个专门记录事件的系统,如果没有,自己拿本子记下来,每个月写总结给领导看,让领导知道我们做了多少事情,让他知道我们是多么的忙碌,同时也让他知道我们又是多么的善于总结。
第三,和所有的供应商打好关系,面对供应商我们属于甲方,甲方对着乙方说话永远都是有优势的,这除了让我们在做一个小职员的同时还享受着一些干部的感受,我们更可以顺着供应商这条线为自己的将来打好基础。我们的供应商掌握着很多资源,技术资源,信息资源,我们可以利用甲方的身份让这些资源为我们自身所用,可以是通过他们来提高自己,也可以通过他们来帮助自己工作。
第四,一定要主动的参与公司信息化建设,只有参与信息化项目建设才能解除更多的供应商,只有参与信息化建设才能出成果,不管是现在流行的智能制造,还是大数据,云计算,数字工厂等,只要做成了,它是企业吹嘘的资本,也是我们的工作成果。更重要的是,只有做项目我们才能真正参与到企业的管理上来,从一个IT技术变成管理工作者,才能升职加薪,在一个制造性的企业做一个并不专业的技术是非常难有出头之日的。或者说,即使你有技术,也很难体现出你的价值。
1、深层次的IT资源监控当IT资源出现故障的时候,我们的第一反应就是快速的定位故障的根本原因以及故障影响哪些业务部门、哪些业务。以前是否出现过类似的问题,是否有成型的解决方案等等。要想能快速的定位故障的根本原因,首先我们就要做到对IT资源深层次的监控。特别是对于一些应用的监控,通过指标来量化资源的健康程度。当资源出现故障时,能快速定位到问题关键性能指标。
2、建立对业务影响范围的判断机制
当资源出现故障的时候,我们需要快速的了解他会对哪些业务部门,哪些业务造成影响。所以我们必须有一种合理规范的机制来判断。并且当同时出现几个故障时,系统能判断服务所影响业务的重要性,以此来判断恢复故障的优先级。另外我们还得有KPI报表,统计服务的可用性。
3、自动关联同类故障
当资源出现故障时,如果能自动关联同类故障,那么将大大的提高我们处理故障的效率,提升IT服务的水平。通过知识提交、审核、发布、查询等功能自动沉淀IT部门日常运维中的工作经验,帮助各级支持人员提高技能水平,简化IT服务任务,同时降低对具体个人的依赖。并且知识库要和FAQ紧密的结合在一起,真正的提升运维的效率。
4、拓展IT服务途径,提升服务质量
建立运维人员与用户之间的联系点,统一受理用户的咨询、服务请求、故障报修、投诉等情况。并且当用户能通过FAQ查询以前出现过得同类故障。这样用户可以自己解决问题,从而降低运维人员的工作量,提升运维效率,提高用户的满意度。
天天客服IT运维基于ITIL的最佳实践经验,为用户提供运维管理流程,并提供了基于ITIL的岗位定义、流程设计工具、表单设计工具、基于ITIL的流程模板和各种元素库,帮助企业在进行IT运维管理工作时,不仅能够有效的、有序的进行事故管理、问题管理、配置管理、变更管理、发布管理,达到服务支持的目的,也能够提供服务级别管理、可用性管理、能力管理,达到服务交付的目的。
运维,更偏向于业务产品的支持,偏向于背后的英雄,运维团队需要为业务的稳定性,成本等方面负责!
企业需要的IT运维体系,本质上也是需要从稳定性、成本的角度来建立。
(1) 稳定性方面
稳定性,是反应服务访问质量差甚至无法访问的指标。业界流行的的稳定性公式是,服务总在线时间/服务总时间,具体指标数据以几个9表示,比如一般的云计算服务提供上,承诺的稳定性指标是3个9:999%(意味着每年宕机时间不超过875小时),而对于大型互联网公司的业务,对于运维的指标则是9999%(全年宕机时间不超过52分钟),甚至99999%(全年宕机时间不超过8分钟)。
稳定性方面,需要什么样的技术体系支撑呢?
监控体系。现在开源软件已经让企业的运维能力大幅提升,如zabbix,nagios等,已经被很多企业广泛使用。同时,随着人工智能的兴起,监控的智能化精细化水平,也在不断提升,比如,传统的监控无非是发现异常了之后报警,但加入智能化之后,则可以自动分析异常的根本原因在哪里,基于此则可以继续做自动的恢复,避免人工成本。
基础技术体系。包括硬件(服务器,网络等), *** 作系统/内核等,也直接影响到业务的稳定性。现在云计算的技术已经非常成熟,服务器与网络方面可以由类似openstack,cloudstack等IaaS平台管理, *** 作系统/OS等则可以通过docker,以及各类PaaS平台进行维护与管理,实现稳定性的保障。
安全体系。随着现在互联网的飞速发展,伴随而来的网络攻击也越来越疯狂,根据普华永道的调查,针对中国公司的网络攻击频率两年内已经提升了两倍,这也使得安全成为互联网架构中必不可少的环节,waf应用防火墙,数据清洗,防cc,ddos攻击等安全体系,也是必备的技术体系之一。
(2) 成本方面
计算成本。即托管企业运行软件所需要的服务器成本。现在云计算厂商提供的IaaS产品也是已经非常成熟,而且价格也在不断地下调,2016年10月,阿里云宣布了大量云产品的降价,一年内就下降十几次,也使得企业的成本控制方便可以越来有利。
人力成本。包括运维人力,研发人力,运维人力的主要投入来自于业务稳定性的保证,比如,服务异常之后的故障恢复,容灾与服务重建等。业务研发中,业务本身的迭代效率与质量,也间接影响了研发的成本。这方面则可以通过PaaS平台的技术手段来解决。
(3) 商业化
商业化是企业运维体系的更上一层。企业IT运维是每个企业必不可缺的环节之一,因此,运维相关的产品也逐渐受到企业的重视。比如应用性能分析厂商(new relic),则是提供了优化服务运维质量的有效方案,监控等产品也是运维最受欢迎的产品之一。
以上就是关于IT运维的前途怎么样全部的内容,包括:IT运维的前途怎么样、如何做好IT运维管理工作、企业究竟需要什么样的IT运维等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)