IT运维管理当前面临了哪些问题?

IT运维管理当前面临了哪些问题?,第1张

1、首先阐述一下接地的概念:

以接地体为中心,在半径20m之外的范围叫大地的地,在半径20m范围之内为电气的地。接地,就是将电力系统或建筑物中电气装置、设施的某些导电部分,经接地线连接至接地极。机房接地系统应满足人身安全和设备安全正常运行要求。

保护接地系统的五种类型:TT、IT、TN-C、TN-S、TN-C-S,地区不同,供电系统存在差异,机房保护接地也将发生相应的变化。比较常用的保护接地为后三种,机房应采用TN-S系统。

字母含义:第一位字母表示低压系统的对地关系:“T”表示一点直接接地,“I” 表示所有带电部分与地绝缘或一点经阻抗接地。第二位字母表示电气装置的外露导电部分的对地关系:“T”表示外露导电部分对地直接电气连接,与低压系统的任何接地点无关;“N”表示外露导电部分与低压系统的接地点(中性点)直接电气连接。其他位字母“C”表示中性线和保护线是合一的;“S”表示中性线和保护线是分开的。

TT系统从电源中性点直接引出N线,但设备的PE线是各自独立接地的,例如,楼房有单独的接地系统。

IT系统的带电部分与大地间不直接连接(经阻抗接地或不接地),而电气装置的外露导电部分则是接地的。IT系统居民楼不用。

TN-S系统的零线(N)与保护接地(PE)在变电所为一点接地,电源返出后,PE和N是分开的,不再有任何电气连接。PE连接设备金属外壳,正常状态无电流,安全可靠,抗干扰性强。这种保护接地系统在新建筑中应用很普遍。

如果是TN-C系统,零线N与保护接地PE是合一的,即PEN一条线保护,且有电流通过,抗干扰性能较差,因此,可以将TN-C进户端PEN线重复接地后,再把PE和N分开,这样可改变为TN-C-S系统。TN-C-S系统不仅在正常情况下PE无电流,又解决了PEN的弊端。这种保护接地系统在旧建筑中很实用。由于电源引入前一段PEN线路有电流通过,因此,一些电源干扰问题是存在的。

2、再阐明一下电源系统的接地是从哪里引出的:DL/T 621—1997《交流电气装置的接地》中,对TN系统是这样解释的:TN系统,系统有一点直接接地,装置的外露导电部分用保护线与该点连接。按照中性线与保护线的组合情况,TN系统有以下3种型式:

1)TN—S系统。整个系统的中性线与保护线是分开的。

2)TN—C—S系统。系统中有一部分中性线与保护线是合一的。

3)TN—C系统。整个系统的中性线与保护线是合一的。

然后对接地点的引出又做了详细的规定:721 向B类电气装置供电的配电变压器安装在该建筑物外时,低压系统电源接地点的接地电阻应符合下列要求:

a)配电变压器高压侧工作于不接地、消弧线圈接地和高电阻接地系统,当该变压器的保护接地接地装置的接地电阻符合式(8)要求且不超过4Ω时,低压系统电源接地点可与该变压器保护接地共用接地装置。

b)当建筑物内未作总等电位联结,且建筑物距低压系统电源接地点的距离超过50m时,低压电缆和架空线路在引入建筑物处,保护线(PE)或保护中性线(PEN)应重复接地,接地电阻不宜超过10Ω。

c)向低压系统供电的配电变压器的高压侧工作于低电阻接地系统时,低压系统不得与电源配电变压器的保护接地共用接地装置,低压系统电源接地点应在距该配电变压器适当的地点设置专用接地装置,其接地电阻不宜超过4Ω。

722 向B类电气装置供电的配电变压器安装在该建筑物内时,低压系统电源接地点的接地电阻应符合下列要求:

a)配电变压器高压侧工作于不接地、消弧线圈接地和高电阻接地系统,当该变压器保护接地的接地装置的接地电阻符合本标准531要求时,低压系统电源接地点可与该变压器保护接地共用接地装置。

b)配电变压器高压侧工作于低电阻接地系统,当该变压器的保护接地接地装置的接地电阻符合式(5)的要求,且建筑物内采用(含建筑物钢筋的)总等电位联结时,低压系统电源接地点可与该变压器保护接地共用接地装置。

723 低压系统由单独的低压电源供电时,其电源接地点接地装置的接地电阻不宜超过4Ω。

综合以上:也就是说,1、当配电变压器高压侧工作于不接地时(高压侧D型联结组别),不管该配电变压器在建筑物内还是外(在建筑物外时符合一定的要求),低压侧系统的电源接地点可直接从变压器的保护接地点引出(共用接地装置)。但要注意:N和PE只在系统的一点连接,然后始终分开(详细规定如下:当从装置的任何一点起,中性线及保护线由各自的导线提供时,从该点起不应将两导线连接。在分开点,应分别设置保护线及中性线用端子或母线。保护中性线应接至供保护线用的端子或母线)

2、当配电变压器高压测工作于低电阻接地系统时(高压侧Y型联结组别),当该配电变压器在建筑物外时,低压侧系统的电源接地点不可从变压器的保护接地点引出(不得共用接地装置)。低压系统电源接地点应在距该配电变压器适当的地点设置专用接地装置,其接地电阻不宜超过4Ω。

当该配电变压器在建筑物内时,接地电阻符合:R(接地电阻)小于或等于2000/I(I为计算用的流经接地装置的入地短路电流),且建筑物内采用(含建筑物钢筋的)总等电位联结时,低压系统电源接地点可与该变压器保护接地共用接地装置。

3、最后:虽然N线与PE线一般都是从变压器低压侧的中性点引出的,但到低压柜里边后就用支撑绝缘子分开了,而且,所有负载的零线(包括三相设备和单相设备)都是接到N母排上(宽厚一般为三相母排的1/2),所以当零线中流过电流时就是通过N母排流回变压器的中性点的。而所有负载设备的外壳全部接到了PE母排上(宽厚一般和N母排一样或略小于N母排),作为设备外壳的保护接地,一般情况下设备外壳是不带电的,所以也就没有电流的。但是,当发生接地故障时,这根PE线要通过短路电流!

在错综复杂的IT系统架构中,一旦IT系统发生了故障,那么就需要非常多的运维工程师们,通过大量的时间对故障进行逐一排查,每一个细小的问题都有可能带来连锁性的故障,这就有可能解决一个问题需要好几个小时的时间,这就会造成时间上的浪费。对于目前日益增速的业务环境而言,是不能容忍的。而AIOps的出现,就可以针对数据进行实时的异常检测、异常定位、原因分析、容量预测等,可以大大降低现场故障处理时间,如今已经各行各业都开始探索AIOps。你也可以去专业的公司去咨询看看,比如中国应用性能管理(APM)行业领军企业-听云,对于指标异常检测、日志异常检测、智能告警、智能降噪、根因分析方面都有非常大的优势。

现在的企业几乎都是互联网办公,网络一旦出现问题,会对公司业务造成重大损失。而很多公司主业也不是IT,对网络问题不大懂,对于公司的网络问题往往都是请一个运维工程师处理。这些工程师有相应的专业能力,但管理人员的“不懂行”却让运维工作存在很多问题,主要有这五点:

1、缺乏有效的知识积累和共享,造成 *** 作维护效率低下,类似的故障和问题仍然在不断发生,不断解决着,同时一旦某些掌握关键信息和技能的人发生意外状况(如生病,离职等),整个日常维护可能面临严峻的考验。

2、工程师的维护职责不是很清楚,每个人都大概知道自己该做什么,但是某个具体事情到底该谁负责,却没有明细定位。

3、IT网络运维人员大多没有养成记录习惯,每个月汇总报告时,对自己的工作量、所维护系统的整体情况还是一头雾水。而且纸质的故障处理报告信息要素不全,统计和查询都是头痛的问题。

4、运维人员几乎很少能准时下班,处理突发技术故障的事情也时有发生。运维人员往往像“救火队员”一样去处理故障。 在“救火式”的IT管理维护模式下,很难有效地进行服务管理,无法保证IT服务的有效性和一致性,IT管理往往处于无序状态。

5、对于运维工程师的工作绩效缺乏客观考核依据。他们到底做了哪些事情哪些事情还没有做工作完成的时效性怎么样解决问题的质量怎么样这些问题,只能凭印象得出一个个模糊的答案。

如何解决以上问题

如何解决以上提到的问题是目前许多企业用户需要解决的问题,但首要关注的问题应是如何建立专业化分工的IT运维体系。

1、细化用户角色,力求提高运维效率

运维人力分工管理包含人员、岗位、角色等信息,如果这些信息没有统一规划,就无法进行统一配置。网络管理中的角色是根据ITIL标准进行划分的,是把IT运维各种事情(包括人员、资源、突发事故)分成不同级别和不同运维 *** 作,以便有效的配置运维人力资源。因此,对于企业而言,IT运维的专业化分工本质上是对IT运维人力资源配置的优化。例如,明确运维事件分级处理流程,明确运维人员的职责、权限、义务和绩效考核标准。事实上许多实践也证明,明确每种运维事件的专业化分工处理流程,可以大大减少IT运维 *** 作的随意性和混乱性,并能大大提高运维中的人力资源效率。

2、设立IT运维服务台,规范IT流程

在网管软件中,一般提供自助服务和运维服务台,自助服务台的作用是,给用户报故障,评价IT人员解决问题是否负责等。运维服务台是为了确定运维等级和引入优先处理原则。运维服务台主要承担:运行值班、故障监控、接受请求、工单派发及问题解决过程中的监测等工作内容。服务台就像是传统产业生产车间的调度分配员,它会不断的根据事件的等级进行匹配分工和调度。例如发生任何一个突发运维事件时,服务台会先检查并进行分类流转处理。运维人员可分为一线普通维护、二线技术专家和三线厂商专家。一线人员作为第一级问题处理人员,主要解决常规的运维问题;在一线人员不能解决的情况下,二线技术专家将迅速介入问题解决过程;三线技术专家来自产品供应商,由二线技术专家申请三线厂商专家的介入,使问题解决时间能够大大缩短。

3、FAQ和知识库,最大限度节省人力成本

提供FAQ和知识库两种方式,知识库是指对网络运维中的典型故障事件和常见问题解答的自助式处理流程。当出现故障时,用户先在自助式知识库寻找解决方法。如果问题没有得到解决,则用户利用服务台申请维护,用户申请将会移交给相应的负责人,负责人第一时间建立服务档案并一直实时监控,直到问题得到圆满的解决。因此,自助式知识库能帮助运维人员节省大量的时间,从而节省人力成本支出。

最后,专业的事情要用专门的人员来做,还要配合专业的方法。运维工程师是以技术为主的群体,他们往往关注于IT问题本身,主要通过提升自身技术实力来解决问题,不太关注技术之外的事情。这种情况下不可避免的会出现一些问题,这就需要管理人员来解决了。

TT、TN、IT表示电气系统(通常指变压器二次侧中性线)及它所供电的设备的外露导电部分采用的接地方式。

前一个字母表示变压器次侧中性线接地方法:T表示中性点接地,I 表示中性点不接地或不直接接地。

后一个字母表示变压器所供电的设备的外露导电部分采用的接地方式:T表示接地,N表示与中性线相连(TN系统还可以分为TN-C,TN-C-S,TN-S)。

为什么没有IN呢

I N中I表示变压器二次侧中性点不接地或不直接接地,换句话说,中性线(N线)的电位不是地电位,可能比较高哦。而第二个字母N表示用电设备的外露导电部分采用接到中性线(即N线)。

为了安全,通常把用电设备的外露导电部分接地,或接N线,因为N线也接了地(TN系统)。而不会把用电设备的外露导电部分接到一个N线没有接地(不是地电位)的"IN"系统,这样会大大增加触电的危险性。而把用电设备的外露导电部分接地,则就是IT系统。所以如果线没有接错,是不应该有“IN”系统的。

这就是为什么没有IN系统的原因了。

此事发生在时间也很微妙,最近银行间市场资金紧张,一些市民怀疑工行的故障与“钱荒”有关,从而引发各界的解读和联想。一位银行IT工作者在社会化问答网站“知乎”上对此事做了解读,并介绍了银行IT背后的故事。

1现代IT系统非常复杂,当系统大到一定的程度,总会有失控的状况。世界上就从来都没有过没错误的复杂程序,问题只在于这个错误你有没有碰上而已。银行的系统是由很多不同软硬件厂商的产品拼在一起运作,复杂程度远超过普通家用电脑,这么简单的家用电脑还会死机呢而且系统复杂到一定程度,就不是人多或者钱多就能完全解决问题的了。

2要尽量不出问题,要钱,很多钱(比如中型银行建设一个过得去的容灾系统要上亿)。但出问题只是“有可能”,花的钱可是实实在在的。换了你是领导,你也不会无限制的向里面投钱。

3稳定运行的最好的办法之一是不对系统进行改造。由于有新的业务要求,系统确实要不停的升级,每次变动对系统的稳定运行都是一个挑战。

因为三个字:大集中。最早之前,银行系统还没联网,一出问题只是某个区或者某个市。最近十多年银行业都在搞大集中:五大行除了中国银行之外的四家都已经完成了大集中。工行是第一家完成的,当年号称9991大集中工程,好像是1999年开始2002年完成。包括工农建交,国开,农发,浦发,华夏,民生等大部分的银行都是双中心运作,一个北京一个上海(交行好像有个中心在武汉,人行好像在无锡)。中国银行很早就集中成五大中心,至今还没弄成双中心。

大集中有很多业务上的好处,但从系统稳定性影响范围来说,就有点“所有鸡蛋都放在同一个篮子”里面的意味,虽然已经是好多好多好多人花好多好多钱去看好这个篮子了,但百密总有一疏,鸡蛋那么密都能孵得出小鸡呢!

以前没有微博没有微信,只要你不是倒霉的用户就不会知道出过问题。以前没有网银没有淘宝,你半夜不会买东西刷卡。好多年前我在某大行省行做升级,凌晨3点多的时候出了大问题,如果8点前搞不定就全省这银行就停业了,6点多的时候是行长站在后面看着我 *** 作,最后7点多搞定。换成了今天压力估计更大了。

因为四个字:历史原因。银行的IT建设从80年代开始,传统的思路还是集中在单台(有的多一台做成双机热备)服务器上跑程序。互联网的IT建设大部分都从21世纪开始,大多采用的是分布式的思路:由多台计算机同时在跑程序,其中一台出了问题影响也没那么大。

银行程序的特点是要稳定,转变模式的风险很大(有的程序部分用的还是20年前的技术)。所以虽然也在慢慢的转,但起码到今天还没转多少。顺便感叹一下改革之难,赞颂一下邓伯伯。

银行IT是中国IT业中最严谨的行业。比如有的银行还要求厂商维护人员不能 *** 作,只能银行员工 *** 作。

大的变更一定会有预案,甚至换个硬盘,改个IP这种做过几百次的 *** 作都会有预案。但预案与真实一般都有相当差距。上面已经提到系统非常复杂,可能出现的问题如果真全部写下来,可能有几百个分支。而且,系统的故障并不会根据你的应急预案来发生。

应急预案的最重要的作用是应付上级监管,根据应急预案搭好可能需要的应急软硬件环境,大致理清概要思路,以及锻炼团队。真有复杂问题,还是靠牛人现场解决的多。

常见的最简单的衡量连续运行系统的整体指标有RTO和RPO,不严谨的说大致就是停业多久和数据丢多少的指标。

大家可以放心存钱在银行。一般出现问题也只是在停业(某个时间的系统不能运行)这个层面,还没到丢数据或者数据错的层面。就算真出了丢数据的问题,准确的数据一般可以从备份中心或者容灾中心里面捞回来。银行系统每天晚上都要对账,会保证数据准确。

先说定位问题的时间:从发现问题上报到IT信息中心(或者在监控系统发现问题),IT中心的人开始查系统,定位故障原因,如果定位不清还要找相关的软硬件人员到场或者远程网络支持(基于安全原因,银行大部分都不能远程网络查看系统,维护人员到数据中心也需要时间,如果还堵车),找出问题的根源,一小时算超快的了。类似你莫名高烧,到底是哪个器官出问题,去医院做检查做判断总需要时间吧

解决问题就更不好说了,其实和大家的电脑一样,往往重启是最有效的方法,但很多业务系统部分出现问题是不能重启的(可能会影响别的业务系统)。至今国外各大厂商的标准维护合同,绝大部分都没有承诺修复时间。

再说容灾系统,强调一个连很多IT人都不清楚的事实:银行容灾系统不会轻易启用整体切换!前面已经说了,IT系统已经这么复杂了,容灾系统相当于再复制一套,复杂性增加了不止2倍。切换起来是非常麻烦,非常伤筋动骨,惊动非常多人力物力,不是碰到大灾大难(比如地震,机房着火,恐怖分子爆炸之类)不会进行切换。

当然平时会进行容灾切换演练,但一般不会拿核心系统来真实切换,原因是有风险。以前也出现过华东某省级行切换到了容灾中心后切不回生产中心的悲催惨剧。最近西北某地农信社成功的把核心生产切到了容灾系统上,比较不简单,不过这毕竟是独立法人的小银行,大行不是这么个玩法。

另外,看到有不少评论说“没人敢担风险切换到灾备节点上”。

以上就是关于保护接地的TN系统,TT系统,IT系统各有什么特点全部的内容,包括:保护接地的TN系统,TT系统,IT系统各有什么特点、公司的IT系统发生故障了,怎么检测问题、IT运维管理当前面临了哪些问题等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/8804995.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-21
下一篇 2023-04-21

发表评论

登录后才能评论

评论列表(0条)

保存