微软水下数据中心:两年855台服务器故障8台,故障率较低

微软水下数据中心:两年855台服务器故障8台,故障率较低,第1张

随着科学技术的一天天发展,科学家们的想法已经不局限于眼见可见的地方,更多的想要到达研究眼睛不能直接到达的地方,对宇宙的向往如此,把数据中心放入水中也是如此。

两年前微软曾经把一台855台服务器组成的数据中心放入水中,这就是水下的数据中心了。这台水下数据中心除了能研究云计算的能源效率之外,同时还承担了研究纳蒂克项目的命题短期使用的小型数据中心能否商业化。这个研究听起来十分的荒诞且无意义但数据中心的顾问却说出了这个研究的潜力。当数据中心所面临的环境一切顺利时自然是万事大吉,但如果某一天人力不能预测的自然灾害或者不能阻挡的强力袭击来临时,数据中心还有可以转移的方案的话就非常不一样了,这样一来就不必承担重大数据丢失所面临的效应,而且如果这个藏匿的地方是水中的话还能节省了一笔建造费用。

而水下数据中心也不并这两年才有的概念,早在2014年这个概念就被提出了,当然它被提出的时候最终目的是节能还没有这么多深层次的优势被挖掘,地球上97%的部分都是水,大部分人的生活都靠近大一点的水域,如果数据中心存放在水下的话数据也就能更短距离的传播,速率得到提升而且水又可以迅速的吸收服务器排放的热量,而且这个数据中心的电力来源也很简单风能和太阳能就能提供它在水下所需要的能量,仔细想来水下数据中心比起陆上的数据中心还有很多的优势。

数据中心的运转所排放出的热量或许对海洋环境有影响,这是一些人的担心,虽然海洋看起来离我们很遥远,一点点污染没有什么关系,但长期日积月累下来的后果也是难以推测的,微不足道的数据也可能会在某一天产生巨大反应。你对于这个水下的数据中心有什么好奇的吗?

故障率低。
固态闪存盘是IBM服务器的特点之一,即可移动部件少意味着故障率越低,服务器宕机时间就少。
IBM服务器系列是服务器的品牌系列,IBMeServer家族目前总体来说是拥有4条产品线:i系列(iSeries)、p系列(pSeries)、x系列(xSeries)和z系列(zSeries)。

华为服务器cpu年化故障率低于15%。根据查询相关公开信息显示,华为服务器cpu年化故障率相对业界故障率低15%。华为服务器在生产过程中会经历包括设计、测试、生产、物流、应用在内的整个生命周期,而每一台华为服务器在研发阶段都会依托华为公司GCTC进行严苛的测试,改进设计,提升服务器产品的质量和可靠性表现,从而降低客户的故障率和业务时间。

有影响的,规模越大,故障率越高
假设每个模块故障率10%
规模小的,如2个模块,那么故障率就是19% 。(1-0909)
规模如果3个,故障率就是271 。 (1-090909)
依次类推。
超大型的物理机,要求每个模块的故障率要绝对低,尽力到100%无故障。

当前,为推进IT支撑系统集约化建设和运营,进一步发挥集中化能力优势,IT云成为运营商IT支撑系统建设的基础架构。但在IT云资源池部署过程中,服务器技术面临多个新挑战,主要体现在以下3个方面。


在性能方面,人工智能(AI)应用快速扩张,要求IT云采用高性能GPU服务器。AI已在电信业网络覆盖优化、批量投诉定界、异常检测/诊断、业务识别、用户定位等场景规模化应用。AI应用需求的大量出现,要求数据中心部署的服务器具有更好的计算效能、吞吐能力和延迟性能,以传统通用x86服务器为核心的计算平台显得力不从心,GPU服务器因此登上运营商IT建设的历史舞台。


在效率成本方面,IT云部署通用服务器存在弊端,催生定制化整机柜服务器应用需求。在IT云建设过程中,由于业务需求增长快速,IT云资源池扩容压力较大,云资源池中的服务器数量快速递增,上线效率亟需提高。同时,传统通用服务器部署模式周期长、部署密度低的劣势,给数据中心空间、电力、建设成本和高效维护管理都带来了较大的挑战。整机柜服务器成为IT云建设的另一可选方案。


在节能方面,AI等高密度应用场景的快速发展,驱动液冷服务器成为热点。随着AI高密度业务应用的发展,未来数据中心服务器功率将从3kW~5kW向20kW甚至100kW以上规模发展,传统的风冷式服务器制冷系统解决方案已经无法满足制冷需求,液冷服务器成为AI应用场景下的有效解决方案。


GPU服务器技术发展态势及在电信业的应用


GPU服务器技术发展态势


GPU服务器是单指令、多数据处理架构,通过与CPU协同进行工作。从CPU和GPU之间的互联架构进行划分,GPU服务器又可分为基于传统PCIe架构的GPU服务器和基于NVLink架构的GPU服务器两类。GPU服务器具有通用性强、生态系统完善的显著优势,因此牢牢占据了AI基础架构市场的主导地位,国内外主流厂商均推出不同规格的GPU服务器。


GPU服务器在运营商IT云建设中的应用


当前,电信业开始推动GPU服务器在IT云资源池中的应用,省公司现网中已经部署了部分GPU服务器。同时,考虑到GPU成本较高,集团公司层面通过建设统一AI平台,集中化部署一批GPU服务器,形成AI资源优化配置。从技术选型来看,目前运营商IT云资源池采用英伟达、英特尔等厂商相关产品居多。


GPU服务器在IT云应用中取得了良好的效果。在现网部署的GPU服务器中,与训练和推理相关的深度学习应用占主要部分,占比超过70%,支撑的业务包括网络覆盖智能优化、用户智能定位、智能营销、智能稽核等,这些智能应用减少了人工投入成本,提升了工作效率。以智能稽核为例,以往无纸化业务单据的人工稽核平均耗时约48秒/单,而AI稽核平均耗时仅约5秒/单,稽核效率提升达 90%。同时,无纸化业务单据人工稽核成本约15元/单,采用GPU进行AI稽核成本约0048元/单,稽核成本降低达968%。


整机柜服务器发展态势及在电信业的应用


整机柜服务器技术发展态势


整机柜服务器是按照模块化设计思路打造的服务器解决方案,系统架构由机柜、网络、供电、服务器节点、集中散热、集中管理6个子系统组成,是对数据中心服务器设计技术的一次根本性变革。整机柜服务器将供电单元、散热单元池化,通过节约空间来提高部署密度,其部署密度通常可以翻倍。集中供电和散热的设计,使整机柜服务器仅需配置传统机柜式服务器10%的电源数量就可满足供电需要,电源效率可以提升10%以上,且单台服务器的能耗可降低5%。


整机柜服务器在运营商IT云建设中的应用


国内运营商在IT云建设中已经推进了整机柜服务器部署,经过实际应用检验,在如下方面优势明显。


一是工厂预制,交付工时大幅缩短。传统服务器交付效率低,采用整机柜服务器将原来在数据中心现场进行的服务器拆包、上架、布线等工作转移到工厂完成,部署的颗粒度从1台上升到几十台,交付效率大大提升。以一次性交付1500台服务器为例,交付工作量可减少170~210人天,按每天配10人计算,现场交付时间可节省约17~21天。


二是资源池化带来部件数量降低,故障率大幅下降。整机柜服务器通过将供电、制冷等部件资源池化,大幅减少了部件数量,带来故障率的大幅降低。图1比较了32节点整机柜服务器与传统1U、2U服务器机型各自的电源部件数量及在一年内的月度故障率情况。由于32节点整机柜服务器含10个电源部件,而32台1U通用服务器的电源部件为64个,相较而言,整机柜电源部件数减少844%。由于电源部件数量的降低,32节点整机柜服务器相对于32台1U通用服务器的月度故障率也大幅缩减。



三是运维效率提升60%以上。整机柜服务器在工厂预制机柜布线,网络线缆在工厂经过预处理,线缆长度精确匹配,理线简洁,接线方式统一规范,配合运维标签,在运维中可以更方便简洁地对节点实施维护 *** 作,有效降低运维误 *** 作,提升运维效率60%以上,并大幅减少发生故障后的故障恢复时间。


液冷服务器技术发展态势及在电信业的应用


液冷服务器技术发展态势


液冷服务器技术也称为服务器芯片液体冷却技术,采用特种或经特殊处理的液体,直接或近距离间接换热冷却芯片或者IT整体设备,具体包括冷板式冷却、浸没式冷却和喷淋式冷却3种形态。液冷服务器可以针对CPU热岛精确定点冷却,精确控制制冷分配,能真正将高密度部署带到前所未有的更高层级(例如20kW~100kW高密度数据中心),是数据中心节能技术的发展方向之一,3种液冷技术对比如表1所示。




液冷服务器在运营商IT建设中的应用


液冷服务器技术目前在我国仍处于应用初期,产业链尚不完备、设备采购成本偏高、采购渠道少、电子元器件的兼容性低、液冷服务器专用冷却液成本高等问题是液冷服务器尚未大规模推广的重要原因。从液冷服务器在运营商数据中心领域的具体应用案例来看,运营商在IT云资源池规划和建设过程中,通常会对液冷服务器的发展现状、技术成熟度等进行分析论证。


考虑到目前液冷服务器规模化应用尚处于起步阶段,需要3~5年的引入期,因此暂时未在IT云资源池建设中进行大规模落地部署,但在部分地区有小规模应用,如中国移动南方基地数据中心已经开展液冷服务器试点应用,中国联通研究院也在开展边缘数据中心服务器喷淋式液冷系统的开发。未来,随着IT云建设规模、建设密度的继续攀升,以及液冷产业生态体系的逐步成熟,液冷服务器在IT云建设中将有更大的应用空间。


总体来看,运营商IT云资源池建设对服务器计算性能、延迟、吞吐、制冷、定制化、分布式部署等方面都提出了更高要求。未来,GPU服务器、定制化整机柜服务器、液冷服务器等新兴服务器技术将快速迭代,为运营商数据中心服务器技术的发展和演进带来新的思路和路径。

云主机是云计算在基础设施应用上的重要组成部分,位于云计算产业链金字塔底层,产品源自云计算平台。
优缺点还真的不好说,看一下买的时候需要注意些什么吧!因为一般都是基本的数据来支持这个优缺点的说法的。
通用处理能力
(1)CPU运算处理能力,如整数运算和浮点数运算的运算能力等。


(2)内存处理能力,如数据的读、写速度等。


(3)硬盘处理能力,如随机数据读写速度等。


(4)网络传输能力,如流出与流入流量的TCP吞吐量等。


(5)在线可用性,如主机可远程访问时间的比例等。


(6)对d性主机服务,d性(向上扩展、向下扩展)的速度等。

云服务器的优点可以从以下几方面讲:
第一,从技术方面来说,云服务器含有云计算机技术,而云计算技术综合了各种软件和硬件技术。而那些独立的服务器是独立的,不会整合这些技术。


第二,云服务器的安全性能更好。这是因为云服务器具有防攻击和欺骗的功能,它存下的数据永远都不会丢失,所以这也是很多职场人员选择云服务器的理由。而独立服务器的安全性能就比不上云服务器,因为它根本就不具有这方面的功能。


第三,云服务器的可靠性。云服务器是服务器集群而产生的,因此它的故障率很低。而独立服务器的故障率比起云服务器来说就高出了不少。


以上就是云服务器的优点,接下来我们就说说云服务器有哪些缺点。
云服务器缺点:有些客户担心云服务器的安全问题,这是因为他们缺乏对云服务器的控制。用所周知云服务器只是提供借口,所有的客户的数据都会暴露在云服务器公司的面前,相当于没有隐私可言。而有些数据对客户而言非常重要,一点都不然泄露出去,而这些数据是否能保密,这都要看云服务器公司的职业道德和保护能力。

老旧小区在考虑能耗和维修成本的前提下如何降低电梯的故障率
1及时更换老旧故障部件是提高单个电梯工作效率、延长电梯使用寿命的有效手段。
2对故障频发的电梯,要制定特殊的维护方案,增加维护次数,减少临时故障时间。
3另外,对电梯照明、通风系统做到智能控制,在长时间无人情况下能自行关闭照明、通风,减少。

戴尔(Dell)是一家知名的计算机硬件制造商,也是服务器领域的重要参与者之一。戴尔公司生产的服务器质量一般都很高,但是即使最好的产品也难免会出现故障。以下提供一些关于戴尔服务器故障率的信息:
1 根据ITIC 2019-2020全球企业级服务与可靠性调查报告,戴尔PowerEdge R640和R740系列服务器在过去12个月内的平均故障率分别为009%和011%,非常低。
2 根据托管评估服务公司 Cloud Spectator 发布于 2018 年 6 月的数据显示,戴尔 PowerEdge R940 的故障率为每年 01%。
3 其他来源表明,戴尔服务器总体上具有较高的可靠性和良好的持久性。
需要注意的是,这些数据只是参考值,并不能完全代表您所拥有的服务器实际情况。另外,尽管戴尔公司生产的服务器质量很高,但如果没有适当的维护和保养,任何类型的服务器都可能出现故障。因此,请务必定期检查和维护您所拥有的戴尔服务器,并在需要时寻求专业帮助来解决问题。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/12842201.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-28
下一篇 2023-05-28

发表评论

登录后才能评论

评论列表(0条)

保存