实际上,除了改变芯片产品的架构,把成百上千块芯片用最高效的形式“连”起来,当然也能解决科学家们每秒/百亿亿次的超大计算需求,而收购的Mellanox的用意便在于此。
如果你见过位于无锡的中国超级计算机“太湖之光”,就会发现“这台计算机”其实是一个由成百上千台黑色机柜组成的计算机集群,可以填满一间约1000平米的屋子。
它既可以被称为“高性能计算机群”,也可以被看做是一个不小规模的数据中心。
当然,这些黑色机柜的性能,要比普通服务器强大太多,由4万多块不同种类的国产芯片组成,仅集成它们就是一项极为艰巨的任务,用时两年,总投入超过了18亿人民币。
位于无锡超算中心的太湖之光
而NVIDIA Mellanox 400G InfiniBand的作用,便是将超级计算机中上万块CPU、GPU以及其他种类芯片“连接”在一起。在发挥性能最大化的同时,每块芯片的数据传输效率也不能有太多损耗。
“之前CPU与GPU之间的互联,都是通过英伟达的NVlinks(一种总线及其通信协议),但这个东西互联的效率没有特别好,不能简单扩展到上千块芯片互联的超算场景。”参与研发过TPU,芯英科技联合创始人杨龚轶凡告诉虎嗅,Mellanox擅长的便是此前英伟达最大的短板之一,
“一台超级计算机,各品牌芯片之间的高效配合,极为重要。之前英伟达的NVlinks只能和IBM的CPU互联。而收购Mellanox后,英伟达增强了用芯片构建超算系统的可扩展性,可以让GPU与其他品牌和种类的芯片进行连接。”
换句话说,英伟达找到了“让自己产品轻松插进包括英特尔在内,所有服务器芯片接口”的方法。
超算市场,不可忽视的芯片掘金地
英伟达的这次全系列产品,无一例外面向的都是“烧钱魔窟”——超级计算机市场。
举个例子,在2020年6月颁布的全球超级计算机Top500榜单上,排名第二的美国橡树岭国家实验室超级计算机Summit,在每个节点配备了2个IBM的 Power9 CPU和 6个英伟达的Tesla V100。这样的节点有4356个,总耗资2亿美元。
而在2019年3月,美国能源部阿贡实验室公开宣布,将耗资5亿美元搭建新一代超级计算机 Aurora 。这台将在2021年实现交付的超级计算机,并非追求一味追求计算速度,而是需要针对人工智能等新技术应用采用新的设计思路。
那么这笔巨额政府合同的主要受益者是谁?外界猜测是美国最大的CPU生产商英特尔与著名超算系统集成商Cray。
但不可忽视的是,随着超算系统被用在人工智能研究领域的次数越来越多,额外装载的加速芯片GPU,逐渐成为搭建超级计算机的必选品。
因此,英伟达也在全球许多超算项目中获得了颇为丰厚的收益,包括美国技术最强大的国家实验室——橡树岭实验室、阿贡实验室,都是英伟达最好性能产品的首批尝鲜者。1服务器和超级计算机有什么区别?
服务器是在网络上实时侦听网络请求,并做出回应,以满足客户机对资源和服务的需求。
超级计算机是指由很多的处理器或处理机组成在一起的计算组,用来进行复杂运算的计算机。
2他们的用途是什么?
超级计算机用于复杂的大规模运算,一般是在大型科研项目上。
服务器有以下用途:web服务器,dns服务器,存储服务器,代理服务器,防火墙系统,email系统,ftp服务器。(BT客户端也算是一种服务器)
3和普通PC有什么区别呢?
在信息系统中,服务器主要应用于数据库和Web服务,而PC主要应用于桌面计算和网络终端,设计根本出发点的差异决定了服务器应该具备比PC更可靠的持续运行能力、更强大的存储能力和网络通信能力、更快捷的故障恢复功能和更广阔的扩展空间,同时,对数据相当敏感的应用还要求服务器提供数据备份功能。而PC机在设计上则更加重视人机接口的易用性、图像和3D处理能力及其他多媒体性能。相对于普通PC来说,稳定性、安全性、性能等方面都要求更高,因此在CPU、芯片组、内存、磁盘系统、网络等硬件和普通PC有所不同。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)