gpu大于等于2048核心的服务器

gpu大于等于2048核心的服务器,第1张

物理世界数字化涉及3D建模、数字人制作、数字孪生、AI模型训练、IoT传感器、CAD/GIS、知识图谱、脑机接口、低延时高速通信、区块链NFT等技术。
数字世界物理化需要3D图形渲染、物理仿真、AI训练与推理、科学计算、AR/VR/XR交互、AI人机交互、大规模分布式并行计算、超高清视网膜成像现实技术、生物仿真等技术。
张建中希望,“元计算”能成为赋能下一代互联网的基础算力。
为此,摩尔线程打造了统一系统架构MUSA(MT Unified System Architecture)。
其底层是摩尔线程的全功能GPU,有图形、智能多媒体、AI、物理四大引擎,在此之上有各种编译工具及平台,并支持OpenCL、SYCL、CUDA、Vulkan、DirectX、OpenGL/GLES等主流编程接口,还有针对具体应用的各类行业解决方案。
张建中在接受采访时谈道,设计MUSA架构的目的,是减少软件重复劳动,把不同引擎的核心能力释放出来,MUSA底层提供不同runtime,因此能将业界标准API做好。
据他分享,摩尔线程GPU产品的PPA能够满足各行业的需要,同时软件驱动也对产品性能进步至关重要,没有软件的芯片只是芯片,好的GPU公司都是靠软件驱动业务发展,摩尔线程也不例外,一个软件能适配所有的GPU、 *** 作系统、应用场景。
随后,张建中宣布推出第一代MUSA架构GPU苏堤。
苏堤GPU拥有四大引擎:现代图形渲染引擎、智能多媒体引擎、AI计算加速引擎、科学计算与物理仿真引擎。
(1)现代图形渲染引擎:支持DirectX、Vulkan、OpenGL、OpenGLES等业界标准API,并支持两大游戏引擎,有全局光照、时空抗锯齿、物理渲染、软阴影、反射、体积光等能力。
▲现场演示在1080p画质下玩英雄联盟游戏
(2)智能多媒体引擎:传统编解码引擎只能按照业界规范进行编解码计算,但显示行业变化飞快,现在4K电视已经普及。张建中说,苏堤是第一款支持8K编解码、AV1编解码的GPU,可供视频云、云会议、直播、内容创作、8K游戏应用。
(3)AI计算加速引擎:有一套端到端解决方案,提供支持不同的主流AI框架,并提供视觉、语音、NLP、图形AI、芯片AI等多种AI核心服务。
▲AI计算加速引擎
(4)科学计算与物理仿真引擎Alphacore:能仿真计算机图形中各种不同的运算规律,同时集成在Unity、Houdini、Unreal等不同引擎中。Alphacore可提供多种仿真工具,便于用户进行高精度物理仿真处理。
摩尔线程成立才18个月,能如此快地推出首款产品,张建中认为主要得益于几个因素,首先是人才储备,摩尔线程有一支真刀实q做过全功能GPU的团队,此外,这不仅是摩尔线程的努力,也离不开各方合作伙伴的支持。
在他看来,摩尔线程做产品研发,客户用好是核心,最需注重的不是芯片本身,而是最终客户的应用,因此客户所有需要的性能都要研发出来。
二、首款台式机显卡:2048个MUSA核心,能打英雄联盟
紧接着,张建中宣布推出基于苏堤的首款台式机显卡MTT S60。
MTT S60拥有2048个MUSA核心,单精度浮点计算能力可达6TFLOPS,支持192GPixels/s像素填充率、8GB大显存、4K/8K超高清显示。
据他介绍,这是第一款能打英雄联盟游戏的国产显卡,支持所有主流国产PC *** 作系统。
摩尔线程与国内生态系统合作伙伴打造了新联盟——PES完美体验系统联盟。据悉,该联盟囊括了国内PC界几乎所有合作伙伴,张建中希望利用摩尔线程GPU赋能各行业应用。
摩尔线程与金山办公合作,用MTT S60支持高效办公平台,助力金山办公云边端统一协作。
摩尔线程还与小鱼易连合作,用MTT S60提升多人同时在线会议高清视频的质量。
MTT S60也是首款支持国产工业软件中望3D软件的GPU。
同时,摩尔线程与D5合作,利用MTT S60的渲染能力打造实时3D工作流,带来沉浸式创作体验;与D5集成了Alphacore,还能提供实时仿真效果,模拟物理世界的光影等效果。
MTT S60也被用于助力太极图形,加速物理与图形并行计算,赋能图形开发爱好者,一键调用物理引擎,实现实时物理特效渲染,提升内容制作效率。
摩尔线程还与广联达合作,基于MTT S60打造国内第一款BIM/CIM加速系统,助力三维可视化加速建筑师工作流,以此驱动数字孪生建设。
此外,摩尔线程与超图软件、苍穹数码、中地数码等多家国产地理信息系统(GIS)服务商合作,用MTT S60助力实景三维创新,进行3D实时渲染地理信息,并可借助AI计算引擎加速GIS软件智能化。
三、首款服务器产品:4096个MUSA核心,12TFLOPS
随后,张建中推出基于苏堤的首款服务器产品MTT S2000。
MTT S2000包含4096个MUSA核心,单精度浮点计算达12TFLOPS,支持32GB超大显存,支持PyTorch、TensorFlow、PaddlePaddle、OneFlow等主流AI框架,适配x86和Arm架构CPU,以及兼容各种容器生态、 *** 作,并在云端支持云游戏、云渲染、云计算等多种应用场景。
基于云原生的解决方案,MTT S2000提供能将GPU每个处理核心虚拟化、物理隔离,让数据更安全。它还提供监控管理功能,兼容所有容器 *** 作,支持所有的K8s插件,同时可通过各种管理工具,让开发者更容易使用和分配GPU的各种渲染与计算能力。
摩尔线程宣布与锐捷、深信服、新华三一起推出基于MTT S2000的云桌面解决方案,希望能将Windows 10的应用场景部署在云端。
在云游戏方向,摩尔线程与蔚领时代合作,提供低延时、低功耗、高性价比的云游戏解决方案,实现跨平台高质量安卓云游戏实时体验。
摩尔线程还与声网合作,支持实时互动RTE技术,共同打造窄带高清视频云基础设施平台。
同时,摩尔线程与一流科技合作,与一流科技深度学习框架适配,打造基于MTT S2000的异构分布式计算平台,满足用户对大模型、大数据、大计算的需求。
四、发布四大元计算解决方案,数字人解决方案也来了
为了赋能更多行业客户,张建中宣布推出摩尔线程元计算解决方案,以助力“十四五”数字经济。
面向数字能源,摩尔线程与国家电网合力推进基于摩尔线程GPU的电力行业人工智能、工业元宇宙电力场景应用,通过建设数字孪生平台,帮助监控管理电力系统的各个场景。
面向数字农业,摩尔线程与埃舍尔科技合作,基于摩尔线程GPU底层多功能算力,构建农业基地数字孪生模型,全面实现标准化智慧化管理。
摩尔线程GPU算力支持的数字化示范种植基地可以推出更科学、更高效的种植方式,同时降低生产过程中农资农化的使用。它也可助力通过数字化种植实现品种溯源,保障品种优质优价,科学指导轮作能力。
面向数字城市,摩尔线程全功能GPU提供面向大数据的GPU通用计算、高清视频处理以及GPU建模、3D渲染能力,在时间和空间维度把物理世界的数据快速传递到数字孪生世界,推动政企数字化转型,从而促进经济发展。
摩尔线程MUSA支持云原生渲染引擎,助力光线云打造其第一款云原生的渲染解决方案。摩尔线程还与51World合作,用MUSA支持数字孪生平台。
面向数字生命,摩尔线程GPU多核并行架构可加速软件蛋白质重构过程,助力医学病理和结构生物学的研究。冷冻电镜蛋白质三维重构包含百万级别粒子分类、重投影、模型重构等密集计算环节,摩尔线程与清华大学合作提供密集计算的算力支撑,加速三维蛋白质重构过程。
最后,张建中发布了一款Digitalme数字人端到端解决方案,包含三维重建、语音复刻、实时渲染、智能感知、智能交互等功能,用于解决数字人制作繁琐的流程问题。其数字人生产线覆盖从制造数字人到实现实时智能交互。
摩尔线程的技术专家用这套流程,构建3D面部、克隆音色,做了一个简易的数字人demo。
张建中告诉芯东西,“元计算”涉及的范围广泛,很多用户难以顾及到所有技术层面,对此,摩尔线程在国内建设有专门的团队,为本土客户提供定制化服务支持,助力企业客户解决一些技术难题、迅速提升计算能力,摩尔线程也会与合作伙伴一起来提供企业级服务。
结语:抢滩GPU市场,本土企业混战在即
过去三年间,新型AI计算基础设施建设如火如荼地开展,席卷全球的“元宇宙”概念带飞了数字孪生、3D建模、工业仿真、AI虚拟人、VR/AR、CAD/GIS、人机交互等市场,国内GPU领域亦掀起了一波创业与融资热潮。
作为图形渲染与AI计算最为盛行的芯片,GPU的价值不言而喻。全球GPU龙头英伟达的市值高达近7200亿美元,稳居世界半导体股市值第一。爆炸的数据传输与算力需求,国产替代的庞大市场空间,都令GPU芯片赛道极具吸引力。
一批本土GPU创企正拔地而起,每一家都奔着填补国产高性能GPU空白的目标,要研发出更适配中国本土市场需求的GPU产品,有的侧重加速计算,有的侧重图形渲染。

随着十二代酷睿开启预售,不少玩家估计都已经看到了十二代酷睿处理器的相关评测了吧? 英特尔在卧薪尝胆数年后,终于祭出了全新架构+全新工艺的新一代酷睿处理器,并且采用了新的性能核(P核)+能效核(E核)设计(俗称大小核)。

对于这支全新的“牙膏”,不少I粉是寄予厚望的,而英特尔也没有让我们失望,在公开的测试数据中,十二代酷睿以极为亮眼的表现碾压了目前的锐龙处理器。小雷在测试i5-12600K和i9-12900K的时候,两款处理器强大的性能和功耗比确实让我感到震惊。



无独有偶,国外大神Moore's Law is Dead近期放出了一份爆料,在资料中显示AMD不仅准备了大小核,而且还带来了Zen4D和Zen5,共同合击英特尔的新架构。 其中,AMD的下下一代处理器,也就是Zen5同样打算采用大小核设计,如果资料属实,大小核设计毫无疑问将会是未来的主角。

根据Moore's Law is Dead提供的资料,AMD在发布Zen4的同时(也有可能是之后)还会发布基于Zen4衍生的Zen4D架构。Zen4D将会拥有完全重新设计的缓存系统、精简过的功能特性、更低的频率和功耗,以此来牺牲部分单线程性能换取更好的多核性能。

这是一个看起来很有意思的设计,对于一般的用户来说,牺牲单线程换取多线程的性能意义不大,甚至在 游戏 等对单线程性能要求更高的程序中会导致性能下降。但是,对于需要多线程性能,不太看重单核性能的渲染、计算等工作来说,这颗处理器显然有着自己的优势。


更低的频率和功耗意味着更低的发热量,可以在散热、电源等方面节省不少的成本,对于想要搭建个人工作站、小型服务器的用户来说,这个架构的处理器应该是不错的选择。

在资料文档中,Zen4D也被划归到了EPYC霄龙系列中,基本上可以确定是一款为服务器所准备的一款处理器。Zen4D目前仅有一个型号,命名代号为“Bergamo”,每颗芯片集成了16个核心,采取多芯片设计时最高可以在一颗处理器上集成128个核心。

从核心数量上看,Zen4的核心数量已经达到了目前EPYC最强核心的两倍,在多线程方面的性能表现足以让人期待。如无意外,下一代线程撕裂者的核心也有可能采用Zen4D架构,不知道会不会堆出128核的怪物呢?消费级的128核处理器,对于有需求的用户来说是一个再好不过的消息。

有意思的是,在明年年初即将推出的Zen3+中同样有着一个Zen3D系列,代号为Milan-X,根据Zen4D的特性来猜测,Zen3D应该也是多核性能强化版。 对多核性能有需求的朋友,明年的CES展会结束后应该就可以购买到新的Zen3D处理器了,并且可以直接兼容目前的AM4接口,无需更换主板。

最后的重头戏则是Zen5,在本次文档中虽然只是初步曝光,但是同样足以引起大家的关注,因为在文档中明确说明了Zen5将会采取大小核设计,也就是类似于英特尔十二代。而且,Zen5对比Zen4将会有着相当大的性能提升,跨度可能与Zen到Zen2之间差不多,甚至可能会更大,而且在功耗方面的表现也将会带来惊喜。

根据文档资料来看,Zen5的处理器最高将会集成8个Zen5大核和15个Zen4D小核心,如此看来AMD与英特尔的大小核玩法似乎有些不一样,是采用两个不同架构的核心凑在一起,堆成一颗芯片。

而Zen5和Zen4D均支持双线程,那么也就意味着Zen5的大小核处理器或许所有核心都将支持双线程(英特尔的能效核是单线程设计),如此计算,最高规格的ZEN5处理器将会是24核48线程设计。

但是,让A粉们略微伤心的是,Zen5的产品计划上市时间是2023年的第四季度,我们最快也要在2023年的10月份才能一窥这款产品的身影。当然,如果英特尔的十二代处理器反攻成功,迫于压力,AMD也许会加快Zen5的上市进度也说不定。

英特尔和AMD双双拥抱大小核结构,基本上就宣判了x86处理器的未来将会走向何方,甚至可以断言,未来的消费级市场,大小核处理器或许将占据绝对的地位,至于在服务器市场,x86或许将会以狂堆能效核的方式来与ARM处理器打擂台。

也许会有网友好奇,大小核结构真的这么好吗? 让AMD和英特尔都不约而同的选择了这条路?实际上,与其说是“不约而同”,不如说是“殊途同归”,因为AMD和英特尔都有同一位引路人——Jim Keller。


Jim Keller此前加入AMD,为AMD带来了zen架构,并且规划了接下来的架构开发路线,称其为Zen之父并不为过。更有意思的是,Jim Keller从AMD离职后加入了特斯拉,从特斯拉离职后又加入了英特尔,并且同样是负责新处理器架构的研发工作,所以,从血缘关系上来说英特尔的新架构和Zen或许可以称得上是一对“兄弟”。

而且,Jim Keller此前还负责过苹果A系列处理器的研发,同时也是带领A系列处理器崛起的架构工程师之一。而A系列本身则是ARM处理器中最杰出的存在,并且同样采用大小核设计,在大小核设计上有着丰富经验的Jim Keller,这一次进入到x86领域,为这个领域带来了全新的变化。

另一方面,大小核结构所带来的提升,足以让AMD与英特尔同时放弃全大核架构。 以十二代酷睿处理器为例,在小雷的测试中,i9-12900K的CinebenchR23多线程得分高达27374,单线程得分则是1980,在测试中i9-12900K的主频一直稳定在447GHz上。



听起来似乎不高?实际上,因为目前大多数测试软件尚未完成对英特尔十二代处理器的监测优化,所以往往无法给出性能核及能效核的真正主频。不过,随后小雷通过AIDA64,成功查看到了i9-12900K的真实主频,在CinebenchR23的多线程测试中,性能核主频达到49GHz,能效核的主频则是37GHz。

跑分测试是一方面,更让小雷惊讶的是 游戏 测试,在CinebenchR23后台跑测试的同时打开CS:GO并且开启最高画质,在2K分辨率下FPS仅下降不到10%,从389降低到352,而CinebenchR23的分数仅降低6%。 Windows 11的全新任务分配模式配合大小核的设计,发挥出了意想不到的效果,让PC的多任务处理器能力有了质的提升,这是目前的全大核结构所无法达到的效果。

可见,随着Windows 11的普及,全新的任务分配方式将让大小核设计的处理器在使用中带给用户前所未有的体验,所以基本上可以断定未来的消费级处理器市场就是大小核架构的天下。


AMD与英特尔在周旋了数年后,最终算是成功的将x86架构推进到了下一个世代,在AMD推出锐龙系列处理器之前,可能很少有人能够预见到仅仅过去不到5年的时间,PC处理器的性能就有了如此大的提升。


对于桌面PC来说,大小核显然将会带来更好的多任务运行体验,但是实际上影响最大的也许是移动端,对于移动端的笔记本电脑和平板电脑而言,大小核架构带来的功耗降低性能提升将会让这些设备拥有更出色的续航和性能,并且可以满足更多的使用需求。


说实话,已经有点期待英特尔与AMD的大小核架构处理器同台竞技的时候了。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/12685771.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-27
下一篇 2023-05-27

发表评论

登录后才能评论

评论列表(0条)

保存