耗时18个月,首个国产GPU芯片诞生,创始人曾是英伟达全球副总裁

耗时18个月,首个国产GPU芯片诞生,创始人曾是英伟达全球副总裁,第1张

俗话说,万事开头难。只有成功实现从0到1的巨大突破,才能为以后的演进发展奠定基础,尤其是对于技术封锁和难度最高的国内半导体芯片行业而言,要想实现这一步更难。

3月30日,摩尔线程正式发布MUSA统一系统架构及第一代全能GPU芯片“苏提”,并基于该架构和芯片打造出了面向桌面级PC、工作站的MTT S60图形显卡,和面向数据中心级的GPU显卡MTT S200,是真正意义上的首个国产全功能GPU芯片产品,实现了国内显卡领域的首次破冰。

摩尔MTT S60采用12nm工艺制程,包含2048个MUSA核心,内置现代图形渲染引擎、智能多媒体引擎、AI计算加速引擎、以及科学计算与物理仿真引擎,单精度算力可达6TFlops,搭配8GB LPDDR4X内存。

该显卡支持常见的DirectX、Vulkan、OpenGL、OpenGL ES等图像API接口,满足主流 游戏 、原生Andriod、三维渲染等应用图像性能需求,拥有三个DP1.4接口,支持H.264、H.265(HEVC)、AV1等视频编解码,可输出4K和8K画面,可在Windows系统下畅玩《英雄联盟》等。

创始人曾任NVIDIA中国区总经理,刚离职18个月

为什么摩尔线程会“异军突起”,能够实现首个国产全功能GPU的发布落地?这很显然与该公司的创始人团队有着密切关系。据了解,摩尔线程公司于2020年10月在北京创办,幕后掌舵人是张建中,他之前担任NVIDIA全球副总裁兼中国区总经理,离职后的第二个月便创办了摩尔线程,并在18个月后也就是今天发布了首款国产全功能GPU。

NVIDIA既是全球GPU图形处理器的发明者,也是全球人工智能计算的引领者,不论是在各个行业中还是每个普通消费者眼里,想必对它们家的显卡产品都非常熟悉。所以,作为真刀实q干过GPU研发设计的张建中团队,难怪可以在如此短时间内造出实质性产品。

图形IP源自PowerVR授权,后者曾是苹果A系芯片“御用”

芯片行业中的IP,一般被称为IP核,是指芯片中具有独立功能的电路模块的成熟设计,它可以被应用在包含该电路模块的多个芯片设计项目中,从而减少自主设计工作量,缩短芯片设计周期,提高芯片设计成功率。简单来说,在现代工业化芯片设计体系中,一个复杂芯片是由芯片设计者的自主设计电路和多个外购的IP设计共同组成。

据了解,摩尔全能GPU芯片“苏提”采用的是来自英国Imagination公司的图形IP,即PowerVR渲染方式。不过,该公司在2017年便被中国投资公司以5.5亿英镑全资收购。

PowerVR图形芯片曾被英特尔采用,后来更是成为苹果A系处理器的“御用”GPU架构设计,在经过长达数年的授权合作之后,苹果便一脚踢开IMG,顺利自研GPU,时至今日A系列芯片都拥有移动端最顶级的性能功耗表现。

因此,这也是摩尔“苏提”能够快速设计完成并达到当下市面上主流兼容性能水平的背后原因之一。当然,摩尔线程也只负责GPU的设计和研发,具体产品生产还要交给芯片代工厂来解决,与华为海思相同。

国内半导体芯片行业发展程度远远落后于世界,这几年随着外界封锁和数字革命风暴的加剧,国内正在该领域加大力度努力追赶,也希望可以有更多类似于摩尔线程的公司出现,持续实现芯片行业的突破和创新。

“近几年大火的概念实现都离不开GPU。”

GPU IP巨头Imagination中国战略市场及生态副总时昕博士在一场演讲中曾说道。

那究竟什么是GPU呢?维基百科定义,GPU中文名为图形处理器,是一种在个人电脑、工作站、 游戏 机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。

VR、区块链、3D建模、渲染等一切跟图像有关的处理过程都需要GPU。当下最热门的元宇宙,集以上图像处理需求大成,对GPU的需求也不言而喻。除了图形处理功能,GPU还是目前公认最好的AI加速,尤其是在云端训练大模型应用场景中。更有意思的是,在自动驾驶的赛道上,GPU也杀了进来:全球GPU龙头英伟达正对接越来越多的车企合作订单。

简而言之, 只要有高清画质需求,只要有AI处理需求,就离不开GPU。 因此,随着这两大需求的持续增长和巨大的市场想象空间,全球GPU龙头英伟达凭借GPU芯片的优势,市值就高达7410亿美元(约合人民币47198亿元,截至2021年12月23日),晋升为当下全球市值最高的半导体企业。

GPU芯片研发有多难?

GPU需求大,价值高,反观国内芯片企业在该领域却进度缓慢。目前中国在桌面和移动端领域的GPU供应基本被英伟达、AMD、ARM垄断,国产GPU是个巨大的蓝海市场且鲜有企业涉足。

近年来,在市场和国家战略替代的需求下,国内掀起一股“GPU投资热潮”,涌现了一批国产GPU初创企业。尽管投资热度高涨,国内初创企业多以技术难度更低的通用计算型GPU(GPGPU)切入赛道,能做高性能商业化的渲染GPU产品的企业依旧凤毛麟角。

这么重要的芯片为何鲜有国产企业踏足,GPU难在哪里呢?

芯师爷从不久前举办的“风华1号”发布会上了解到,“风华1号”GPU在多个领域表现上取得了第一,如第一款渲染能力达到5T-10T FLOPS的国产GPU显卡;第一款图形API达到OpenGL4.0以上,并能实际演示4.0 benchmark的GPU;还是第一款支持多路渲染+编解码+AI服务,硬件虚拟化和chiplet可延展的国产GPU等。

芯动 科技 SoC体系架构师何颖提及,单从算力对标的话,采用“风华1号”双芯片的显卡可对标英伟达T4系列产品。换而言之,“风华1号”是一颗“真正”的高端国产GPU芯片,即便是对标全球GPU龙头企业产品也不遑多让。

据芯师爷复盘“风华1号”的研发之路,发现 国内企业做GPU主要有两大难,一是难在专利壁垒;二是难在GPU芯片的体系化创新。

在专利壁垒方面, GPU是先进制程数字芯片,对于GPU企业来说,高技术含量的自有IP的持续演进是技术自主和市场竞争优势的保障。但在该领域起步早的全球GPU巨头们已筑建了层层专利保护墙。以GPU架构IP专利为例,就连全球 科技 领头羊企业苹果,在该领域也绕不开专利授权:苹果从A4到A10X所有处理器芯片都是采用Imagination的IP,到A10之后苹果通过架构授权,有了自己的GPU架构把控,依然是基于Imagination的TBDR架构专利授权,隶属于该架构分支。但一旦架构授权后独立演进了,也就不再被专利卡脖子了。

在GPU芯片设计方面, GPU也绝非简单的芯片设计,其设计较一般芯片更复杂,系统更庞大,涉及面更广。做GPU需要极其专业的团队,团队从前到后要包圆,做到软硬全栈。专业人才要涵盖架构、算法、硬件、软件以及各种验证方式,包括后端、版图、驱动、测试、机械结构、生产、供应链等领域。这意味着,GPU研发团队需要在全链条节点上都配备丰富的量产经验人才,才能完成这样非常商业化的体系。

为何是芯动 科技 突围而出?

芯动 科技 从0-1直接突围高端GPU芯片的研发,这样的成果值得溯源与反思:为什么是芯动 科技 一鸣惊人,突破了国内企业做GPU芯片的困局?

芯师爷了解到,芯动 科技 是中国一站式IP和芯片定制及GPU领军企业,成立至今已15年。15年间芯动 科技 作为幕后英雄,为各国产半导体代工厂和300家全球知名客户提供顶尖IP和芯片定制,协助了包括瑞芯微、君正、微软、AMD、亚马逊等知名公司各种芯片量产,而且所有技术自研可控,能持续迭代,不断超越。逾50亿颗先进SoC芯片成功推向市场的背后,比如大家每天用的轨道交通身份z识别和全球顶级示波器,都有用到芯动 科技 的IP技术 。广泛的合作使得芯动 科技 在To B的圈子非常知名,更值得一提的是,在芯片IP领域,芯动 科技 还是TSMC 2021全球研讨会认可的唯一大陆合作伙伴 ,其技术和量产积累之深厚可见一斑。

正是在为各合作伙伴提供IP和芯片定制期间,芯动 科技 积累了GPU所需要的全套高端IP、图形芯片内核定制技术和先进工艺经验,形成了从工艺到设计,到器件,到量产,到封装,到整机的完整芯片设计验证条流程。这为“风华1号”GPU芯片的研发奠定了稳固的基础。芯动 科技 SoC体系架构师何颖透露,“风华1号”集成了GDDR6/6X、PCIe 4、Chiplet Innolink、HDMI 2.1 、Display port 、VDAC、PLL、TV Sensor、PUF等高端自研IP技术,IP全自主研发,远高于友商。

其中, GDDR6/6X、Chiplet Innolink均为GPU业内顶尖技术。 以GDDR6X技术为例,GDDR6X并非简单的超频技术,为了数据密度更高,它使用了32位并行单端PAM4技术,比业界常见的串口差分PAM4技术,难不止一个数量级,全球除了英伟达,一个公司都做不出来,每个时钟周期可以传输多次数据——数据吞吐量越大,芯片并行计算能力越大,GPU能够同时渲染的像素点越多,画质越清晰。使用GDDR6X技术可满足4K高刷新率画面需求;在提升接口数据传输速率的同时,它实际内核频率甚至可以做到比上一代技术更低一些。

GDDR6X显存技术研发难度极高,目前全球只有英伟达和芯动 科技 两家拥有。 芯动 科技 GDDR6X研发负责人高专表示,GDDR6X的PAM4并行技术是英伟达与美光在一栋楼里共同研发两年才研发出来,而芯动团队是全球唯一一家,仅凭有限的远程技术支持,只用一年时间就做出来了,连AMD目前都还没有做到成功研发该技术。这都是基于芯动 科技 团队十多年的技术基础积累和200次流片打磨的经验。

此外,为了保持技术的领先,芯动 科技 还立足全球和GPU全产业链,持续引入了大量GPU领域顶尖专业人才。

芯动首席算法科学家杨喜乐博士是顶级的架构师,她自从博士毕业之后,曾在英国Imagination公司担任架构师,过去的25年间一直从事GPU核心图形引擎的建模和创新,是全球GPU芯片领域从几何物理渲染到计算引擎领域的知名专家,持有GPU 3D计算机图形学核心领域顶级图形专利共计125项,目前Imagination、苹果等公司最新的核心GPU产品的设计、优化和迭代都离不开她的专利和算法。在芯动 科技 的邀请下,她回国投身国产GPU图形引擎的持续创新。

在芯动 科技 GPU专家团队的努力下,“风华1号”GPU架构目前已在Imagination GPU的架构授权下,自主研发了两代,把原生移动端的架构拓展到了高性能计算、云计算的场景,在架构自主可控上不存在被“卡脖子”风险。

芯动 科技 DX团队负责人章涛也是其从海外招揽的技术大咖。据悉,章涛是来自前AMD的图形框架开发的领军人物。他表示,“投身芯动开发GPU软件感觉非常棒!芯动团队从老板到员工,都在专心做事。”章涛透露,明年芯动 科技 就会发布风华显卡Windows *** 作系统的DX框架。

芯动云计算总裁敖海在“风华1号”发布会上曾这样总结:“‘风华1号’凝聚了芯动 科技 自有的众多技术积累,又有世界著名GPU公司顶尖人才的联合参与的加持,是芯动人努力和成果的结晶,也是芯动 科技 完成‘让风华GPU走进千家万户,让大家习惯用国产的GPU办公和 娱乐 ’使命的开端。风华系列GPU赋能国产生态正加紧奋勇向前,目前芯动 科技 正在加紧与合作伙伴进行‘风华1号’适配调优,在向数据中心和国产桌面GPU 等合作伙伴送样的同时,风华2号和3号已经在路上了。”

写在最后

在半导体供应链面临不确定风险的产业环境下, 芯动 科技 瞄准高速成长的高清画质云渲染和元宇宙需求,推出的“风华1号”正当其时 ,填补了国产4K级桌面显卡和服务器显卡两大空白,为国产新基建5G数据中心、桌面、元宇宙、云 游戏 、云桌面等千亿级产业提供了有力支持,值得国产半导体产业为其喝彩。

同时,我们也该注意到,罗马不是一天建成的,发展中的中国GPU产业和国际巨头之间仍有不小的差距。芯动 科技 选择的是既充满机遇、又充满挑战的GPU市场,未来国产GPU生态的长期发展也需要国产GPU产业链企业的持续支持。

巨大的研发费用和长期资本开支,在已经多年持续盈利的芯动 科技 看来,并非很大挑战。芯动 科技 工程副总毛鸣明认为,硬 科技 要“十年坐得板凳冷”,需要长期打磨,不是像互联网靠砸钱就能成功的,投资人需要非常清楚这一点。 长远来看,国产GPU芯片技术突围最终还是需要靠经年累月的迭代和优化, 通过不断试错,走进应用于千家万户的终端产品供应链中取胜。

芯动 科技 SoC体系架构师何颖也表示:“芯动 科技 是全球6大晶圆代工厂签约支持的技术合作伙伴,有着众多自研IP和强大稳定的团队执行力,在多年的持续奋斗中,芯动 科技 在跨工艺研发和供应链能力上极具优势,令合作客户长期受惠。而国产GPU上下游产业链的长期、持续商用也会成为芯动 科技 GPU芯片发展的强大驱动力。未来,芯动 科技 将根据产业链客户需求,为风华系列GPU产品找到更多可持续落地场景,完成让风华GPU走进大家生活的使命。”

国产众多芯片企业正在加紧对技术的研发和攻克,从小芯片到中央处理器,再到图形处理器,传感器等等一系列的芯片产业都展开了深入布局。

工艺方面也在渐渐向7nm及以下高端制程靠拢。而今又有好消息传来,壁仞 科技 自主研发的7nm工艺GPU芯片成功点亮,实现国产GPU的进一步破冰。

壁仞 科技 点亮的这款GPU是怎样的芯片产品呢?壁仞 科技 此次实现突破对国产半导体有何影响?

GPU图形处理器和CPU中央处理器一样重要,在提供智能手机,PC电脑等终端设备运行时,可以保障相应的数据稳定运行。

我国兆芯,龙芯中科加紧对国产CPU的布局,提高自主研发力度,龙芯中科甚至自研了指令集架构,从基础入手,打造属于国产自主化的生态体系。

而在自主技术的庞大体系中,国产GPU厂商壁仞 科技 成为一匹黑马,成立短短几年就实现了重大突破,在7nm工艺制程范围内实现了GPU芯片的点亮。

根据壁仞 科技 正式官宣,成功点亮了BR100系列GPU芯片。

另外据介绍,这款芯片是国内算力最大的通用GPU芯片。芯片本身运用了壁仞 科技 自主研发的技术,原创芯片架构,还参与了芯粒,7nm制程工艺等诸多领先的技术。

从芯片本身来看,BR100系列已经达到了国际顶级水准,单单是7nm工艺本身,就已经注定了这款芯片的不平凡。可以说是含着金汤匙出身,一举展现壁仞 科技 在自主GPU芯片的原创研发实力。

壁仞 科技 成功点亮7nm GPU芯片,到了这一步,基本上意味着离实现量产也不远了。

一款芯片的研发会经历很多步骤,厂商将芯片设计好了之后会交给芯片制造商生产,通过制造商的初步工艺,完成流片、送样、点亮等步骤,到了点亮这一步,后续的事情就是准备量产推送上市了。

作为通用GPU芯片,意味着可以实现行业各大客户的通用产品需求,一旦产品出货量大涨,将促进营收增长,给壁仞 科技 提供更有力的研发保障。

所以壁仞 科技 实现自主7nm GPU芯片的点亮是有十足意义的。千里之行已经走了一大半,接下来的路一定会更加顺畅。

仔细了解壁仞 科技 之后会发现,这家公司可以说是具备充足的潜力和强劲的人才储备实力。

潜力方面,壁仞 科技 仅成立于2019年,时至今日不过第三个年头,就已经完成了50亿元以上的融资。在国产半导体领域俨然以黑马的姿态,渐渐向发展成独角兽靠拢。

人才储备实力方面,壁仞 科技 接二连三迎来行业大佬入驻,比如去年8月份,壁仞 科技 宣布GPU行业内拥有30年经验的李新荣加入公司,这人是前AMD全球副总裁,加入壁仞 科技 之后将带领团队走向未来。

还有今年2月份,前英伟达上海总经理杨超源也宣布加入壁仞 科技 ,杨超源从业GPU市场已有35年,加入壁仞 科技 担任副总裁兼董事长特别助理。

从这两位人才的履历来看,壁仞 科技 是有深厚团队人才储备实力的。再加上壁仞 科技 已经取得了国产高端GPU BR100系列芯片一次性点亮,进一步证明了壁仞 科技 的实力和潜力。

随着这次壁仞 科技 实现BR100系列芯片的点亮,这一突破对国产半导体产业发展有何影响呢?

最明显的一点就是增强国产GPU的高端竞争力。

我国大部分的消费者用户都在争抢英伟达或者AMD的GPU显卡,因为对方起步早,技术深厚,产品拥有出色的质量表现。而且英伟达已经在准备5nm制程的GPU芯片了,打算交由台积电生产。

如果量产成功,未来这些国外厂商会进一步占据国内高端GPU市场。而壁仞 科技 的BR100系列采用7nm高端工艺制程,是国内算力最大的通用图形处理器。

就这个水准而言,已经可以增强国产GPU的高端竞争力。将来国内的高端GPU市场未必会由英伟达,AMD说了算。当然,实现这一步还需要时间,毕竟壁仞 科技 还是家初创企业,能有这番进步和表现,已经值得鼓励和认可了。

另外就是提高国产GPU芯片的自主化水平,让国内在关键时刻有自己的产品可以作为应对。

自从经历了一次又一次的外部规则措施之后,还有隔壁邻居的遭遇让我们明白自主技术的重要性。壁仞 科技 采用原创技术和架构,除了提高国产GPU芯片的自主化水平,还能在关键时刻派上大用场,以应对外界复杂多变的市场环境。

壁仞 科技 的突破让我们看到国产GPU大有可为,放眼国内众多GPU厂商,有坚持十几年自主研发如一日的景嘉微,也有成立一两年就取得重大突破的摩尔线程。

景嘉微带来的JM9系列让我们看到国产GPU更多的可能性。而摩尔线程在3月30日发布的“苏堤”是公司成立19个月以后带来的产品,这也让我们明白原来国内还有这样的黑马。

以及壁仞 科技 成功实现BR100系列芯片的点亮,为国产GPU产业增添更多的光彩。国产GPU持续破冰,相信不只是现在,未来还能取得更大的进步。

壁仞 科技 成功实现自研7nm图形处理器的点亮,该公司传来如此大的好消息,为国产GPU产业进步再次取得破冰的好成绩。相信在点亮之后,壁仞 科技 会继续努力,朝着量产上市前行,为国产GPU带来更大的突破。

对此,你有什么看法呢?


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/8922128.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-23
下一篇 2023-04-23

发表评论

登录后才能评论

评论列表(0条)

保存