平头哥的首颗AI芯片对于阿里有何影响呢?

平头哥的首颗AI芯片对于阿里有何影响呢?,第1张

我觉得这个芯片对阿里的影响是巨大的,有着非常关键的作用。

9 月 25 日,平头哥拿出了第一款 AI 芯片含光 800。酷爱花式起名的阿里没有错过这个机会——“含光”为上古三大神剑之一,与 2 个月前发布的嵌入式 CPU“玄铁”和 1 个月前发布的系统芯片平台“无剑”遥相呼应,武侠兵器阵营又添一员。

根据张建锋的介绍,在业界标准的 ResNet-50 测试中,含光 800 推理性能达到 78563 IPS,比目前业界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的 33 倍,是“全球最高性能的 AI 推理芯片”。

含光不是今年 9 月进入媒体视野的唯一一款芯片,同月,华为发布了 AI 芯片升腾 910,也号称“全球算力最强”。一个月出现两个“最强”,但并不是一回事。“芯片的概念和互联网一样大。互联网上有多少应用就有多少芯片。很多芯片比青菜还便宜。”张建锋说。

但实际上升腾 910 与含光 800 还是相同性大于相异性。都是 AI 芯片,都部署在云端,只不过前者是“训练”芯片,后者是“推理”芯片,分属深度学习的两个阶段。训练芯片注重绝对的计算能力,而推断芯片更注重单位能耗算力、时延、成本等综合指标。

云计算厂商自主造芯是近两年才有的一个新趋势。这背后是整个行业成本的上涨。本月,华为 Cloud & AI 产品与服务总裁侯金龙称,华为云数据中心的服务器成本占比已超过 60%,未来依靠从外界买服务器提供云很难盈利。

英特尔、英伟达、AMD 等公司长期垄断着云服务器的芯片制造。根据 DRAMeXchange 的数据,目前全球 90% 以上的服务器都在使用英特尔主导的 x86 架构。

在芯片领域阿里巴巴是一个新人。玄铁和含光 800 是平头哥的万里长征第一步,我们还有很长的路要走。”张建锋说。

华为的思路与阿里不太一样。虽然也是不单独卖芯片,但不同于阿里“芯片搭着云卖”的思路,华为的做法是“芯片搭着服务器”卖。

对于阿里与华为来说,自研芯片开发成本高,周期长,先放入自家产品中使用是一个能保证研发成本不会竹篮打水一场空的快捷方式,至少两家云厂自己的需求就能消耗掉大半芯片。另外,华为的模式对于笼络硬件厂商、构建华为生态有长远意义。

这里计算的是整个物理CPU 128核的SPEC int Rate跑分是440,是多套Spec int的基准程序互不相干的情况下的跑分,是用来评估CPU理论上的计算能力。128个核的计算能力,能跑440,在这个指标上来说,是不错的。

倚天710是业界性能最强的ARM服务器芯片,性能超过业界标杆20%,能效比提升50%以上。倚天710采用业界最先进的5nm工艺,单芯片容纳高达600亿晶体管;在芯片架构上,基于最新的ARMv9架构,内含128核CPU,主频最高达到32GHz,能同时兼顾性能和功耗。

在内存和接口方面,集成业界最领先的DDR5、PCIe50等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。

倚天710的研发成功代表着阿里云推进的「一云多芯」策略有迈进了重要的一步,这也是阿里第一颗为云而生的CPU芯片,将在阿里云数据中心部署应用。

未来发展:

除了OS适配外,大量的中间件,应用都是基于原来的X86服务器开发,相应的也需要适配。同时,X86的指令流水跟ARM的指令流水机制不同,比如MySQL在ARM服务器上,会出现指令乱序发射导致的问题,需要MySQL做一些修改。

漫漫生态路,只有等服务器开卖了,才能真正的在服务器上进行生态构建。

一年一度云栖大会,又到了阿里在技术上“秀肌肉”的时刻。
自 2019 年发布首款 RISC-V 玄铁处理器,到去年发布 AI 芯片含光 800,再到今年发布的通用服务器芯片倚天 710,阿里旗下半导体公司平头哥在芯片上实现了“年更”。

在半导体领域被“卡脖子”的当下,阿里在芯片设计上的进展格外引发关注。
顶配?
对比之下,本次最新发布的倚天 710 芯片,是目前参数表现最为亮眼的一个:5nm 制程、单芯片容纳 600 亿晶体管、采用最新的 ARMv9 架构、DDR5 内存带宽、PCIe 50 接口,每一项都是 2020 年才启动的新技术,也是各自技术领域的“顶配”。跑出的 SPECint2017 440 分,也是同类芯片中的最高成绩。
在采用各项新技术的同时,倚天 710 的在面世前各个环节的进展也十分顺利。
阿里云智能总裁、达摩院院长张建锋在接受包括搜狐科技在内的媒体采访时表示,倚天芯片研发进展超过预期,在行业内普遍需要两次流片(像流水线一样通过一系列步骤制造芯片)的情况下,倚天 710 仅在 7 月进行一次流片,就已经基本符合需求。
出色的参数显然拔高了人们对于阿里这款芯片的期待。
从阿里公开披露的信息中,倚天 710“性能较业界标杆高 20%,能效比高 50%”的表述格外值得注意。
一位不愿具名的分析师对搜狐科技表示:“如果对标的是同为 5nm 的芯片,那么 20% 的性能提升是一个非常不错的成绩,但如果对标的是 7nm 芯片,则 20% 只能算是一个正常的提升。”
性能和能效比是衡量一款芯片好坏与否的重要参数。制程、架构、内核数对此都有影响。
张建锋坦承,由于是最新发布的产品,倚天 710 在表现优秀的同时,也必然存在技术红利。有业内人士也表示:“在这些最新的技术尚未成熟时提前布局,是阿里敢于承担风险的表现,且使用新技术也付出了更高的成本。”
不过,需要澄清的是,上述这些看似高超的技术大多是由外部授权提供。
如芯片架构可分为指令集架构和微架构等。通常厂商会对微架构进行调整,以适配产品,并侧面证明自己的研发实力,但此次倚天 710 并未对微架构进行技术改造,而是全盘采用了公版授权。相比之下,华为鲲鹏 920 芯片虽然早 2 年发布,基于的也是旧版的 ARMv82 架构,但却对微架构进行了自行设计。
在自研方面,阿里在对外宣传中着重强调了该芯片对云应用场景的适配。如解决云计算高并发条件下的带宽瓶颈。“倚天 710 针对片上互联进行了特殊优化设计,通过流控算法缓解了系统拥塞问题。”
考验
从实际投产商用的角度来看,倚天 710 也面临着诸多考验。
首先是芯片质量的稳定性。国际调研机构 Wit Display 首席分析师林芝称,由于是首次亮相,这款芯片的良率、稳定性以及可靠性都并没有获得市场的验证,在这个时间点来判断这款芯片的实际表现,为时尚早。
有业内人士也表示,目前的国产服务器芯片,大多表面数据好看,核多,内存通道多,但实际使用体验很差,在外设的兼容性等等方面的指标上和英特尔芯片还不在一个级别。
另外,由于采用了最先进的工艺,倚天 710 在生产制造上也面临难度。
“5nm 芯片在工艺上比较成熟的只有台积电、三星,目前主要生产消费级 5nm 芯片(如手机),能给到阿里服务器芯片的产能十分有限。”林芝表示。
除此之外,由于全部自用,这款芯片所能带来的利润难以量化,也更难证明它的商业价值。
相比之下,同样在大力发展云计算的华为,早在 2019 年就推出了基于 ARM 架构的 7nm 服务器芯片“鲲鹏 920”和服务器“泰山”。2020 年 6 月,泰山服务器先后中标三大运营商的服务器采购项目。
变局
倚天 710 芯片的发布,除了对阿里云业务自身产生影响外,还有可能因为规模效应,给服务器芯片市场带来变局。
有业内人士对搜狐科技评估表示,倚天 710 的研发成本在十几亿元左右,包括架构授权及几千万美元的流片费用,这相当于阿里云在今年上半年利润总额的 2-3 倍。
值得注意的是,经历了长达 12 年发展和投入,阿里云直到今年才开始正式盈利。
巨大的成本付出,对应的是潜在且更大的商业回报。关于这款芯片在未来所能带来的利润回报,张建锋并未给出明确答案。
不过,阿里云目前已经拥有超过 150 万台服务器,具备极强的规模效应,相比于外部采购,自研所能节省的成本相当可观。据了解,倚天 710 芯片将搭载在同期发布的磐久服务器上,并在今年开始部署。
林芝对搜狐科技表示,自研芯片不仅可以为阿里的云计算服务降低成本,从而提供更高的竞争力,甚至有可能会改变服务器芯片市场的竞争格局。
放眼整个整个服务器芯片市场上,X86 芯片占据主导地位,其中英特尔的芯片占据了 90% 以上的市场份额。
“英特尔的一款 10nm 制程的 X86 芯片,主频能达到 34GHz;AMD 7nm 制程的 X86 芯片,主频可以达到 35GHz”,林芝介绍道:“而阿里的这款芯片,尽管是 5nm 工艺,但由于采用了 ARM 架构,主频只有 32GHz。”
这主要是受架构的影响。相比于 X86 架构,采用 ARM 架构的芯片在性能上虽不占优势,但在功耗和价格上都更低,对于用电量和采购量都十分庞大的云计算公司来说,是个不错的选择。
同时,由于可以不完全依赖 X86 架构的服务器,也可以应对潜在的单一供应商风险。
2018 年,亚马逊开启了使用 ARM 架构自研服务器芯片的先河,并在接下来两年内发布两款命名为 Graviton 的服务器芯片。随后华为鲲鹏芯片、Ampere 的 Altra 芯片都采用了 ARM 架构。
随着多家云计算尝试 ARM 架构芯片自研业务,这个拥有 7000-8000 亿规模的市场或许也将迎来新的变化。
溯源
时间回到 2018 年 4 月,阿里巴巴全资收购当时大陆唯一一家自助嵌入式 CPU IP Core 公司中天微系统有限公司,开启了自研芯片之路。
在此之前,阿里巴巴已经先后投资了多家芯片公司,如寒武纪、Barefoot Networks、深鉴、耐能(Kneron)、翱捷科技(ASR)等等。马云也被媒体称为“要买下大半个芯片产业”。
马云表示:“阿里投入数十亿美金研发芯片并不是为了控制技术,而是想让每个年轻人,每家小公司都能以性价比更高的方式分享这项技术。”
关于自研芯片的目的,张建锋表示,主要是为了更适配云服务场景。“原来 CPU 并不完全为了云上负载来设计的,难以完全适配大规模、高并发的的云计算需求。”
不过,对于外界猜测的阿里是否打算涉及更为核心的芯片制造业务,张建锋表示否认。
“产业有分工,像我们服务器最大的提供商是浪潮,交换机最大提供商是锐捷,还有很多大大小小的厂商。他们不仅满足了我们自己的需求,也给产业带来更大的空间。”
目前,平头哥拥有处理器 IP、AI 芯片及通用芯片等产品家族,旗下玄铁系列处理器出货量已达 25 亿颗;两年前问世的阿里第一颗芯片含光 800 已实现规模化应用,通过阿里云服务了搜索推荐、视频直播等行业客户。截至目前,阿里云已经完成了从芯片、部件到整机的云基础设施闭环。

阿里巴巴自研的 CPU有什么特点?在最新公布的一次年度峰会上,阿里巴巴集团董事局主席兼首席执行官张勇表示,自研计算机是阿里巴巴从 PC时代开始就坚持的一项核心技术。在过去三年时间里,阿里巴巴旗下阿里云的基础架构已经经历了从 CPU到 CPU,再到 FPGA、 GPU、 ASIC的多次升级。如今,阿里巴巴已成为全球最大的云计算服务商,也是全球最大的数据中心运营商之一。在云计算领域,阿里云已经有了长足的进步。不仅在中国成为仅次于亚马逊、谷歌和微软这样国际巨头的四大超大规模云服务商之一,在全球范围内也拥有海量用户,并有不断提升计算性能的需求。

在核心硬件上,阿里云将采用通用计算处理器RISC-VR9+和 FPGA组成的RISC-V架构,基于 GPU加速。阿里云还将提供定制化服务,进一步提升整体计算性能,满足大规模云服务的需求。Cortex-A15采用了最先进的 FPGA和 IP技术,支持多路RISC-V指令集和高性能并行处理功能。该处理器支持不同架构下的 FPGA和 GPU加速机制,并对不同设备采用统一指令集和调度策略。同时,为了进一步提升性能,阿里云将在A15处理器上引入并行计算技术。在A15处理器与 GPU之间将加入并行处理通道。

在服务器上,其存储设备由32个 SAN卡组成,每个 SAN卡可以连接至一个内存节点,当存储设备发生故障时, SAN卡会自动跳转到一个虚拟机中,供用户恢复故障数据。为了支持更高规格的 IaaS应用和更低时延的 PaaS应用,阿里云的网关为全互联型 SAN,即一个网关就可以支持数百台不同类型的 IaaS应用。

这次马云立功了!阿里自研芯片迎来突破,在技术上首度超越了华为。

智能化时代已悄然来临,芯片也成为了重要的发展基础,目前所有的领域都需要依赖芯片作为核心驱动力,从事半导体领域技术研发的企业越来越多了,除了老牌的英特尔、三星以及AMD等等巨头,目前市面上也涌现出了一股全新的力量,而其中高通、华为等等就是其中的代表。

华为凭借着尖端的5G技术,正式步入了国际科技巨头的行列,但这也间接挑战到了美国在通讯领域的地位,从而一系列针对华为的举动也随之展开,在经济和技术的双重考验之下,2020年的华为走得尤为艰难。

但好在华为的5G技术都是自主研发的,他们拿华为也是一点辙都没有,最终只能从核心技术层面进行打压,切断了华为芯片的供应链,从而导致华为自研的高端芯片麒麟停产,虽然华为拥有了顶尖的芯片设计能力,但和高通以及苹果一样,在研发芯片的过程中都需要用到美国的EDA设计软件,还有就是英国ARM公司的架构,这样才能完整的设计出芯片。

不仅切断了硬件的供应,美国还试图切断对于华为的软件供应,以求彻底摧毁华为芯片的设计能力,此前闹得沸沸扬扬的英伟达收购ARM公司,就是他们计划的一部分,一旦成功的话,那么他们将实现对于芯片研发设计环节的垄断,这对于全球半导体行业的发展都是极其不利的,好在包括英国在内的多个国家和企业,否决了这样并购计划,虽然两家公司已经达成了交易协议,但没有得到相关授权的话,这场交易是不能完成的。

由于ARM公司的技术是百分百自主研发的,因此不受到美国相关限制的影响,而ARM公司的实际控股人为孙正义,因此此前对于华为的供应不受到任何的影响。难道我们真的只能够“坐以待毙”,等待着这场交易的失败吗?其实并非如此,我们也已经早有了“国产替代计划”。

阿里传来了好消息

在承受了很多负面消息之后,这一次马云立功了,阿里旗下的半导体企业在自研芯片上迎来了好消息,在技术上也首度超越了华为。

就在近日阿里正式官宣,旗下的平头哥半导体在自研芯片上,已经取得了重大了突破,在芯片设计的上游产业链,今后将不再只有ARM架构,从此诞生了另外一种架构RISC-V,目前已经把安卓10系统成功移植到了阿里自研的RISC-V芯片上,并且已经实现了相关代码的开源。

根据平头哥半导体提供的数据显示,玄铁910芯片已经成功运行了安卓10系统,并且已经运行得相当流畅了,这是一款在2019年7月发布的处理器,也是目前首个采用RISC-V架构的处理器,这一次阿里终于在技术上领先了华为一次,对于中国半导体领域来说也是一个好消息,也有望打破欧美国家对于芯片架构的技术封锁。

倪光南的发声

此前倪光南院士就对RISC-V架构进行了发声,他表示“这个架构有望成为世界主流的芯片架构之一,未来将和X86以及ARM平分秋色。”

而之所以这么说也是有一定道理的,在RISC-V架构诞生之后,将进一步降低芯片的设计门槛,开发者可以免费地使用RISC-V架构进行扩展,借助这样的优势,每年中小型企业将省下超过几千万的研发经费,省掉了中间复杂的研发过程,一个团队只需要3-4人就足够了,几个月时间就能设计出适合自己的芯片,可以很好的帮助中小型企业发展。

RISC-V架构的优势

跟ARM架构相比一下,RISC-V目前技术相对成熟,因此具备了代码集小、架构简单、拓展性强、支持模块化等等优势,优越的性能可以帮助其很好的适配各类智能设备以及各个领域的需求。

面对即将来临的物联网时代,同样具备很大的优势,物联网碎片化比较严重,而RISC-V刚好具备很好的灵活性,而且在成本上也相对较低,可以同步不同的用户以及不同的设备,通过增加指令集的方式达到目的。

RISC-V架构在很多的专家眼里,就好比是目前的鸿蒙系统,总是能给人带来一种出其不意的惊喜,在相关技术成熟之后,肯定可以打破X86以及ARM架构对于市场的长期垄断,希望阿里可以借助这一次,重新在众人心里留下高科技公司的影子。

对此你们有什么看法呢?欢迎在评论区留言讨论。

阿里研发的芯片却是有基础的,阿里收购了中天微。

芯片组的技术这几年来也是突飞猛进,从ISA、PCI到AGP,从ATA到SATA,Ultra DMA技术,双通道内存技术,高速前端总线等等 ,每一次新技术的进步都带来电脑性能的提高。2004年,芯片组技术又有重大变革,最引人注目的就是PCI Express总线技术。

它将取代PCI和AGP,极大的提高设备带宽,从而带来一场电脑技术的革命。另一方面,芯片组技术也在向着高整合性方向发展,例如AMD Athlon 64 CPU内部已经整合了内存控制器,这大大降低了芯片组厂家设计产品的难度。

而且的芯片组产品已经整合了音频,网络,SATA,RAID等功能,大大降低了用户的成本。对于不同的芯片组,在性能上的表现也存在差距。

除了最通用的南北桥结构外,芯片组正向更高级的加速集线架构发展,Intel的8xx系列芯片组就是这类芯片组的代表,它将一些子系统如IDE接口、音效、MODEM和USB直接接入主芯片,能够提供比PCI总线宽一倍的带宽,达到了266MB/s。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/13216927.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-06-21
下一篇 2023-06-21

发表评论

登录后才能评论

评论列表(0条)

保存