华为正式发布最强算力AI芯片升腾910,这款处理器到底有多强?

华为正式发布最强算力AI芯片升腾910,这款处理器到底有多强?,第1张

升腾 910 采用了 7nm+ EUV 工艺,并用上了 Da Vinic 达芬奇架构。华为官方在发布时提到,升腾 910 的运算能力相当于 50 个当前最前的 CPU,它的训练速度也是比目前最强的 AI 芯片还要强 50%-100%。

根据华为官方公布的测试数据,升腾 910 已经达到了设计规格预期。升腾 910 的 FP16 算力达到 256 Tera-FLOPS,INT8 算力达到 512 Tera-OPS。重要的是,升腾 910 达到规格算力所需功耗仅 310W,明显低于设计规格的 350W。

升腾 910 总体技术表现超出预期,已经把升腾 910 用于实际 AI 训练任务。比如,在典型的 ResNet50 网络的训练中,升腾 910 与 MindSpore 配合,与现有主流训练单卡配合 TensorFlow 相比,显示出接近 2 倍的性能提升。

华为鲲鹏指的是华为海思在2019年1月初发布的一款兼容ARM指令集的服务器芯片鲲鹏920。鲲鹏920处理器兼容ARM架构,采用7nm工艺制造,可以支持32/48/64个内核。主频可达2.6GHz,支持8通道DDR4、PCIe 4.0和100G RoCE网络。

鲲鹏920处理器的整型测试性能超过930分,是鲲鹏916的三倍性能。内存通道数量提升到8通道,内存速率提升至2933MHz,带宽提升2.4倍。PCIe 3.0升级到PCIe 4.0,速率翻番, IO总带宽提升1.7倍。集成100G RoCE以太网卡功能bai,网络带宽提升10倍。

鲲鹏920处理器集成了CPU、南桥、网卡、SAS存储控制器等4颗芯片的功能,能够释放出服务器更多槽位,用于扩展更多加速部件功能,大幅提高系统的集成度。

鲲鹏和升腾的区别

鲲鹏和升腾的区别是:华为优化调整设计了其合作伙伴ARM授权提供的技术,在2019年1月7日发布了鲲鹏920以及基于鲲鹏920的泰山服务器、华为云服务。而升腾系列AI芯片采用了华为开创性的统一、可扩展的架构,即“达芬奇架构”,实现了从极致的低功耗到极致的大算力场景的全覆盖。

华为的鲲鹏芯片主要是应用在服务器领域,虽然在服务器领域国内起步比较晚,但是对于未知探究的精神是华为刻在骨子里的,所以说鲲鹏也代表了华为对服务器领域的一种追求和精神。

鲲鹏处理器,是由华为公司基于7nm工艺自主研发设计的,可支持64个内核,主频可达2.6GHz,集成有8通道DDR4以及100G RoCE以太网卡,对标的是英特尔以及AMD处理器。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/dianzi/7558361.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-07
下一篇 2023-04-07

发表评论

登录后才能评论

评论列表(0条)

保存