华为正式发布最强算力AI芯片升腾910，这款处理器到底有多强？_技术

升腾 910 采用了 7nm+ EUV 工艺，并用上了 Da Vinic 达芬奇架构。华为官方在发布时提到，升腾 910 的运算能力相当于 50 个当前最前的 CPU，它的训练速度也是比目前最强的 AI 芯片还要强 50%-100%。

根据华为官方公布的测试数据，升腾 910 已经达到了设计规格预期。升腾 910 的 FP16 算力达到 256 Tera-FLOPS，INT8 算力达到 512 Tera-OPS。重要的是，升腾 910 达到规格算力所需功耗仅 310W，明显低于设计规格的 350W。

升腾 910 总体技术表现超出预期，已经把升腾 910 用于实际 AI 训练任务。比如，在典型的 ResNet50 网络的训练中，升腾 910 与 MindSpore 配合，与现有主流训练单卡配合 TensorFlow 相比，显示出接近 2 倍的性能提升。

华为鲲鹏指的是华为海思在2019年1月初发布的一款兼容ARM指令集的服务器芯片鲲鹏920。鲲鹏920处理器兼容ARM架构，采用7nm工艺制造，可以支持32/48/64个内核。主频可达2.6GHz，支持8通道DDR4、PCIe 4.0和100G RoCE网络。

鲲鹏920处理器的整型测试性能超过930分，是鲲鹏916的三倍性能。内存通道数量提升到8通道，内存速率提升至2933MHz，带宽提升2.4倍。PCIe 3.0升级到PCIe 4.0，速率翻番， IO总带宽提升1.7倍。集成100G RoCE以太网卡功能bai，网络带宽提升10倍。

鲲鹏920处理器集成了CPU、南桥、网卡、SAS存储控制器等4颗芯片的功能，能够释放出服务器更多槽位，用于扩展更多加速部件功能，大幅提高系统的集成度。

鲲鹏和升腾的区别

鲲鹏和升腾的区别是：华为优化调整设计了其合作伙伴ARM授权提供的技术，在2019年1月7日发布了鲲鹏920以及基于鲲鹏920的泰山服务器、华为云服务。而升腾系列AI芯片采用了华为开创性的统一、可扩展的架构，即“达芬奇架构”，实现了从极致的低功耗到极致的大算力场景的全覆盖。

华为的鲲鹏芯片主要是应用在服务器领域，虽然在服务器领域国内起步比较晚，但是对于未知探究的精神是华为刻在骨子里的，所以说鲲鹏也代表了华为对服务器领域的一种追求和精神。

鲲鹏处理器，是由华为公司基于7nm工艺自主研发设计的，可支持64个内核，主频可达2.6GHz，集成有8通道DDR4以及100G RoCE以太网卡，对标的是英特尔以及AMD处理器。

欢迎分享，转载请注明来源：内存溢出

华为正式发布最强算力AI芯片升腾910，这款处理器到底有多强？