华为的鲲鹏920处理器可应用在哪个领域?

华为的鲲鹏920处理器可应用在哪个领域?,第1张

麒麟:智能终端;升腾:AI;鲲鹏:智能计算。鲲鹏920是华为于2019开年面向智能计算领域推出的基于ARM架构的处理器产品,华为同时还推出了基于鲲鹏920的TaiShan系列服务器产品。
据华为介绍,基于ARM架构授权,华为自研了ARM核,采用7nm制造工艺的鲲鹏920针对数据中心大数据、分布式存储、ARM原生应用等场景,通过优化分支预测算法、提升运算单元数量、改进内存子系统架构等一系列微架构设计,大幅提高了处理器核性能。SPECint Benchmark提供的评分显示,鲲鹏920在典型主频下得分超过930,将性能纪录提升了25%。同时,能效比优于业界标杆30%。
低功耗一直都是ARM的标签,而算力的优势并不明显,不过,华为却认为“ARM可以甩掉处理能力不行”的帽子,因为多种计算架构共存的异构计算,是未来的发展之路。随着ARM技术不断进步,多核性能大幅提高,尤其是开放的生态,ARM也从端和边缘计算走向服务器和数据中心。当下,ARM架构在面向大数据、分布式存储和ARM原生应用等场景,不仅可以为企业构建高性能、低功耗的新计算平台,也是计算发展的必然趋势。

鲲鹏产业源头创新中心的鲲鹏服务器主板具有多核、超大内存带宽、支持PCIe 40和100GE网络等特点。鲲鹏服务器主板内置BMC芯片和BIOS软件,与当下比较就行的内存、硬盘、网卡、 *** 作系统等软硬件均兼容。而且合作的伙伴有我们耳熟能详的清华同方、宝德、百信等企业。所以说,鲲鹏服务器主板及主机是很受欢迎,且性能很强悍的。

数字芯片是半导体行业里市场空间最大,技术壁垒最高的赛道。之前我们分析过的那些尖端设备和材料,主要都是为数字芯片打造的。

目前芯片设计这些赛道里,IGBT和模拟芯片领域都有IDM厂商,但数字芯片很少有做全产业链的,大家专注于自己的环节,分工合作。

这是因为IGBT和模拟芯片虽然技术和资金壁垒也很高,但生命周期长。数字芯片的发展却遵循摩尔定律,不但研发需要大量资金,晶圆代工需要大量资本购买设备,迭代又非常快。

等你把这一代产品全都配置好了,人家下一代产品又出来了,还得接着追,这就是数字芯片最难的地方。

数字芯片的工作原理简单来说就是通过晶体管控制电流的“开”和“关”,来表达数据信息的“1”和“0”,或者逻辑判断的“是”与“非”,所以数字电路也称开关电路或逻辑电路。

其组成主要就是工作在开关状态的晶体管,所以数字芯片的规模大小由其中的晶体管数量决定,摩尔定律说的也是每隔18个月晶体管数量增加一倍,因此晶体管数量对数字芯片性能起决定性作用。

数字芯片包含七种类别,分别是逻辑电路、通用处理器、存储器、单片系统SoC、微控制器MCU、定制电路ASIC和可编程逻辑器件。将来我们会对其中主要类别进行逐个分析。

简单的逻辑电路通常由门电路构成,基本是由与门、或门和非门电路排列组合而成,这些系列的电路也称为组合逻辑电路。

数量庞大的逻辑电路芯片经过不同的排列组合,理论上可以处理非常复杂的控制和运算问题。

但当下的芯片集成度很高,许多自成系统的逻辑电路可以集成在芯片内部,一个芯片就可以实现复杂的功能,也就没人愿意用大量小芯片去实现一个大系统。

所以目前逻辑电路芯片仅用于小型电子产品中,以及在大系统的通用大芯片之间的连接电路上。

通用处理器一般指服务器用和桌面计算用的CPU芯片,也包括GPU、DSP、APU等。

它是规模最大、结构最复杂的一类数字电路芯片,由海量逻辑电路组成,包含了控制、存储、运算、输入输出等完整的数据和信息处理系统,这次我们先分析CPU这一细分领域。

01 什么是CPU

CPU也叫中央处理器,是计算机的运算和控制中心,主要功能是完成计算机指令的执行和数据处理,因此CPU与内部存储器、输入输出设备被认为是计算机三大核心部件。

控制单元是CPU的控制中心,当下达指令时,控制单元负责将存储器中的数据发送至运算单元并将运算后的结果存回存储器中。

运算单元负责执行控制单元的命令,进行算术运算和逻辑运算。

存储单元是CPU中数据暂时存储的位置,其中寄存有待处理或者处理完的数据。寄存器相比内存可以减少CPU访问数据的时间,也可以减少CPU访问内存的次数,有助于提高CPU的工作速度。

按照处理信息的字长,CPU可分为四位微处理器、八位微处理器、十六位微处理器、三十二位微处理器以及六十四位微处理器等,后续还在不断拓展。

CPU作为集成电路的一部分,现在全球集成电路市场受益于5G、可穿戴设备和云服务等应用领域发展,依旧在稳步增长。

中国是全球最大的集成电路市场,增速也是全球最快,2012-2020年九年间集成电路产业市场规模复合增长率达到1681%。

集成电路进出口市场上,我国存在较大逆差,而且逆差还在拉大,国产化替代空间广阔。

CPU的下游市场涵盖服务器、桌面端、移动 PC端、智能手机以及物联网、人工智能、 汽车 电子、智能穿戴等新兴应用领域。

目前桌面端和移动PC端发展平缓,服务器受益于云化趋势增速较快,智能手机受益于5G换机潮迎来一波周期性机会,行业中长期发展还得看那些新兴领域,但新兴领域并不完全是CPU的增量市场,比如新能源 汽车 。

目前全球新能源 汽车 销量持续增长, 汽车 三化(电动化、智能化、共享化)势不可挡,电子成本占总成本的比率逐步提升,发展空间很大,2021年全球 汽车 芯片市场规模预计可达到440亿美元。

按应用场景划分,车用计算芯片可以划分为智能座舱芯片和自动驾驶芯片、车身控制芯片。

由于单纯一个的CPU已经无法满足智能 汽车 的算力要求,将CPU与GPU、FPGA、ASIC等通用或专用芯片异构融合的SoC方案成了各大AI芯片厂商算力竞争的主赛道。

不仅智能 汽车 ,在物联网和人工智能等领域,传统CPU也出现了不能适应市场要求的情况。

随着物联网设备灵活性要求日益提高,芯片向低功耗、高性能方向发展,MCU和SoC脱颖而出。

人工智能常用的AI芯片通常是针对人工智能算法做了特定加速设计的芯片,如GPU、FPGA、ASIC和神经拟态芯片。

虽然深度学习算法上CPU不如AI芯片,但做大规模推理,CPU比较有优势,再加上CPU优势领域的市场空间广阔,应用场景丰富,国内 科技 企业持续研发国产CPU依然势在必行。

目前CPU主要市场份额仍在海外企业手中。随着国内技术进步,国内CPU也在变得更好用,再加上政策持续加码,国产替代确定性较高。

02 CPU芯片架构

芯片架构也叫指令集架构,简单来说就是芯片的执行流程,不同指令集架构的芯片就是执行步骤的不同。

目前CPU指令集架构主要分为复杂指令集(CISC)和精简指令集(RISC)两大类。

复杂指令集支持的指令更多,每种运算都有自己的完整指令。由于只有少部分指令会反复使用,精简指令集就是对其进行精简,不用每种运算都有完整指令。

复杂指令集更适用于运算复杂的电脑CPU,精简指令集更适用于运算要求较低,功耗也较低的手机CPU。

在这两种指令集基础上又产生了不同的架构,也就是在指令集基础上实现对CPU内的控制单元、运算单元、存储单元等部件的一系列完整设计和安排。

03 X86架构

CISC的架构主要就是X86架构,目前Intel和AMD两家独大。

Intel和Windows组成了“Wintel”联盟,击败了苹果、IBM、摩托罗拉的Power联盟,垄断桌面市场长达20多年。直到目前,服务器、桌面和移动PC主要使用的还是X86架构处理器,Intel依然占据大部分市场。

后来随着AMD第二代Epyc处理器“罗马”问世,AMD服务器CPU市占率在短短两年内从1%增长到了8%。接着第三代Epyc处理器“米兰”发布,其服务器市场份额有望达到15%。

由于AMD服务器芯片性价比较高,又有台积电7nm制程技术加成,越来越多数据中心开始采购AMD的产品。

X86架构之所以覆盖范围这么广,除了起步早、性能高、兼容性好之外,还跟它生态完善有关,目前全球65%以上的软件开发商都为X86提供服务,你想自己设计一个架构,没有生态也就没有人使用。

现在X86架构在中国市场依然广阔,尤其是在服务器领域具有绝对优势,几乎占据全部服务器销量。其他非X86架构的服务器占比很小,主要都是ARM架构。

除了Intel和AMD双寡头以外,国内还有兆芯、海光和MPRC几家X86芯片商。目前X86架构的国产化替代还不太明显,兆芯2019年市占率仅01%。

04 ARM架构

RISC的架构有ARM、MIPS、Power PC、Alpha、RISC–V等。

如今超过90%的智能手机采用ARM架构,MIPS在嵌入式设备中应用广泛,而且随着性能提升,技术层面的融合,RISC架构也在不断向X86的应用领域渗透。

ARM架构由于具有成本低、功耗低、体积小、性能高等特点,非常适用移动通讯领域,在智能手机、调制解调器、车载信息设备、可穿戴设备等领域都占据绝对统治地位。

目前ARM架构是非X86架构中应用最广泛,发展最成熟的架构,市占率达到了432%。

ARM完整产品线包括微控制器、微处理器、圆形处理器、实现软件、单元库、嵌入式内存、高速连接产品、外设以及开发工具。

目前国内外主要ARM厂商有ARM、联发科、高通Qualcomm、苹果、三星电子,飞腾、华为鲲鹏、展讯SPREAD TRUM。

世界各大半导体生产商从ARM公司购买其设计的ARM微处理器核,根据各自不同的应用领域,加入适当的外围电路,从而形成自己的ARM微处理器芯片进入市场。

联发科是世界上最大的ARM手机芯片供应商,苹果、三星、高通等行业巨头均在最近几年使用ARM架构,逐步实现基于ARM的全生态链。

截至2021Q1,联发科和高通是最主要的手机CPU供应商,市场份额分别为35%和29%,同比分别增长11%和-2%。

苹果市占率为17%,三星降至9%,华为海思由于受到美国升级制裁的影响,市场份额快速下滑,降至5%。

服务器方面,非X86目前参与者包括华为、飞腾、高通、亚马逊等。

华为鲲鹏服务器是ARM服务器的重要参与者,据华为称,鲲鹏出货量已占据市场50%,未来有望发挥其在移动市场的优势,借力云端协同,抢占服务器市场更多份额。

在桌面PC市场,ARM正逐渐被更多企业应用,2011年微软开始采用ARM的Windows系统,ARM开始进入X86的传统优势领域,如今苹果MacOS、新版Windows等均采用了ARM架构。

此外,ARM在物联网、 汽车 等领域均有很大发展潜质。ARM在公共事业、智慧城市、资产管理等领域均提供了解决方案。

05 MIPS等架构

MIPS、Alpha、Power等架构已经不是市场主流应用,但在特定领域内仍在被使用。

MIPS架构是一种简洁、优化、具有高度扩展性的RISC架构,能够提供最高的每平方毫米性能和当今SoC设计中最低的能耗,已经在移动和嵌入式工业领域销售了近三十年,目前市占率9%。

MIPS多线程CPU已经广泛应用于不同领域,以及许多移动设备的LTE调制解调器中。

国内外主要MIPS芯片商主要有MIPS公司、Ikanos、龙芯中科、北京君正。不过MIPS公司两度易主后,新公司已经转向RISC-V。

龙芯和申威分别获得MIPS及Alpha永久授权发展自主指令集,我国企业成为了该架构应用产品研发和全球生态构建的单一力量,应用的也都是国家非常注重安全的领域。

Power架构在相关市场的占有率也不过1%左右,但在高性能计算领域一直拥有相当重要的地位,其一些技术特性甚至可与Intel一较高下,然而市场参与者基本只有IBM。

06 RISC-V架构

RISC–V是目前业内最被看好,最有机会弯道超车的新架构,具有完全开源、架构简单、易于移植,适用于各种设备、完整工具链, 运行效率高等特点。

这种架构目前接受度逐渐提高,有望成为继X86和ARM架构之后第三大主流指令集架构。

由于RISC-V基金会为非盈利会员制组织,所以RISC-V本身是免费的,自 RISC-V 基金会于 2015 年成立以来,RISC-V 生态系统经历了爆炸式增长,2020年成员增长率达到133%。

物联网的兴起为上游产业链提供新的成长潜力,由于RISC-V具备开源等特性,与物联网更灵活和多样的要求相吻合。

而且自中美贸易战以来,中国企业存在受制于美国不能升级架构的风险,随着RISC-V逐渐被接受,为我国芯片厂商通过RISC-V架构实现独立自主提供可行性。

Semico Research 预测,到 2025 年,市场将消耗 624 亿个 RISC-V CPU 内核,2018-2025 年复合年增长率为 1462%。其中工业领域将以使用超过167亿个内核遥遥领先。

市场研究公司Tractica也预测,RISC- V的IP和软件工具市场在2018年为5200万美元,到2025年时将增长至 11亿美元。

目前RISC-V发展时间较短,尚未一家独大,相关生态还在发展。

短期内ARM架构依然会占据中高端市场,RISC-V主要在一些碎片化的新兴市场展开应用,如物联网的轻终端场景。

这些场景需要低功耗低成本,但是往往程序不用大改、对软件生态的依赖性不高、出货量又很大,符合RISC-V阶段性的发展目标。

RISC-V允许任何厂商设计、制造和销售RISC-V芯片和软件,因此吸引了大批 科技 公司入场。

GreenWaves、IBM、NXP、西部数据、英伟达、高通、三星、谷歌、华为、晶心 科技 、芯源股份、芯来 科技 、阿里平头哥、中天微、Red Hat 与特斯拉等100 多家 科技 公司加入其阵营。

07 国产CPU自主可控程度

国产CPU经历了将近20年的发展,也产生了一批有实力的企业,如前面提到的中科龙芯、天津飞腾、海光信息、上海申威、上海兆芯等。

这其中申威和龙芯自主可控程度最高。上海申威主要从事Alpha架构的研发,它是目前创新可信度最高的国产CPU厂商,基本实现完全自主可控,主供党政办公、军方和超算领域。

其次是飞腾和华为鲲鹏(海思)为代表的ARM架构国产厂商。ARM架构需要有ARM公司授权,主要有三种授权等级:使用层级授权、内核层级授权和架构/指令集层级授权。

其中指令集层级授权等级最高,企业可以对ARM指令集进行改造以实现自行设计处理器,目前海思、飞腾已经获得ARMV8永久授权。

如果他们基于V8授权发展出自己的指令集,其创新可信程度将显著提升,即使未来拿不到V9V10等新架构授权,依然可以维持先进性。

最后是海光和兆芯为代表的X86厂商,仅获得内核层级的授权,未来扩充指令集形成自主可控指令集难度较大。

华为自研处理器已经有很多年了,但是直到鲲鹏920面世才广为人知。鲲鹏920处理器采用ARM指令集架构,自主研发处理器微架构(类似Apple A15处理器和ARM架构的关系)。

包含自研核的处理器——鲲鹏920,其性能可以对标intel高性能服务器(xeon-8180),虽然单核性能还是略低于skylake,但是得益于更优秀的能效比和更多的核心,服务器整机性能比intel对标产品要好。

鲲鹏920的处理器核 是超标量乱序多发射处理器,其发射带宽、执行单元数量、乱序深度这些硬指标都是业界第一梯队的(不得不提依然落后于Apple,但是远超ARM公版)。

参考:鲲鹏开发重点4--ARM 性能优化
参考:华为鲲鹏920与英特尔至强8180对比

鲲鹏920 SoC框图

这里可以简单讲讲 乱序超标量处理器的核心性能衡量方法:

提升(或者说限制)性能的地方有很多,这里只是略微讲讲。(如 发射带宽可能受制于取指带宽、执行带宽、提交带宽;乱序深度受制于寄存器数量、执行队列深度、Cache的MSHR数量等)

对于以上描述一头雾水但是又感兴趣的朋友,可以找找大话处理器或者超标量处理器设计之类的书籍学习学习。

Apple A14 微架构框图

要提升性能首先要选择目标,就是要提升什么程序的性能。可以像DSP一样就是提升某种数据处理场景的性能,但是CPU的性能提升一般选择有代表性的BenchMark,如 GeekBench 和 SPEC2000 这样的测试基准程序。

然后,就是分析这些程序的指令模式,找出处理器的短板,并进行改良。例如,处理器在运行SPEC程序时,发现大部分时间都没法做到每cycle执行6条指令,原因是SPEC程序cache命中率低,处理器等待数据从RAM送过来,所以我们可以加大Cache容量来保存更多的数据以提升性能,或者提高cache利用率(将更有用的数据保存在cache),或者想办法提前把要用的数据搬运到cache中去,等等。

提升性能就是反复的分析现状、找到问题、给出改善方法,如此一步步、一点点提升处理器的性能。这里讲的都很简单笼统,真实情况往往要复杂的多。(此外,提升性能的一个重要方法就是提升频率,这又是另一个故事了)

如上所示的过程中,提升性能需要用到很多工具,其中一个重要工具就是处理器的模型。

因为现实中不可能做到等CPU都生产出来了,再去分析程序行为找出短板,然后再生产一个处理器,然后分析短板。这种代价没有哪个公司能够承受得了。(设计生产一个处理器需要至少一年的时间和至少几亿元的金钱,当然量产之后会摊平这个成本)

于是能够在处理器设计生产之前就进行性能分析改善非常有必要,但是这时候没有产品怎么进行分析呢?于是就做一个处理器的模型,这个模型要能够足够精确的反映最终产品的性能,然后分析程序行为、处理器短板的过程就在这个模型上进行。等到这个模型所反映的性能达到目标了,就按照这个模型来设计处理器,并最终生产出性能达标的产品。

学术界常用的处理器性能模型有Gem5,是开源的,感兴趣的朋友可以找来玩一玩,探索探索现代处理器的性能。
这种模型不光有反映性能的模型,也有反映功耗的,反映成本的,等等。

不过也别忘了:“All models are wrong, but some are useful”

这里从鲲鹏920开始,聊到自研处理器,聊到处理器性能,又聊了聊怎么提升处理器的性能,以及提升性能用到的重要工具。

华为海思和华为鲲鹏区别定位和应用领域不同。
1、定位不同:华为海思是华为公司旗下的半导体公司,主要从事芯片设计和销售工作,华为海思的产品线涉及到移动通信、物联网、智能家居、监控安防、数字电视等多个领域,主要产品包括麒麟系列芯片、芯片组、基带芯片、射频芯片等。
2、应用领域不同:华为鲲鹏则是华为公司自主研发的一款服务器处理器,其主要应用于云计算、大数据、人工智能等领域,性能较海思芯片更强大,华为鲲鹏的推出也标志着华为在服务器处理器领域的进一步发展,并为其云计算和人工智能业务提供了更好的支持。

据我所知,鲲鹏芯片兼容了ARMv8指令集,对于已有的大部分已经支持ARM64的 *** 作系统和软件而言,鲲鹏仍然是一个架构为arm64或者aarch64的芯片。其拥有自主开发的处理器内核,每个核都进行了优化设计⌄所以鲲鹏芯片拥有整形计算能力、集成了64个自研核、集成PCIe40,CCIX等高速接口、集成2个100GRoCE端口等特点。理论上所有可以支持ARMv8指令集的 *** 作系统都可以兼容鲲鹏芯片。并且可应用于泰山2280,泰山5280,泰山X6000等服务器型号。

1、华为鲲鹏和麒麟最大的区别就是使用的设备是不一样的,鲲鹏920是华为正式公布的第二款ARM服务器芯片。

2、2018年12月,华为发布了首颗7nm数据中心CPU——Hi1620,再加上此前发布的升腾910、麒麟980,华为已经有4款7nm芯片。从云端到终端,华为正在进一步巩固算力的闭环。

华为鲲鹏920系列处理器的存储器系统分为四层。鲲鹏920系列处理器基于ARMv8指令集研发的高性能服务器处理器,7nm工艺,最多64核心,支持8通道DDR4内存及PCIe40,集成100Gbe网络,号称是最强ARM服务器芯片,比业界标准性能高出25%。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/12787529.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-28
下一篇 2023-05-28

发表评论

登录后才能评论

评论列表(0条)

保存