半导体系列(三):芯片设计篇之CPU研究,国产CPU到底行不行

半导体系列(三):芯片设计篇之CPU研究,国产CPU到底行不行,第1张

CPU又称中央处理器,作为计算机系统的运算和控制核心,是半导体产业技术最密集、最具战略价值的产品,是一个国家技术势力的象征。

目前CPU的市场基本被美国的两大公司垄断,分别是大哥Intel和小弟AMD,两家几乎占领了99%的市场份额。

目前Intel和AMD以X86指令集和微软共同建立了庞大的生态系统并且不对外开放,这样一来,中国队想要自己做CPU的空间不多了。

01 CPU定义

CPU在半导体行业中是人们常接触到的一种芯片,最常见的应用就是在电脑中,其中有名的有Intel的 i9-11980HK 和AMD的 R7-5800X

按照CPU种类来分类,可以分为服务器CPU、家用电脑CPU、嵌入式设备CPU和手机CPU,服务器CPU需要更出色的性能、稳定性和安全性,要求服务器365天开机运行,连续工作,一个服务器可以安装多个CPU;而家用电脑CPU性能要求相对较低,容量较小,不要求连续工作,一个电脑只能安装一个CPU;嵌入式设备和手机对CPU的性能要求相对更低。

按照CPU指令集架构来分类,CPU可以分为RISC和CISC。

CISC 即复杂指令系统计算机,物如其名,CISC是比较复杂的,指令系统比较丰富,有特定的指令来完成对应的功能,可以处理特殊任务。

RISC及精简指令集计算机,把精力集中在经常使用的指令上,对不常用的功能,通过组合指令来完成,实现简单高效的特点,一次RISC不能处理特殊任务。通俗来说就是经常用的功能简单化,不经常用的功能复杂化。

这其中CISC代表的指令集有X86,RISC代表的指令集有ARM、MIPS、RISC-V、Alpha、SPARS,除了这两种之外,还有我国自主研发的指令集DEC和LoongArch。

02 六大国产CPU

首先我们来了解一下什么是CPU的生态环境, CPU的生态环境就是一块CPU推出后,系统和软件对它的支持和优化有多少, 比如国产CPU龙芯就没有一个好的生态,不论是采用MIPS还是自主研发的LoongArch都不能支持Windows系统。

自主建立生态环境又难于上青天,而生态如果没有建立,软件商店就不会有软件(比如QQ在Linux中停更),这也是国产CPU发展最大的瓶颈之一。

目前国内有六大CPU设计厂商,他们是华为、飞腾、兆芯、申威、龙芯、海光(均未上市),他们分别以不同的方式参与CPU的设计。

CPU国产替代的故事得从Intel开始。

Intel趁着PC的东风迅速发展,建立了X86架构,标识了一套通用计算机指令集合,并且与微软一起在X86指令集上建立了庞大的生态。

目前的X86指令集不对外授权,只被英特尔和AMD所掌握,而X86又是PC、服务器领域做得最好的,别的指令集的生态环境远远抵不过X86,留给中国队的发展空间实属有限。

中国队CPU分为3个路线。

其一是由 龙芯 和 申威 代表的:自研指令集

龙芯最初采用的是MIPS精简指令集,制作通用CPU,主要产品是自主可控消费类例如服务器、台式机、嵌入式、航天器等领域。

申威最初采用的是Alpha精简指令集,主要应用在超级计算机和军事领域。

龙芯和申威都因为生态的原因,很难发展起来,尤其是龙芯,想要打入服务器和台式机市场必须有很好的生态。

龙芯因为MIPS的分崩离析,开始发展自己的指令集—— LoongArch ,它是完全有龙芯自主研发,可以兼容MIPS生态, 并且开始尝试用二进制翻译兼容ARM、X86处理器,龙芯的目标是在2025年消除指令集之间的壁垒,彻底搞定兼容问题。

申威也因为Alpha被收购,开始发展自主研发的指令集—— SW64 ,它是由Alpha改进而来,申威制作的神威·太湖之光超级计算机便采用SW64指令集,被称为“国之重器”,在国际上都有一定的地位,多项指标全球第一。

第二路线是由 华为 和 飞腾 代表的:ARM指令集授权

华为芯片“四大天王”麒麟、鲲鹏、巴龙、升腾中,除了巴龙以外,均采用ARM指令集授权来开发。这其中最著名的就是“麒麟”了,在手机领域一度领先,直至海外因畏惧华为的崛起,开始了制裁华为事件,就此“麒麟”短暂隐身。

飞腾也是国内目前使用ARM架构制作CPU的厂商之一,其技术不弱于高通,目前公司也被美国列入黑名单,其芯片制造环节同样被卡脖子,可能成为第二个华为。

除了华为和飞腾以外,国内以ARM架构制作芯片的厂商还有很多,例如贵州华芯通、展讯通信等。

第三路线是由 兆芯 和 海光 代表的:合资获取X86授权

兆芯的X86架构授权是源自于VIA公司将部分X86处理器相关技术、资料等IP产权以1.18亿美元价格卖给兆芯。兆芯基于X86的生态和技术,性能方面普遍高于龙芯,但还是不能和英特尔比肩。

海光的X86架构授权是通过和AMD合资公司来拥有AMD授权IP,但并不是完整的技术转让,而是阉割后的残缺版,所以性能上面和AMD锐龙、高通骁龙差一个档次。

03 RISC-V

RISC-V近些年流行的新型指令集,它是一种开源式指令集,对使用者免费开放,也是这种特性使它被众多专家认为是中国处理器产业的一次机会,而且可能是最后一次机会。

目前全球CPU的市场格局是以X86架构垄断PC、服务器行业;ARM架构垄断移动设备行业,这两家几乎涵盖了所有CPU市场需求。

X86架构归“Wintel”(英特尔+微软)所属,是一种封闭指令集,不对外授权, 简单说就是谁也别想用,就我自己能用 ;ARM架构属于可授权指令集+可授权设计, 简单说就是你用需要经过我同意并且收费,你想再它基础上设计还得再经过我同意并且再收费。

正因为如此,RISC-V作为开放式指令集,被中国队大力支持,看作救命稻草。

那RISC-V究竟有没有那么好呢?我们主要得看两方面: 一个是它的生态好不好,生态是决定指令集发展空间的最大因素;另一个就是它到底是不是彻头彻尾的免费,日后会不会再被卡脖子。

第一,RISC-V的生态怎么样。

RISC-V具有性能高、功率低、面积小、易于扩展等技术特点,最重要的是它的开源、免费的独特属性,为其带来众多合作商,影响力逐步扩大。

从2015年组织RISC-V基金会成立是的25个成员,到现在已经有超过300多个单位的加入,其中包括阿里、谷歌、华为、英伟达、高通、中科院、麻省理工等等。

日前,有知情人士表明,英特尔将以20亿美元收购RISC-V领域的重量级公司SiFive,这也表明了英特尔的态度。

虽然英特尔靠X86架构在PC、服务器领域无人能敌,但是移动设备一直是他的心病,ARM在移动设备领域是他无法抗衡的,而RISC-V的出现,给了机会。

但是看好归看好,ARM的垄断地位依旧很难撼动,RISC-V后续可能与X86联手对抗ARM,但更大的可能是打入嵌入式设备市场中,做物联网领域的“一哥”。

总体来说,不论是PC、服务器,还是移动设备,都很难被RISC-V介入,相反一些嵌入式设备比如空调、冰箱、扫地机器人、电动车等等发展环境更好。

第二,RISC-V是否永远免费。

RISC-V源于2010年,加州大学伯克利分校的一个研究团队研发,当时他们因为市场已存在的指令集相当复杂,且成本和门槛太高,所以建立了新的指令集。

“开源架构RISC-V将永久免费,成为人类共有财产。相较于X86和ARM架构的高门槛,开源架构RISC-V将带来芯片设计的革命”——RISC-V架构开发者之一Krste Asanovic博士。

这是RISC-V架构开发者的原话,表明该指令集是完全开源免费的,到目前为止他们也很好的履行了,甚至把基金会总部搬离美国,迁移至瑞士(永久中立国)以防止美国地方政策的限制。

尽管RISC-V从表现来看做得很优秀,但抽丝剥茧,终究还是有隐患在的。

实现RISC-V指令级架构的处理器内核有很多个不同的微架构实现,而微架构实际的模式是分不同类型的,其中有开放的、需授权的以及封闭的。

虽然基于RISC-V开发CPU不需要支付授权费用,但如果直接用RISC-V内核设计,也是需要支付授权费的。通俗来说就是你用我不需要收费,但是想在它的基础上设计得经过我同意,甚至收费(我们目前是全免费,但我有权利在以后收些钱)。

总结来说,目前全球的指令集呈现以X86、ARM、RISC-V三足鼎立的局势,RISC-V作为新时代的弄潮儿得到了各大厂商的认可,有发展的空间,但它不足以撼动其他两个指令集的地位,不过可以预料到的是,等RISC-V成长起来,仍然有可能对我国CPU发展卡脖子,我们需要保持隐患意识,在跟随洋人步伐的同时,发展自身CPU业务。

纵观国内厂商在电脑CPU领域,龙芯以自研为主,开发属于中国的指令集,目前已经可以满足一些党政领域以及机密工作的需求,但打入家用电脑领域仍需要提升CPU的生态和性能;服务器CPU中,申威在超算上小有成绩;华为近期也有消息称完成40nm去美化工作线投产,在明年更将攻破20nm的工作线,麒麟可能会重新归来;一些未上市公司如芯来 科技 、平头哥等也有在尝试RISC-V领域。

种种迹象都在证明,虽然我们起步慢了30年之久,但国产CPU一直在突破,路途艰辛却一路披荆斩,长夜漫漫,但黎明终将到来。

全文由各种资料查证,如有专业领域上的错误,希望可以抛砖引玉,有所探讨。

芯片全产业链图(绿底已经写完)

今天在后台回复『硬核干货』,主编送你一个 财经 知识锦囊。

(特别说明:文章中的数据和资料来自于公司财报、券商研报、行业报告、企业官网、百度百科等公开资料,本报告力求内容、观点客观公正,但不保证其准确性、完整性、及时性等。文章中的信息或观点不构成任何投资建议,投资人须对任何自主决定的投资行为负责,本人不对因使用本文内容所引发的直接或间接损失负任何责任。)

如果你对2004年英特尔总裁贝瑞特当年当着6500人惊天一跪还记忆犹新的话,或许能更能理解这个问题,当年老贝这一跪是对“惟主频论”失误的真心忏悔。当时NetBurst架构的Prescott(Pentium 4的核心),虽然已经是用了最先进的90nm工艺,但是3GHz主频的CPU功耗就超过百瓦,如果频率要超过4GHz,功耗将是何其了得。所以,在这儿就可以回答题主, 正是因为功耗(散热)制约了主频的提升 。 登纳德缩放定律的终结 相信你也听过摩尔定律,它告诉我们,芯片中晶体管的尺寸正在不断减小,因此芯片的晶体管数量可以不断增加。虽然近些年,摩尔定律一直在修改,但它似乎尚未完全停止。 事实上,除了摩尔定律,还有一个很重要的定律,称登纳德缩放定律(Dennard Scaling),大体说,随着晶体管尺寸的减小,它的功耗也按面积大致按比例下降。摩尔定律和登纳德缩放定律这两个好基友放在一起,就是要告诉我们,可以不断缩小晶体管尺寸,并且在CPU中容纳更多晶体管,而功耗基本不变。 但是,到了Pentium 4,基本上宣告了登纳德缩放定律的终结,因为Pentium 4的性能只有486的6倍,但功耗却是后者的23倍(6^1.75)! 好吧,看看上面的图,随着晶体管的面积密度上升(蓝色线)16倍,功耗仅下降约4倍(紫色线),功耗降低已经不再与芯片面积密度上升成正比,Dennard Scaling is dead. 也就是说,继续以提升频率来提升性能的方法已经行不通了! 多核也能刷性能 到底CPU的性能是怎么定义的?英特尔是这么说的: 其中f为频率,提升f就能提升CPU性能,不过这条路已经不通了。 但是,我们还可以提升IPC呀,IPC(instruction per clock)是每时钟周期内所执行的指令数,所以才有了多核,2个核心,IPC就是原来的2倍,4个核心,IPC就翻了4倍,CPU的性能也就得到提升。所以我们消费级的CPU才从2核变成了4核,再到8核,现在已经升到了16核。反正呢,现在摩尔定律还能苟延残喘,但Dennard Scaling已是过去式,虽然工艺越来越先进,CPU里可以装进更多的晶体管,但由于功耗墙的原因,已经没办法提高单个内核的频率,解决方法是在芯片上保留更多内核以提高CPU性能。当然并非所有程序都可以支持多核,因此这种潜在的性能增益并不总是能够得以呈现,但肯定是越来越好了。 发动机的转速再高,对速度的提升,也比不上气缸多来的直接! V12 发动机不会搞9000转,8000进红线。一个喇叭尺寸再大,音量再高,看电影的时候,也不可能比7.2声道效果好。 目前限制CPU的不是技术工艺,而是散热,Intel的CPU可以轻松6-7Ghz,前提是你得液氮散热,考虑到目前大多数风冷散热现实,限制主频2-4之间,也是对市场妥协。如果将来某一天,普及微型液氮散热器,说不定多核就没那么重要了欢迎你的阅读 首先,要说的是现在手机也不是不提高主频了,只是提高的速度比以前更慢了。欢迎关注作者,一起聊 科技 、数码。 不要光用频率衡量CPU的单核性能。举个例子,里程碑1代的555Mhz主频的德仪CPU,可以把HTC G7上面那颗1Ghz CPU从上到下秒一个遍。CPU单核心性能,可以用车辆的轮子计算。频率只是转速,代表转多块。影响的另外一个因素是单核能效,对应的是轮子的直径。轮子的直径大,并不需要转多快也能维持高度。但是直径小的,必须提高转速才能达到一样的速度,带来的结果就是功耗和发热的提高。 不要看核心频率来定量CPU性能,要看核心架构在看频率,一般同一架构频率越高性能越好,像3.2gHz的八核推土机性能还不如四核八线程的酷睿i5性能好。四核四线程奔腾N4200还没有双核四线程M5性能好。目前CPU领域性能最好的是酷睿了,像主机CPU美洲豹架构只能和打桩机差不多,和酷睿i差远了,有人推测八核美洲豹性能居然只有比双核酷睿i5好一点。 一个CPU中含有数十亿个晶体管,比如英特尔的主流CPU拥有20亿个晶体管,在某些高端产品中晶体管数量高达60亿个。晶体管在做模拟信号的相互转换时会根据CPU主频的高低产生动态功耗,因而CPU的主频越高,发热量就越大。当然芯片的制造工艺一直是在不断发展,根据摩尔定律,集成电路上可容纳的元器件的数目,约每隔一年半会增加一倍,性能也将提升一倍。 2000年的奔腾4处理器,制作工艺是180nm; 2010年的酷睿i7-980X,制作工艺32nm; 2013年的酷睿i7 4960X,制作工艺是22nm; 现如今酷睿i7 9700k的制造工艺更是达到了10nm级别。晶体管做得越小,导通电压更低,就可以补偿了CPU主频升高带来功耗的增加。 但是,CPU的制造工艺是不会无休止地提升,越往后技术难度越大, 因而制造工艺是限制目前CPU主频提升的最大障碍 。 而且晶体管尺寸是减小了,但数量的增加会使晶体管之间的积热问题凸显出来,因此总的发热量并不会有太多减少。况且主频仅仅是CPU性能表现的一个方面,而不代表CPU的整体性能。CPU的性能参数还有二级缓存、三级缓存、指令集、前端总线等方面。一味地升高CPU的主频,会使CPU的发热量成倍增加,最后为了给CPU降温就要在散热装置上花费极大的功夫,这样做是得不偿失的。 所以为了增加CPU的速度,半导体的工程师们就给CPU设计多个核心,能够达到相同的效果。就好比有100道算术题要计算,单核CPU就是让一位速算高手来完成,而多核CPU就是请了四位速算能力一般的人,但最后还是四个人完成100道题所用的时间短,毕竟人多力量大嘛。 现在cpu并没有在核心数上突飞猛进,多核已经是十年前的技术了。现在普遍仍然停留在8核,服务器16核,多的32核,无法进一步提高。为啥,因为多核在访问缓存和内存上需要一定的同步机制。简单讲,核越多,协调它们越困难,访问缓存和内存越慢,制约了核心数的进一步提高。计算机体系结构是一个整体,cpu架构也是一个整体,不是单单某一方面决定的。比如就现在的计算机结构而言,制约其速度的根本不是cpu主频,而是内存访问速度,一级缓存,二级缓存,三级缓存存在的根本原因就是内存访问速度太慢。现在cpu的发展更多的是属于设计,优化范畴,而非技术突破,相对已经进入瓶颈期,单看主频和核数已经意义不大。 其实最主要的是半导体CPU再提升主频非常难,投资非常大,但获得的收益很低,很亏。所以想在半导体CPU没有被替代的时候通过堆核的方法再坑你点钱,想想,8核十六线程,用的到么。当然,里量子计算机普及还需要很长时间,即使普及也不稳定。目前也就i7 七代八代(AMD很少关注,所以不太了解,就不妄加评论)适合攒机,主频基本都在4.0GHz以上(睿频),普通不超频一体式水冷压的住。功耗也比较低,4核8线程也适合普通玩家使用,边打 游戏 边听歌,爽的。买牙膏厂的u得先看看红色阵营有什么动静。说实话牙膏厂的坑钱套路真的很烦。 因为Intel在2004年的时候曾经在提高CPU主频的事情上吃过大亏,于是转战多核心的路线。而多年以后的今天CPU已经是多核心+高频率的组合了。Intel在奔腾Pentium 4的时代开始研发超长流水线设计的CPU,为了使超长流水线能够发挥它的设计功效,Intel开始在提高CPU主频上下功夫,一度达到3.4GHz。但那是十几年前的2004年,CPU的工艺只有90nm, 超高主频带来的后果就是巨大的发热量和耗电量,3.4GHz CPU的功率可以超过100瓦,而当时Intel正在研发的4GHz CPU的功耗更是无法想象了。再加上当年Intel 820 + Rambus的风波,直接导致了Pentium 4新一代芯片取消上市,于是就有了非常著名的 Intel CEO“下跪道歉”事件 。在这之后,Intel痛定思痛,决定从「高频率」转向「多核心」,开始了双核、4核、6核研发,通过多核心的“人海战术”来提高CPU的工作效率。十几年过去了,CPU的制造工艺也在不停进步,慢慢的主频又开始逐渐提升。比如第八代14nm的的Core i7处理器主频就达到了3.7GHz(睿频4.7GHz),同时也采用了6核心的架构。所以CPU的主频是和制造工艺密切相关的,制造工艺越高,CPU的频率也能够进一步的提高,否则只能靠堆核心的办法提高运算能力了。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/8658188.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-19
下一篇 2023-04-19

发表评论

登录后才能评论

评论列表(0条)

保存