半导体系列（三）：芯片设计篇之CPU研究，国产CPU到底行不行_技术

CPU又称中央处理器，作为计算机系统的运算和控制核心，是半导体产业技术最密集、最具战略价值的产品，是一个国家技术势力的象征。

目前CPU的市场基本被美国的两大公司垄断，分别是大哥Intel和小弟AMD，两家几乎占领了99%的市场份额。

目前Intel和AMD以X86指令集和微软共同建立了庞大的生态系统并且不对外开放，这样一来，中国队想要自己做CPU的空间不多了。

01 CPU定义

CPU在半导体行业中是人们常接触到的一种芯片，最常见的应用就是在电脑中，其中有名的有Intel的 i9-11980HK 和AMD的 R7-5800X 。

按照CPU种类来分类，可以分为服务器CPU、家用电脑CPU、嵌入式设备CPU和手机CPU，服务器CPU需要更出色的性能、稳定性和安全性，要求服务器365天开机运行，连续工作，一个服务器可以安装多个CPU；而家用电脑CPU性能要求相对较低，容量较小，不要求连续工作，一个电脑只能安装一个CPU；嵌入式设备和手机对CPU的性能要求相对更低。

按照CPU指令集架构来分类，CPU可以分为RISC和CISC。

CISC 即复杂指令系统计算机，物如其名，CISC是比较复杂的，指令系统比较丰富，有特定的指令来完成对应的功能，可以处理特殊任务。

RISC及精简指令集计算机，把精力集中在经常使用的指令上，对不常用的功能，通过组合指令来完成，实现简单高效的特点，一次RISC不能处理特殊任务。通俗来说就是经常用的功能简单化，不经常用的功能复杂化。

这其中CISC代表的指令集有X86，RISC代表的指令集有ARM、MIPS、RISC-V、Alpha、SPARS，除了这两种之外，还有我国自主研发的指令集DEC和LoongArch。

02 六大国产CPU

首先我们来了解一下什么是CPU的生态环境， CPU的生态环境就是一块CPU推出后，系统和软件对它的支持和优化有多少， 比如国产CPU龙芯就没有一个好的生态，不论是采用MIPS还是自主研发的LoongArch都不能支持Windows系统。

自主建立生态环境又难于上青天，而生态如果没有建立，软件商店就不会有软件（比如QQ在Linux中停更），这也是国产CPU发展最大的瓶颈之一。

目前国内有六大CPU设计厂商，他们是华为、飞腾、兆芯、申威、龙芯、海光（均未上市），他们分别以不同的方式参与CPU的设计。

CPU国产替代的故事得从Intel开始。

Intel趁着PC的东风迅速发展，建立了X86架构，标识了一套通用计算机指令集合，并且与微软一起在X86指令集上建立了庞大的生态。

目前的X86指令集不对外授权，只被英特尔和AMD所掌握，而X86又是PC、服务器领域做得最好的，别的指令集的生态环境远远抵不过X86，留给中国队的发展空间实属有限。

中国队CPU分为3个路线。

其一是由龙芯和申威代表的：自研指令集

龙芯最初采用的是MIPS精简指令集，制作通用CPU，主要产品是自主可控消费类例如服务器、台式机、嵌入式、航天器等领域。

申威最初采用的是Alpha精简指令集，主要应用在超级计算机和军事领域。

龙芯和申威都因为生态的原因，很难发展起来，尤其是龙芯，想要打入服务器和台式机市场必须有很好的生态。

龙芯因为MIPS的分崩离析，开始发展自己的指令集—— LoongArch ，它是完全有龙芯自主研发，可以兼容MIPS生态， 并且开始尝试用二进制翻译兼容ARM、X86处理器，龙芯的目标是在2025年消除指令集之间的壁垒，彻底搞定兼容问题。

申威也因为Alpha被收购，开始发展自主研发的指令集—— SW64 ，它是由Alpha改进而来，申威制作的神威·太湖之光超级计算机便采用SW64指令集，被称为“国之重器”，在国际上都有一定的地位，多项指标全球第一。

第二路线是由华为和飞腾代表的：ARM指令集授权

华为芯片“四大天王”麒麟、鲲鹏、巴龙、升腾中，除了巴龙以外，均采用ARM指令集授权来开发。这其中最著名的就是“麒麟”了，在手机领域一度领先，直至海外因畏惧华为的崛起，开始了制裁华为事件，就此“麒麟”短暂隐身。

飞腾也是国内目前使用ARM架构制作CPU的厂商之一，其技术不弱于高通，目前公司也被美国列入黑名单，其芯片制造环节同样被卡脖子，可能成为第二个华为。

除了华为和飞腾以外，国内以ARM架构制作芯片的厂商还有很多，例如贵州华芯通、展讯通信等。

第三路线是由兆芯和海光代表的：合资获取X86授权

兆芯的X86架构授权是源自于VIA公司将部分X86处理器相关技术、资料等IP产权以1.18亿美元价格卖给兆芯。兆芯基于X86的生态和技术，性能方面普遍高于龙芯，但还是不能和英特尔比肩。

海光的X86架构授权是通过和AMD合资公司来拥有AMD授权IP，但并不是完整的技术转让，而是阉割后的残缺版，所以性能上面和AMD锐龙、高通骁龙差一个档次。

03 RISC-V

RISC-V近些年流行的新型指令集，它是一种开源式指令集，对使用者免费开放，也是这种特性使它被众多专家认为是中国处理器产业的一次机会，而且可能是最后一次机会。

目前全球CPU的市场格局是以X86架构垄断PC、服务器行业；ARM架构垄断移动设备行业，这两家几乎涵盖了所有CPU市场需求。

X86架构归“Wintel”（英特尔+微软）所属，是一种封闭指令集，不对外授权， 简单说就是谁也别想用，就我自己能用 ；ARM架构属于可授权指令集+可授权设计， 简单说就是你用需要经过我同意并且收费，你想再它基础上设计还得再经过我同意并且再收费。

正因为如此，RISC-V作为开放式指令集，被中国队大力支持，看作救命稻草。

那RISC-V究竟有没有那么好呢？我们主要得看两方面： 一个是它的生态好不好，生态是决定指令集发展空间的最大因素；另一个就是它到底是不是彻头彻尾的免费，日后会不会再被卡脖子。

第一，RISC-V的生态怎么样。

RISC-V具有性能高、功率低、面积小、易于扩展等技术特点，最重要的是它的开源、免费的独特属性，为其带来众多合作商，影响力逐步扩大。

从2015年组织RISC-V基金会成立是的25个成员，到现在已经有超过300多个单位的加入，其中包括阿里、谷歌、华为、英伟达、高通、中科院、麻省理工等等。

日前，有知情人士表明，英特尔将以20亿美元收购RISC-V领域的重量级公司SiFive，这也表明了英特尔的态度。

虽然英特尔靠X86架构在PC、服务器领域无人能敌，但是移动设备一直是他的心病，ARM在移动设备领域是他无法抗衡的，而RISC-V的出现，给了机会。

但是看好归看好，ARM的垄断地位依旧很难撼动，RISC-V后续可能与X86联手对抗ARM，但更大的可能是打入嵌入式设备市场中，做物联网领域的“一哥”。

总体来说，不论是PC、服务器，还是移动设备，都很难被RISC-V介入，相反一些嵌入式设备比如空调、冰箱、扫地机器人、电动车等等发展环境更好。

第二，RISC-V是否永远免费。

RISC-V源于2010年，加州大学伯克利分校的一个研究团队研发，当时他们因为市场已存在的指令集相当复杂，且成本和门槛太高，所以建立了新的指令集。

“开源架构RISC-V将永久免费，成为人类共有财产。相较于X86和ARM架构的高门槛，开源架构RISC-V将带来芯片设计的革命”——RISC-V架构开发者之一Krste Asanovic博士。

这是RISC-V架构开发者的原话，表明该指令集是完全开源免费的，到目前为止他们也很好的履行了，甚至把基金会总部搬离美国，迁移至瑞士（永久中立国）以防止美国地方政策的限制。

尽管RISC-V从表现来看做得很优秀，但抽丝剥茧，终究还是有隐患在的。

实现RISC-V指令级架构的处理器内核有很多个不同的微架构实现，而微架构实际的模式是分不同类型的，其中有开放的、需授权的以及封闭的。

虽然基于RISC-V开发CPU不需要支付授权费用，但如果直接用RISC-V内核设计，也是需要支付授权费的。通俗来说就是你用我不需要收费，但是想在它的基础上设计得经过我同意，甚至收费（我们目前是全免费，但我有权利在以后收些钱）。

总结来说，目前全球的指令集呈现以X86、ARM、RISC-V三足鼎立的局势，RISC-V作为新时代的弄潮儿得到了各大厂商的认可，有发展的空间，但它不足以撼动其他两个指令集的地位，不过可以预料到的是，等RISC-V成长起来，仍然有可能对我国CPU发展卡脖子，我们需要保持隐患意识，在跟随洋人步伐的同时，发展自身CPU业务。

纵观国内厂商在电脑CPU领域，龙芯以自研为主，开发属于中国的指令集，目前已经可以满足一些党政领域以及机密工作的需求，但打入家用电脑领域仍需要提升CPU的生态和性能；服务器CPU中，申威在超算上小有成绩；华为近期也有消息称完成40nm去美化工作线投产，在明年更将攻破20nm的工作线，麒麟可能会重新归来；一些未上市公司如芯来科技、平头哥等也有在尝试RISC-V领域。

种种迹象都在证明，虽然我们起步慢了30年之久，但国产CPU一直在突破，路途艰辛却一路披荆斩，长夜漫漫，但黎明终将到来。

全文由各种资料查证，如有专业领域上的错误，希望可以抛砖引玉，有所探讨。

芯片全产业链图（绿底已经写完）

今天在后台回复『硬核干货』，主编送你一个财经知识锦囊。

（特别说明：文章中的数据和资料来自于公司财报、券商研报、行业报告、企业官网、百度百科等公开资料，本报告力求内容、观点客观公正，但不保证其准确性、完整性、及时性等。文章中的信息或观点不构成任何投资建议，投资人须对任何自主决定的投资行为负责，本人不对因使用本文内容所引发的直接或间接损失负任何责任。）

如果你对2004年英特尔总裁贝瑞特当年当着6500人惊天一跪还记忆犹新的话，或许能更能理解这个问题，当年老贝这一跪是对“惟主频论”失误的真心忏悔。当时NetBurst架构的Prescott（Pentium 4的核心），虽然已经是用了最先进的90nm工艺，但是3GHz主频的CPU功耗就超过百瓦，如果频率要超过4GHz，功耗将是何其了得。所以，在这儿就可以回答题主，正是因为功耗（散热）制约了主频的提升。登纳德缩放定律的终结相信你也听过摩尔定律，它告诉我们，芯片中晶体管的尺寸正在不断减小，因此芯片的晶体管数量可以不断增加。虽然近些年，摩尔定律一直在修改，但它似乎尚未完全停止。事实上，除了摩尔定律，还有一个很重要的定律，称登纳德缩放定律（Dennard Scaling），大体说，随着晶体管尺寸的减小，它的功耗也按面积大致按比例下降。摩尔定律和登纳德缩放定律这两个好基友放在一起，就是要告诉我们，可以不断缩小晶体管尺寸，并且在CPU中容纳更多晶体管，而功耗基本不变。但是，到了Pentium 4，基本上宣告了登纳德缩放定律的终结，因为Pentium 4的性能只有486的6倍，但功耗却是后者的23倍（6^1.75）！好吧，看看上面的图，随着晶体管的面积密度上升（蓝色线）16倍，功耗仅下降约4倍（紫色线），功耗降低已经不再与芯片面积密度上升成正比，Dennard Scaling is dead. 也就是说，继续以提升频率来提升性能的方法已经行不通了！多核也能刷性能到底CPU的性能是怎么定义的？英特尔是这么说的：其中f为频率，提升f就能提升CPU性能，不过这条路已经不通了。但是，我们还可以提升IPC呀，IPC（instruction per clock）是每时钟周期内所执行的指令数，所以才有了多核，2个核心，IPC就是原来的2倍，4个核心，IPC就翻了4倍，CPU的性能也就得到提升。所以我们消费级的CPU才从2核变成了4核，再到8核，现在已经升到了16核。反正呢，现在摩尔定律还能苟延残喘，但Dennard Scaling已是过去式，虽然工艺越来越先进，CPU里可以装进更多的晶体管，但由于功耗墙的原因，已经没办法提高单个内核的频率，解决方法是在芯片上保留更多内核以提高CPU性能。当然并非所有程序都可以支持多核，因此这种潜在的性能增益并不总是能够得以呈现，但肯定是越来越好了。发动机的转速再高，对速度的提升，也比不上气缸多来的直接！ V12 发动机不会搞9000转，8000进红线。一个喇叭尺寸再大，音量再高，看电影的时候，也不可能比7.2声道效果好。目前限制CPU的不是技术工艺，而是散热，Intel的CPU可以轻松6-7Ghz，前提是你得液氮散热，考虑到目前大多数风冷散热现实，限制主频2-4之间，也是对市场妥协。如果将来某一天，普及微型液氮散热器，说不定多核就没那么重要了欢迎你的阅读首先，要说的是现在手机也不是不提高主频了，只是提高的速度比以前更慢了。欢迎关注作者，一起聊科技、数码。不要光用频率衡量CPU的单核性能。举个例子，里程碑1代的555Mhz主频的德仪CPU，可以把HTC G7上面那颗1Ghz CPU从上到下秒一个遍。CPU单核心性能，可以用车辆的轮子计算。频率只是转速，代表转多块。影响的另外一个因素是单核能效，对应的是轮子的直径。轮子的直径大，并不需要转多快也能维持高度。但是直径小的，必须提高转速才能达到一样的速度，带来的结果就是功耗和发热的提高。不要看核心频率来定量CPU性能，要看核心架构在看频率，一般同一架构频率越高性能越好，像3.2gHz的八核推土机性能还不如四核八线程的酷睿i5性能好。四核四线程奔腾N4200还没有双核四线程M5性能好。目前CPU领域性能最好的是酷睿了，像主机CPU美洲豹架构只能和打桩机差不多，和酷睿i差远了，有人推测八核美洲豹性能居然只有比双核酷睿i5好一点。一个CPU中含有数十亿个晶体管，比如英特尔的主流CPU拥有20亿个晶体管，在某些高端产品中晶体管数量高达60亿个。晶体管在做模拟信号的相互转换时会根据CPU主频的高低产生动态功耗，因而CPU的主频越高，发热量就越大。当然芯片的制造工艺一直是在不断发展，根据摩尔定律，集成电路上可容纳的元器件的数目，约每隔一年半会增加一倍，性能也将提升一倍。 2000年的奔腾4处理器，制作工艺是180nm； 2010年的酷睿i7-980X，制作工艺32nm； 2013年的酷睿i7 4960X，制作工艺是22nm；现如今酷睿i7 9700k的制造工艺更是达到了10nm级别。晶体管做得越小，导通电压更低，就可以补偿了CPU主频升高带来功耗的增加。但是，CPU的制造工艺是不会无休止地提升，越往后技术难度越大，因而制造工艺是限制目前CPU主频提升的最大障碍。而且晶体管尺寸是减小了，但数量的增加会使晶体管之间的积热问题凸显出来，因此总的发热量并不会有太多减少。况且主频仅仅是CPU性能表现的一个方面，而不代表CPU的整体性能。CPU的性能参数还有二级缓存、三级缓存、指令集、前端总线等方面。一味地升高CPU的主频,会使CPU的发热量成倍增加，最后为了给CPU降温就要在散热装置上花费极大的功夫，这样做是得不偿失的。所以为了增加CPU的速度，半导体的工程师们就给CPU设计多个核心，能够达到相同的效果。就好比有100道算术题要计算，单核CPU就是让一位速算高手来完成，而多核CPU就是请了四位速算能力一般的人，但最后还是四个人完成100道题所用的时间短，毕竟人多力量大嘛。现在cpu并没有在核心数上突飞猛进，多核已经是十年前的技术了。现在普遍仍然停留在8核，服务器16核，多的32核，无法进一步提高。为啥，因为多核在访问缓存和内存上需要一定的同步机制。简单讲，核越多，协调它们越困难，访问缓存和内存越慢，制约了核心数的进一步提高。计算机体系结构是一个整体，cpu架构也是一个整体，不是单单某一方面决定的。比如就现在的计算机结构而言，制约其速度的根本不是cpu主频，而是内存访问速度，一级缓存，二级缓存，三级缓存存在的根本原因就是内存访问速度太慢。现在cpu的发展更多的是属于设计，优化范畴，而非技术突破，相对已经进入瓶颈期，单看主频和核数已经意义不大。其实最主要的是半导体CPU再提升主频非常难，投资非常大，但获得的收益很低，很亏。所以想在半导体CPU没有被替代的时候通过堆核的方法再坑你点钱，想想，8核十六线程，用的到么。当然，里量子计算机普及还需要很长时间，即使普及也不稳定。目前也就i7 七代八代(AMD很少关注，所以不太了解，就不妄加评论)适合攒机，主频基本都在4.0GHz以上(睿频)，普通不超频一体式水冷压的住。功耗也比较低，4核8线程也适合普通玩家使用，边打游戏边听歌，爽的。买牙膏厂的u得先看看红色阵营有什么动静。说实话牙膏厂的坑钱套路真的很烦。因为Intel在2004年的时候曾经在提高CPU主频的事情上吃过大亏，于是转战多核心的路线。而多年以后的今天CPU已经是多核心+高频率的组合了。Intel在奔腾Pentium 4的时代开始研发超长流水线设计的CPU，为了使超长流水线能够发挥它的设计功效，Intel开始在提高CPU主频上下功夫，一度达到3.4GHz。但那是十几年前的2004年，CPU的工艺只有90nm，超高主频带来的后果就是巨大的发热量和耗电量，3.4GHz CPU的功率可以超过100瓦，而当时Intel正在研发的4GHz CPU的功耗更是无法想象了。再加上当年Intel 820 + Rambus的风波，直接导致了Pentium 4新一代芯片取消上市，于是就有了非常著名的 Intel CEO“下跪道歉”事件。在这之后，Intel痛定思痛，决定从「高频率」转向「多核心」，开始了双核、4核、6核研发，通过多核心的“人海战术”来提高CPU的工作效率。十几年过去了，CPU的制造工艺也在不停进步，慢慢的主频又开始逐渐提升。比如第八代14nm的的Core i7处理器主频就达到了3.7GHz（睿频4.7GHz）,同时也采用了6核心的架构。所以CPU的主频是和制造工艺密切相关的，制造工艺越高，CPU的频率也能够进一步的提高，否则只能靠堆核心的办法提高运算能力了。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/dianzi/8658188.html

半导体系列（三）：芯片设计篇之CPU研究，国产CPU到底行不行

发表评论

评论列表（0条）