arm是如何成为智能处理器的体系架构

arm是如何成为智能处理器的体系架构,第1张

arm指令集其实是利用了长尾理论从x86嘴里拿下了mobile的市场,就像是x86对ibm做的事情一样,从而应用到了手机上,成为了智能处理器。

Application Processors (应用处理器,下图橙色框部分)–面向移动计算,智能手机,服务器等市场的的高端处理器。

ARM 体系结构是构建每个 ARM 处理器的基础。ARM 体系结构随着时间的推移不断发展,其中包含的体系结构功能可满足不断增长的新功能、高性能需求以及新兴市场的需要。

ARM体系结构支持跨跃多个性能点的实现,并已在许多细分市场中成为主导的体系结构。

ARM体系结构支持非常广泛的性能点,因而可以利用最新的微体系结构技术获得极小的ARM处理器实现和极有效的高级设计实现。实现规模、性能和低功耗是ARM体系结构的关键特性。

举个例子:

ARM一开始是一家盖房子的公司,后面这家公司盖房子业绩平平,于是就转变策略不盖房子了,转而开始卖盖房子所需要的设计图纸方案,同时还和买方案盖房子的客户一起盖房子。在这里,房子就是所谓的芯片,图纸方案就是指芯片的算法,架构等等的知识产权。

ARM向他的客户提供授权,软件包等,通过授权费和版税赚钱,然后因为这种模式,又因为很多公司也需要芯片处理器,于是ARM就与很多公司产生了合作关系,比如德州仪器,苹果,诺基亚等等。

基于ARM架构处理器开发的服务器,统称为ARM架构服务器。

ARM架构服务器分两种:

1、通用型ARM服务器

类似于华为Thaishan,基于鲲鹏920 服务器专用ARM处理器开发。

2、ARM集群服务器

类似于凌点MARS3000,基于Rockchip 高性能ARM处理器开发。

MARS3000 ARM集群服务器

ARM(Advanced RISC Machines)是微处理器行业的一家知名企业,设计了大量高性能、廉价、耗能低的RISC处理器、相关技术及软件。技术具有性能高、成本低和能耗省的特点。适用于多种领域,比如嵌入控制、消费/教育类多媒体、DSP和移动式应用等。
ARM将其技术授权给世界上许多著名的半导体、软件和OEM厂商,每个厂商得到的都是一套独一无二的ARM相关技术及服务。利用这种合伙关系,ARM很快成为许多全球性RISC标准的缔造者。
目前,总共有30家半导体公司与ARM签订了硬件技术使用许可协议,其中包括Intel、IBM、LG半导体、NEC、SONY、菲利浦和国民半导体这样的大公司。至于软件系统的合伙人,则包括微软、升阳和MRI等一系列知名公司。
ARM架构是面向低预算市场设计的第一款RISC微处理器。
2产品介绍
ARM提供一系列内核、体系扩展、微处理器和系统芯片方案。由于所有产品均采用一个通用的软件体系,所以相同的软件可在所有产品中运行(理论上如此)。典型的产品如下。
①CPU内核
--ARM7:小型、快速、低能耗、集成式RISC内核,用于移动通信。
-- ARM7TDMI(Thumb):这是公司授权用户最多的一项产品,将ARM7指令集同Thumb扩展组合在一起,以减少内存容量和系统成本。同时,它还利用嵌入式ICE调试技术来简化系统设计,并用一个DSP增强扩展来改进性能。该产品的典型用途是数字蜂窝电话和硬盘驱动器。
--ARM9TDMI:采用5阶段管道化ARM9内核,同时配备Thumb扩展、调试和Harvard总线。在生产工艺相同的情况下,性能可达ARM7TDMI的两倍之多。常用于连网和顶置盒。
②体系扩展
-- Thumb:以16位系统的成本,提供32位RISC性能,特别注意的是它所需的内存容量非常小。
③嵌入式ICE调试
由于集成了类似于ICE的CPU内核调试技术,所以原型设计和系统芯片的调试得到了极大的简化。
④微处理器
--ARM710系列,包括ARM710、ARM710T、ARM720T和ARM740T:低价、低能耗、封装式常规系统微型处理器,配有高速缓存(Cache)、内存管理、写缓冲和JTAG。广泛应用于手持式计算、数据通信和消费类多媒体。
--ARM940T、920T系列:低价、低能耗、高性能系统微处理器,配有Cache、内存管理和写缓冲。应用于高级引擎管理、保安系统、顶置盒、便携计算机和高档打印机。
--StrongARM:性能很高、同时满足常规应用需要的一种微处理器技术,与DEC联合研制,后来授权给Intel。SA110处理器、SA1100 PDA系统芯片和SA1500多媒体处理器芯片均采用了这一技术。
--ARM7500和ARM7500FE:高度集成的单芯片RISC计算机,基于一个缓存式ARM7 32位内核,拥有内存和I/O控制器、3个DMA通道、片上视频控制器和调色板以及立体声端口;ARM7500FE则增加了一个浮点运算单元以及对EDO DRAM的支持。特别适合电视顶置盒和网络计算机(NC)。
Windows CE的Pocket PC只支持ARMWindows CE可支持多种嵌入式处理器,但基于Windows CE的Pocket PC则只支持ARM一种。微软在对SH3、MIPS、ARM等嵌入式处理器做了评估后认为,ARM是一种性价比较好的选择。由于目前ARM在手持设备市场占有90%以上的份额,只支持ARM,可以有效地缩短应用程序开发与测试的时间,也降低了研发费用。由于ARM开放其处理器授权,因此,用户在市场上可以在多家整机厂商中进行选择,从而保证了这一市场的竞争性。

随着我们掌上具有强大计算功能的设备的出现,我们听到很多特别需要注意的术语是ARM。这些计算强大的设备的大脑正是基于这一点,在真正讨论它给未来的计算设备带来的好处之前,让我们来看看它究竟是什么,以及它如何与目前使用的其他替代形式的计算处理器不同。

ARM,以前称为高级 RISC 机器,是用于计算机处理器的 RISC(减少指令集计算)体系结构系列,可配置在各种环境中。Arm Holdings 开发该架构并将其许可给其他公司,如 Apple、Qualcomm 等,这些公司设计自己的产品,实现这些架构之一 , 包括芯片上的系统 (SoC) 和包含内存、接口、收音机等的模块系统上系统 (SoM)。

它还设计了实现此指令集的核心,并将这些设计授权给将这些核心设计整合到自己产品的许多公司。然后,这些产品与其他组件一起整合到设备中,形成我们作为消费者购买的最终用户设备。

具有 RISC 架构的 ARM 处理器通常比具有复杂指令集计算 (CISC) 架构的处理器(如英特尔、AMD 等制造商的 x86 处理器)的晶体管需要更少的晶体管,从而提高了成本、功耗和散热能力。这些特性对于轻便、便携式、电池供电的设备(包括智能手机和平板电脑以及其他嵌入式系统)是可取的。即使对于耗电量大的超级计算机,ARM 也可以是一个可行的节能解决方案。

RISC 和 CISC 在当今世界的计算设备中应用广泛。需要更深入地研究它们,以便真正了解其中哪一个更适合我们的计算需求。一般来说,RISC 被许多人视为比 CISC 的改进。这是因为 CISC 是原始的 ISA(指令集体系结构),其中,RISC 是 20 世纪 80 年代初出现的重新设计的 ISA。

没有最好的体系结构,因为不同的体系结构在某些情况下可能更好,但在某些情况下则不太理想。基于 RISC 的计算机每个时钟周期执行一个指令。CISC 机器可以具有特殊说明以及需要多个周期才能执行的说明。这意味着在 CISC 体系结构上执行的相同指令可能需要多个指令才能在 RISC 计算机上执行。RISC 体系结构需要更多的工作 (RAM) 内存来保存值,因为它加载每个指令,对它执行 *** 作,然后加载下一个指令。

CISC 体系结构可以直接在内存上执行一个(尽管更复杂的指令)执行相同的 *** 作。因此,RISC 体系结构需要更多的 RAM,但每个时钟周期始终执行一个指令,以进行可预测的处理,这对于管道处理是好事。RISC 和 CISC 之间的主要区别之一是 RISC 强调每个指令的周期效率,CISC 强调每个程序指令的效率。

快速处理器取决于执行每个时钟周期所用的时间、执行指令的周期数以及每个程序中的指令数。RISC 强调较大的程序代码大小(由于指令集较小,因此连续执行多个步骤可能等同于 CISC 中的一个步骤)。这可以更好地可视化与以下性能方程,通常用于表达计算机的性能能力:

CISC 方法尝试最小化每个程序的指令数,牺牲每个指令的周期数。RISC 会执行相反的做法,以每个程序的指令数成本来减少每个指令的周期。

RISC ISA 强调软件而不是硬件。RISC 指令集需要用更少的指令编写更高效的软件(例如编译器或代码)。CISC ISA 在硬件中使用更多的晶体管来实现更多的指令和更复杂的指令。

RISC 需要更多的 RAM,而 CISC 强调代码大小更小,并且使用比 RISC 的 RAM 整体使用更少。然而,如今许多微处理器都包含 RISC 和 CISC 类属性的组合,例如一种像 CISC 一样使用 ISA 的 ISA,它将指令视为一串 RISC 类型的指令

ARM 及其实施的优势

简而言之,基于 RISC 的 ARM 架构不需要携带 CISC 处理器包含的大量行李来执行其复杂的指令。尽管像英特尔这样的公司已经投入巨资设计处理器,它们包括了先进的超高指令管道,但所有这些逻辑意味着芯片上的晶体管更多,更多的晶体管意味着更多的能源使用。高端英特尔芯片的性能非常出色,但高端处理器的最大 TDP(热设计功率)为 130 瓦。基于 ARM 的最高性能移动芯片消耗不到 4 瓦,通常更少。

这种低功耗是 ARM 如此特殊的原因,它不会尝试创建 130W 处理器,甚至 60W 或 20W。该公司只对设计低功耗处理器感兴趣。多年来,ARM 通过改进微架构设计提高了处理器的性能,但目标功率预算基本保持不变。一般来说,您可以分解 ARM SoC 的 TDP(芯片上的系统,包括 CPU、GPU 和 MMU 等),如下所示:多核 CPU 群集的最大预算为 2 瓦,GPU 为 2 瓦,MMU 和 SoC 的其余部分可能为 05 瓦。如果 CPU 是多核设计,则每个内核可能使用 600 到 750 毫瓦。

这些都是非常通用的数字,因为 ARM 生产的每个设计都有不同的特征。ARM 的第一个 Cortex-A 处理器是 Cortex-A8。它只在单核配置中工作,但它仍然是一个流行的设计,可以在一些设备中找到。接下来是 Cortex-A9 处理器,它带来了速度改进和双核与四核配置的能力。然后是 Cortex-A5 内核,它实际上比 Cortex-A8 和 A9 慢(每个内核),但功耗更低,制造成本更低。它专为低端多核应用(如入门级智能手机)而设计。

在性能规模的另一端,Cortex-A15 处理器,它是 ARM 最快的 32 位设计。它的速度几乎是 Cortex-A9 处理器的两倍,但所有额外的性能也意味着它使用多一点功率。在实现 2Ghz 的时钟速率和超越许多 ARM 合作伙伴的竞赛中,Cortex-A15 核心设计被推到了极限。因此,Cortex-A15 处理器确实有点作为电池杀手的名声。但是,这或许有点不公平。然而,为了补偿 Cortex-A15 处理器的更高功率预算,ARM 发布了 Cortex-A7 内核。

Cortex-A7 处理器比 Cortex-A9 处理器慢,但比 Cortex-A5 处理器快。然而,它的权力预算类似于它的低端兄弟。制作-A7核心时,结合-A15核心在找一个平衡点。LITTLE 配置允许 SoC 在执行简单任务时使用低功耗 Cortex-A7 内核,并在需要重担时切换到 Cortex-A15 内核。结果是设计节省电池,但可以提供最佳的性能。

ARM 还拥有 64 位处理器设计。Cortex-A53 是 ARM 的节能 64 位设计。它不会有破纪录的性能,但它是ARM有史以来效率最大的应用程序处理器。它也是世界上最小的64位处理器。它更大的兄弟,Cortex-A57,是一个不同的野兽。它是 ARM 最先进的设计,具有 ARM 所有 Cortex 处理器中最高的单线程性能。ARM 的合作伙伴可能会发布基于 A53(只有 A57)的芯片,并将两者大为使用。

ARM 管理 从 32 位到 64 位迁移的一个方法是处理器具有不同的模式、32 位模式和 64 位模式。处理器可以在这两种模式之间快速切换,必要时运行 32 位代码,必要时运行 64 位代码。这意味着解码并开始执行 64 位代码的芯片与 32 位芯片是分开的(尽管有重用用以节省面积)。这意味着 64 位逻辑是隔离的、干净的和相对简单的。64 位逻辑不需要尝试和理解 32 位代码,并找出什么是最好的方法。这将需要一个更复杂的指令解码器。这些领域的复杂性通常意味着需要更多的能源。

ARM 64 位处理器的一个非常重要的方面是,它们没有比 32 位处理器使用更多的电源。ARM 已经成功地从 32 位到 64 位,但还停留在其自行实施的能源预算内。在某些情况下,新系列的 64 位处理器实际上将比上一代 32 位 ARM 处理器更节能。这主要是由于内部数据宽度(从 32 位到 64 位)的增加,以及 ARMv8 体系结构中增加了额外的内部寄存器。64 位内核可以更快地执行某些任务,这意味着它可以更快地断电,从而节省电池寿命。

最强大的使用模型大。LITTLE 架构是异构多处理 (HMP),它同时支持使用所有物理内核。在这种情况下,具有高优先级或计算强度的线程可以分配给"大"内核,而优先级较低或计算强度较低的线程(如后台任务)则可由"LITTLE"内核执行。此模型已实现在三星Exynos开始与Exynos 5 Octa系列和苹果移动应用程序处理器开始与苹果A11。

这也是软件的作用。大。LITTLE 处理技术依赖于 *** 作系统的了解,即它是异构处理器。这意味着 *** 作系统需要了解某些内核比其他内核慢。到现在,处理器设计通常情况并非如此。如果 *** 作系统想要执行一项任务,它只会把它耕种到任何核心,因为它们都具有相同的性能级别。这和那个大并不大。LITTLE 使用特定的内核调度程序,它了解大的异构性质。小处理器配置,将决定每个进程/线程的执行。将来,此调度程序可以进一步优化,以考虑内核的当前运行温度或工作电压等。

传统计算中的 ARM

尽管ARM在移动设备中具有压倒性优势,但大多数笔记本电脑和计算机,即对于我们工作流程至关重要的设备,使用基于CISC的处理器。但最近,我们看到这种趋势正在发生变化,而基于ARM的个人电脑处理器也因此而大量涌入。2017 年底,高通和微软宣布了第一款基于 ARM 的处理器的 Windows 10 设备。惠普、和联想都推出了笔记本电脑,其中有高通的Snapdragon 835处理器。

ARM 上的 Windows 10 是微软之前尝试将移动处理器与完全笔记本电脑体验结婚的重启。与迄今为止存在的基于 x86 Intel 的计算机相比,它有望提供更好的电源效率、可靠的性能和始终保持的连接。对于这些 ARM 设备,高通拥有长达 25 小时的电池续航时间,以及与英特尔计算机平起平坐的即时电源和性能。

它还说,内置的LTE连接将提供显著更快的速度比其他可用的LTE设备Windows 10计算机。此外,微软在过去几年中不断改进了对 ARM 芯片的 Windows 支持,其即将推出的与架构无关的精简版 *** 作系统更证明了该公司对市场上拥有更多 ARM 支持的笔记本电脑是认真的。

最近,据报道苹果准备明年推出基于ARM的Macbook。彭博社报道说,苹果计划到2021年将iOS和macOS应用程序结合起来。有传言说苹果会将其MacBook笔记本电脑改用自己的ARM处理器。但是,以前,ARM 芯片没有运行更成熟的桌面应用程序所需的性能。彭博社的这份报告重申,在ARM上运行的Mac可能在2020年到达。Axios的报告似乎证实了这一说法。

然而,除了这些报告,随着iPad Pro在2015年发布,苹果显示,其ARM芯片现在可以处理"PC级"应用程序。自 2015 年以来,与英特尔的 CPU 代相比,Apple 的芯片变得越来越强大,每代芯片的性能都大得多。苹果传统上更喜欢对它设备的核心组件拥有更多的控制权,如果能够负担得起的话,所以苹果最终希望MacBook由为iOS设备供电的相同(或升级的)芯片提供动力,这是有道理的。

谜题的最后一部分是将 x86 macOS 程序过渡到 ARM 指令集体系结构。自去年以来,我们听说苹果正在实施一个名为"Marzipan"的项目,该项目将允许开发人员一次编写他们的应用程序代码,并在 iOS 设备和 macOS 计算机上工作。

几天前,苹果在其年度开发者大会上宣布发布第一版必要的软件套件。首先,苹果将允许开发者只将iPad应用移植到Mac上,因为iPad应用在功能和用户体验上都更接近macOS应用。最初,开发人员仍必须提交两个不同版本的应用,这些应用已针对每个平台优化了用户界面,但基础代码将保持不变。

2020年,苹果的Marzipan软件套件也有望允许开发者将他们的iPhone应用程序移植到Mac上。Apple 的工程师发现,将专为小型屏幕设计的应用程序移植到桌面是具有挑战性的,因此,进行这种过渡需要更长的时间。到 2021 年,第三方应用开发人员将能够创建跨 iOS 设备和 macOS 计算机工作的"单二进制文件"。据推测,它们在每个外形上仍有不同的用户界面,但它们要么更流畅地适应屏幕大小,要么开发人员必须在每个二进制文件中包含不同的用户界面。

ARM 及其合作伙伴也为服务器市场做出了重大公告,他们打算针对更强大的 Neoverse N1 和该芯片的其他变体。最大的公共云服务提供商亚马逊甚至已经开始设计自己的ARM CPU,它也可能很快就会升级到基于N1的处理器。就连谷歌(Google)也从未在Chrome *** 作系统中缺乏ARM支持,尽管 *** 作系统从第一天起就与架构无关,但谷歌似乎也在努力将Snapdragon平台引入一些Chromebook,而这反过来又应该能够更好地实现Chromebook上原生Android应用的功能和可用性。

但是,最初只有 Snapdragon 845 得到支持,因为该公司希望将更便宜的 Chromebook 推向市场。另一个问题似乎是,高通宁愿把Snapdragon 8cx放在售价500美元或更高的Chromebook中,因为这意味着OEM公司能够为8cx支付更高的价格。这将导致市场上有高端 的Chromebook 。

总之,随着 ARM 架构的进步和半导体行业改进的 7nm 光刻工艺,以及投资于基于 ARM 的设备开发的主要制造商,我们可以期待一系列令人振奋的新产品进入市场。有了这个预期的发展道路,作为消费者,我们只能希望未来的计算设备能为我们提供卓越的性能和高效率,并让我们把时间投入我们最擅长的:创造力和创新。

在自研ARM处理器上,不只是苹果的M1系列取得了突破,中国厂商在这方面同样也有骄人的成绩,阿里云去年推出了倚天710处理器,这是全球首个5nm ARM架构服务器处理器,最高128核,现在已经开始商用了。
阿里云最近推出了ECS g8m 实例,是阿里云第一款使用自研倚天710 CPU的实例,主要针对通用计算、云原生以及Android in Cloud等场景,号称是阿里云算力性价比最高规格族。
此外,阿里还对比了上代使用第三代Intel Xeon可扩展处理器(Ice Lake)的情况,后者基频27 GHz,全核睿频35 GHz,倚天710是27GHz频率,ECS g8m 实例算力性价比提升100%,并且网络、存储性能指标对比上一代ARM实例提升100%。
2021年10月份,阿里巴巴旗下半导体公司平头哥发布自研云芯片倚天710。
该芯片是业界性能最强的ARM服务器芯片,性能超过业界标杆20%,能效比提升50%以上。倚天710是阿里云推进“一云多芯”策略的重要一步,也是阿里第一颗为云而生的CPU芯片,将在阿里云数据中心部署应用。

倚天710采用业界最先进的5nm工艺,单芯片容纳高达600亿晶体管;在芯片架构上,基于最新的ARMv9架构,内含128核CPU,主频最高达到32GHz,能同时兼顾性能和功耗。在内存和接口方面,集成业界最领先的DDR5、PCIe50等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/13478003.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-08-15
下一篇 2023-08-15

发表评论

登录后才能评论

评论列表(0条)

保存