arm是如何成为智能处理器的体系架构_服务器

arm指令集其实是利用了长尾理论从x86嘴里拿下了mobile的市场，就像是x86对ibm做的事情一样，从而应用到了手机上，成为了智能处理器。

Application Processors （应用处理器，下图橙色框部分）–面向移动计算，智能手机，服务器等市场的的高端处理器。

ARM 体系结构是构建每个 ARM 处理器的基础。ARM 体系结构随着时间的推移不断发展，其中包含的体系结构功能可满足不断增长的新功能、高性能需求以及新兴市场的需要。

ARM体系结构支持跨跃多个性能点的实现，并已在许多细分市场中成为主导的体系结构。

ARM体系结构支持非常广泛的性能点，因而可以利用最新的微体系结构技术获得极小的ARM处理器实现和极有效的高级设计实现。实现规模、性能和低功耗是ARM体系结构的关键特性。

举个例子：

ARM一开始是一家盖房子的公司，后面这家公司盖房子业绩平平，于是就转变策略不盖房子了，转而开始卖盖房子所需要的设计图纸方案，同时还和买方案盖房子的客户一起盖房子。在这里，房子就是所谓的芯片，图纸方案就是指芯片的算法，架构等等的知识产权。

ARM向他的客户提供授权，软件包等，通过授权费和版税赚钱，然后因为这种模式，又因为很多公司也需要芯片处理器，于是ARM就与很多公司产生了合作关系，比如德州仪器，苹果，诺基亚等等。

基于ARM架构处理器开发的服务器，统称为ARM架构服务器。

ARM架构服务器分两种：

1、通用型ARM服务器

类似于华为Thaishan，基于鲲鹏920 服务器专用ARM处理器开发。

2、ARM集群服务器

类似于凌点MARS3000，基于Rockchip 高性能ARM处理器开发。

MARS3000 ARM集群服务器

ARM（Advanced RISC Machines）是微处理器行业的一家知名企业，设计了大量高性能、廉价、耗能低的RISC处理器、相关技术及软件。技术具有性能高、成本低和能耗省的特点。适用于多种领域，比如嵌入控制、消费/教育类多媒体、DSP和移动式应用等。
ARM将其技术授权给世界上许多著名的半导体、软件和OEM厂商，每个厂商得到的都是一套独一无二的ARM相关技术及服务。利用这种合伙关系，ARM很快成为许多全球性RISC标准的缔造者。
目前，总共有30家半导体公司与ARM签订了硬件技术使用许可协议，其中包括Intel、IBM、LG半导体、NEC、SONY、菲利浦和国民半导体这样的大公司。至于软件系统的合伙人，则包括微软、升阳和MRI等一系列知名公司。
ARM架构是面向低预算市场设计的第一款RISC微处理器。
2产品介绍
ARM提供一系列内核、体系扩展、微处理器和系统芯片方案。由于所有产品均采用一个通用的软件体系，所以相同的软件可在所有产品中运行（理论上如此）。典型的产品如下。
①CPU内核
--ARM7：小型、快速、低能耗、集成式RISC内核，用于移动通信。
-- ARM7TDMI(Thumb):这是公司授权用户最多的一项产品，将ARM7指令集同Thumb扩展组合在一起，以减少内存容量和系统成本。同时，它还利用嵌入式ICE调试技术来简化系统设计，并用一个DSP增强扩展来改进性能。该产品的典型用途是数字蜂窝电话和硬盘驱动器。
--ARM9TDMI:采用5阶段管道化ARM9内核，同时配备Thumb扩展、调试和Harvard总线。在生产工艺相同的情况下，性能可达ARM7TDMI的两倍之多。常用于连网和顶置盒。
②体系扩展
-- Thumb:以16位系统的成本，提供32位RISC性能，特别注意的是它所需的内存容量非常小。
③嵌入式ICE调试
由于集成了类似于ICE的CPU内核调试技术，所以原型设计和系统芯片的调试得到了极大的简化。
④微处理器
--ARM710系列，包括ARM710、ARM710T、ARM720T和ARM740T:低价、低能耗、封装式常规系统微型处理器，配有高速缓存（Cache）、内存管理、写缓冲和JTAG。广泛应用于手持式计算、数据通信和消费类多媒体。
--ARM940T、920T系列:低价、低能耗、高性能系统微处理器，配有Cache、内存管理和写缓冲。应用于高级引擎管理、保安系统、顶置盒、便携计算机和高档打印机。
--StrongARM:性能很高、同时满足常规应用需要的一种微处理器技术，与DEC联合研制，后来授权给Intel。SA110处理器、SA1100 PDA系统芯片和SA1500多媒体处理器芯片均采用了这一技术。
--ARM7500和ARM7500FE:高度集成的单芯片RISC计算机，基于一个缓存式ARM7 32位内核，拥有内存和I/O控制器、3个DMA通道、片上视频控制器和调色板以及立体声端口;ARM7500FE则增加了一个浮点运算单元以及对EDO DRAM的支持。特别适合电视顶置盒和网络计算机（NC）。
Windows CE的Pocket PC只支持ARMWindows CE可支持多种嵌入式处理器，但基于Windows CE的Pocket PC则只支持ARM一种。微软在对SH3、MIPS、ARM等嵌入式处理器做了评估后认为，ARM是一种性价比较好的选择。由于目前ARM在手持设备市场占有90%以上的份额，只支持ARM，可以有效地缩短应用程序开发与测试的时间，也降低了研发费用。由于ARM开放其处理器授权，因此，用户在市场上可以在多家整机厂商中进行选择，从而保证了这一市场的竞争性。

随着我们掌上具有强大计算功能的设备的出现，我们听到很多特别需要注意的术语是ARM。这些计算强大的设备的大脑正是基于这一点，在真正讨论它给未来的计算设备带来的好处之前，让我们来看看它究竟是什么，以及它如何与目前使用的其他替代形式的计算处理器不同。

ARM，以前称为高级 RISC 机器，是用于计算机处理器的 RISC（减少指令集计算）体系结构系列，可配置在各种环境中。Arm Holdings 开发该架构并将其许可给其他公司，如 Apple、Qualcomm 等，这些公司设计自己的产品，实现这些架构之一，包括芯片上的系统（SoC）和包含内存、接口、收音机等的模块系统上系统（SoM）。

它还设计了实现此指令集的核心，并将这些设计授权给将这些核心设计整合到自己产品的许多公司。然后，这些产品与其他组件一起整合到设备中，形成我们作为消费者购买的最终用户设备。

具有 RISC 架构的 ARM 处理器通常比具有复杂指令集计算（CISC）架构的处理器（如英特尔、AMD 等制造商的 x86 处理器）的晶体管需要更少的晶体管，从而提高了成本、功耗和散热能力。这些特性对于轻便、便携式、电池供电的设备（包括智能手机和平板电脑以及其他嵌入式系统）是可取的。即使对于耗电量大的超级计算机，ARM 也可以是一个可行的节能解决方案。

RISC 和 CISC 在当今世界的计算设备中应用广泛。需要更深入地研究它们，以便真正了解其中哪一个更适合我们的计算需求。一般来说，RISC 被许多人视为比 CISC 的改进。这是因为 CISC 是原始的 ISA（指令集体系结构），其中，RISC 是 20 世纪 80 年代初出现的重新设计的 ISA。

没有最好的体系结构，因为不同的体系结构在某些情况下可能更好，但在某些情况下则不太理想。基于 RISC 的计算机每个时钟周期执行一个指令。CISC 机器可以具有特殊说明以及需要多个周期才能执行的说明。这意味着在 CISC 体系结构上执行的相同指令可能需要多个指令才能在 RISC 计算机上执行。RISC 体系结构需要更多的工作（RAM）内存来保存值，因为它加载每个指令，对它执行 *** 作，然后加载下一个指令。

CISC 体系结构可以直接在内存上执行一个（尽管更复杂的指令）执行相同的 *** 作。因此，RISC 体系结构需要更多的 RAM，但每个时钟周期始终执行一个指令，以进行可预测的处理，这对于管道处理是好事。RISC 和 CISC 之间的主要区别之一是 RISC 强调每个指令的周期效率，CISC 强调每个程序指令的效率。

快速处理器取决于执行每个时钟周期所用的时间、执行指令的周期数以及每个程序中的指令数。RISC 强调较大的程序代码大小（由于指令集较小，因此连续执行多个步骤可能等同于 CISC 中的一个步骤）。这可以更好地可视化与以下性能方程，通常用于表达计算机的性能能力：

CISC 方法尝试最小化每个程序的指令数，牺牲每个指令的周期数。RISC 会执行相反的做法，以每个程序的指令数成本来减少每个指令的周期。

RISC ISA 强调软件而不是硬件。RISC 指令集需要用更少的指令编写更高效的软件（例如编译器或代码）。CISC ISA 在硬件中使用更多的晶体管来实现更多的指令和更复杂的指令。

RISC 需要更多的 RAM，而 CISC 强调代码大小更小，并且使用比 RISC 的 RAM 整体使用更少。然而，如今许多微处理器都包含 RISC 和 CISC 类属性的组合，例如一种像 CISC 一样使用 ISA 的 ISA，它将指令视为一串 RISC 类型的指令

ARM 及其实施的优势

简而言之，基于 RISC 的 ARM 架构不需要携带 CISC 处理器包含的大量行李来执行其复杂的指令。尽管像英特尔这样的公司已经投入巨资设计处理器，它们包括了先进的超高指令管道，但所有这些逻辑意味着芯片上的晶体管更多，更多的晶体管意味着更多的能源使用。高端英特尔芯片的性能非常出色，但高端处理器的最大 TDP（热设计功率）为 130 瓦。基于 ARM 的最高性能移动芯片消耗不到 4 瓦，通常更少。

这种低功耗是 ARM 如此特殊的原因，它不会尝试创建 130W 处理器，甚至 60W 或 20W。该公司只对设计低功耗处理器感兴趣。多年来，ARM 通过改进微架构设计提高了处理器的性能，但目标功率预算基本保持不变。一般来说，您可以分解 ARM SoC 的 TDP（芯片上的系统，包括 CPU、GPU 和 MMU 等），如下所示：多核 CPU 群集的最大预算为 2 瓦，GPU 为 2 瓦，MMU 和 SoC 的其余部分可能为 05 瓦。如果 CPU 是多核设计，则每个内核可能使用 600 到 750 毫瓦。

这些都是非常通用的数字，因为 ARM 生产的每个设计都有不同的特征。ARM 的第一个 Cortex-A 处理器是 Cortex-A8。它只在单核配置中工作，但它仍然是一个流行的设计，可以在一些设备中找到。接下来是 Cortex-A9 处理器，它带来了速度改进和双核与四核配置的能力。然后是 Cortex-A5 内核，它实际上比 Cortex-A8 和 A9 慢（每个内核），但功耗更低，制造成本更低。它专为低端多核应用（如入门级智能手机）而设计。

在性能规模的另一端，Cortex-A15 处理器，它是 ARM 最快的 32 位设计。它的速度几乎是 Cortex-A9 处理器的两倍，但所有额外的性能也意味着它使用多一点功率。在实现 2Ghz 的时钟速率和超越许多 ARM 合作伙伴的竞赛中，Cortex-A15 核心设计被推到了极限。因此，Cortex-A15 处理器确实有点作为电池杀手的名声。但是，这或许有点不公平。然而，为了补偿 Cortex-A15 处理器的更高功率预算，ARM 发布了 Cortex-A7 内核。

Cortex-A7 处理器比 Cortex-A9 处理器慢，但比 Cortex-A5 处理器快。然而，它的权力预算类似于它的低端兄弟。制作-A7核心时，结合-A15核心在找一个平衡点。LITTLE 配置允许 SoC 在执行简单任务时使用低功耗 Cortex-A7 内核，并在需要重担时切换到 Cortex-A15 内核。结果是设计节省电池，但可以提供最佳的性能。

ARM 还拥有 64 位处理器设计。Cortex-A53 是 ARM 的节能 64 位设计。它不会有破纪录的性能，但它是ARM有史以来效率最大的应用程序处理器。它也是世界上最小的64位处理器。它更大的兄弟，Cortex-A57，是一个不同的野兽。它是 ARM 最先进的设计，具有 ARM 所有 Cortex 处理器中最高的单线程性能。ARM 的合作伙伴可能会发布基于 A53（只有 A57）的芯片，并将两者大为使用。

ARM 管理从 32 位到 64 位迁移的一个方法是处理器具有不同的模式、32 位模式和 64 位模式。处理器可以在这两种模式之间快速切换，必要时运行 32 位代码，必要时运行 64 位代码。这意味着解码并开始执行 64 位代码的芯片与 32 位芯片是分开的（尽管有重用用以节省面积）。这意味着 64 位逻辑是隔离的、干净的和相对简单的。64 位逻辑不需要尝试和理解 32 位代码，并找出什么是最好的方法。这将需要一个更复杂的指令解码器。这些领域的复杂性通常意味着需要更多的能源。

ARM 64 位处理器的一个非常重要的方面是，它们没有比 32 位处理器使用更多的电源。ARM 已经成功地从 32 位到 64 位，但还停留在其自行实施的能源预算内。在某些情况下，新系列的 64 位处理器实际上将比上一代 32 位 ARM 处理器更节能。这主要是由于内部数据宽度（从 32 位到 64 位）的增加，以及 ARMv8 体系结构中增加了额外的内部寄存器。64 位内核可以更快地执行某些任务，这意味着它可以更快地断电，从而节省电池寿命。

最强大的使用模型大。LITTLE 架构是异构多处理（HMP），它同时支持使用所有物理内核。在这种情况下，具有高优先级或计算强度的线程可以分配给"大"内核，而优先级较低或计算强度较低的线程（如后台任务）则可由"LITTLE"内核执行。此模型已实现在三星Exynos开始与Exynos 5 Octa系列和苹果移动应用程序处理器开始与苹果A11。

这也是软件的作用。大。LITTLE 处理技术依赖于 *** 作系统的了解，即它是异构处理器。这意味着 *** 作系统需要了解某些内核比其他内核慢。到现在，处理器设计通常情况并非如此。如果 *** 作系统想要执行一项任务，它只会把它耕种到任何核心，因为它们都具有相同的性能级别。这和那个大并不大。LITTLE 使用特定的内核调度程序，它了解大的异构性质。小处理器配置，将决定每个进程/线程的执行。将来，此调度程序可以进一步优化，以考虑内核的当前运行温度或工作电压等。

传统计算中的 ARM

尽管ARM在移动设备中具有压倒性优势，但大多数笔记本电脑和计算机，即对于我们工作流程至关重要的设备，使用基于CISC的处理器。但最近，我们看到这种趋势正在发生变化，而基于ARM的个人电脑处理器也因此而大量涌入。2017 年底，高通和微软宣布了第一款基于 ARM 的处理器的 Windows 10 设备。惠普、和联想都推出了笔记本电脑，其中有高通的Snapdragon 835处理器。

ARM 上的 Windows 10 是微软之前尝试将移动处理器与完全笔记本电脑体验结婚的重启。与迄今为止存在的基于 x86 Intel 的计算机相比，它有望提供更好的电源效率、可靠的性能和始终保持的连接。对于这些 ARM 设备，高通拥有长达 25 小时的电池续航时间，以及与英特尔计算机平起平坐的即时电源和性能。

它还说，内置的LTE连接将提供显著更快的速度比其他可用的LTE设备Windows 10计算机。此外，微软在过去几年中不断改进了对 ARM 芯片的 Windows 支持，其即将推出的与架构无关的精简版 *** 作系统更证明了该公司对市场上拥有更多 ARM 支持的笔记本电脑是认真的。

最近，据报道苹果准备明年推出基于ARM的Macbook。彭博社报道说，苹果计划到2021年将iOS和macOS应用程序结合起来。有传言说苹果会将其MacBook笔记本电脑改用自己的ARM处理器。但是，以前，ARM 芯片没有运行更成熟的桌面应用程序所需的性能。彭博社的这份报告重申，在ARM上运行的Mac可能在2020年到达。Axios的报告似乎证实了这一说法。

然而，除了这些报告，随着iPad Pro在2015年发布，苹果显示，其ARM芯片现在可以处理"PC级"应用程序。自 2015 年以来，与英特尔的 CPU 代相比，Apple 的芯片变得越来越强大，每代芯片的性能都大得多。苹果传统上更喜欢对它设备的核心组件拥有更多的控制权，如果能够负担得起的话，所以苹果最终希望MacBook由为iOS设备供电的相同（或升级的）芯片提供动力，这是有道理的。

谜题的最后一部分是将 x86 macOS 程序过渡到 ARM 指令集体系结构。自去年以来，我们听说苹果正在实施一个名为"Marzipan"的项目，该项目将允许开发人员一次编写他们的应用程序代码，并在 iOS 设备和 macOS 计算机上工作。

几天前，苹果在其年度开发者大会上宣布发布第一版必要的软件套件。首先，苹果将允许开发者只将iPad应用移植到Mac上，因为iPad应用在功能和用户体验上都更接近macOS应用。最初，开发人员仍必须提交两个不同版本的应用，这些应用已针对每个平台优化了用户界面，但基础代码将保持不变。

2020年，苹果的Marzipan软件套件也有望允许开发者将他们的iPhone应用程序移植到Mac上。Apple 的工程师发现，将专为小型屏幕设计的应用程序移植到桌面是具有挑战性的，因此，进行这种过渡需要更长的时间。到 2021 年，第三方应用开发人员将能够创建跨 iOS 设备和 macOS 计算机工作的"单二进制文件"。据推测，它们在每个外形上仍有不同的用户界面，但它们要么更流畅地适应屏幕大小，要么开发人员必须在每个二进制文件中包含不同的用户界面。

ARM 及其合作伙伴也为服务器市场做出了重大公告，他们打算针对更强大的 Neoverse N1 和该芯片的其他变体。最大的公共云服务提供商亚马逊甚至已经开始设计自己的ARM CPU，它也可能很快就会升级到基于N1的处理器。就连谷歌（Google）也从未在Chrome *** 作系统中缺乏ARM支持，尽管 *** 作系统从第一天起就与架构无关，但谷歌似乎也在努力将Snapdragon平台引入一些Chromebook，而这反过来又应该能够更好地实现Chromebook上原生Android应用的功能和可用性。

但是，最初只有 Snapdragon 845 得到支持，因为该公司希望将更便宜的 Chromebook 推向市场。另一个问题似乎是，高通宁愿把Snapdragon 8cx放在售价500美元或更高的Chromebook中，因为这意味着OEM公司能够为8cx支付更高的价格。这将导致市场上有高端的Chromebook 。

总之，随着 ARM 架构的进步和半导体行业改进的 7nm 光刻工艺，以及投资于基于 ARM 的设备开发的主要制造商，我们可以期待一系列令人振奋的新产品进入市场。有了这个预期的发展道路，作为消费者，我们只能希望未来的计算设备能为我们提供卓越的性能和高效率，并让我们把时间投入我们最擅长的：创造力和创新。

在自研ARM处理器上，不只是苹果的M1系列取得了突破，中国厂商在这方面同样也有骄人的成绩，阿里云去年推出了倚天710处理器，这是全球首个5nm ARM架构服务器处理器，最高128核，现在已经开始商用了。
阿里云最近推出了ECS g8m 实例，是阿里云第一款使用自研倚天710 CPU的实例，主要针对通用计算、云原生以及Android in Cloud等场景，号称是阿里云算力性价比最高规格族。
此外，阿里还对比了上代使用第三代Intel Xeon可扩展处理器（Ice Lake）的情况，后者基频27 GHz，全核睿频35 GHz，倚天710是27GHz频率，ECS g8m 实例算力性价比提升100%，并且网络、存储性能指标对比上一代ARM实例提升100%。
2021年10月份，阿里巴巴旗下半导体公司平头哥发布自研云芯片倚天710。
该芯片是业界性能最强的ARM服务器芯片，性能超过业界标杆20%，能效比提升50%以上。倚天710是阿里云推进“一云多芯”策略的重要一步，也是阿里第一颗为云而生的CPU芯片，将在阿里云数据中心部署应用。

倚天710采用业界最先进的5nm工艺，单芯片容纳高达600亿晶体管；在芯片架构上，基于最新的ARMv9架构，内含128核CPU，主频最高达到32GHz，能同时兼顾性能和功耗。在内存和接口方面，集成业界最领先的DDR5、PCIe50等技术，能有效提升芯片的传输速率，并且可适配云的不同应用场景。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zz/13478003.html

arm是如何成为智能处理器的体系架构

发表评论

评论列表（0条）