Arm Cortex-M55、Ethos-U55 NPU架构发表 嵌入式装置也能用AI加速运算

Arm Cortex-M55、Ethos-U55 NPU架构发表 嵌入式装置也能用AI加速运算,第1张

Arm目前两款架构设计已经确定与亚马逊、AlifSemiconductor、恒玄科技(Bestechnic)、赛普拉斯半导体、Dolby、Google、恩智浦、三星、意法半导体在内业者合作,预期将可应用在各类整合声控智慧助理服务的喇叭、耳机,或是其他整合人工智慧技术边缘运算模式的嵌入式设备使用。

继去年针对主流装置上的人工智慧运算需求提出Ethos-N57及Ethos-N37两款NPU设计,Arm稍早除了宣布推出新款嵌入式处理器Cortex-M55,同时也宣布推出新款Ethos-U55NPU,借此让更多物联网装置也能借由人工智慧技术加速运算模式。

相较去年配合Cortex-A、Mali架构设计打造的Ethos-N57及Ethos-N37两款NPU,此次宣布推出的Ethos-U55则是搭配新款嵌入式处理器Cortex-M55,让更多物联网装置也能采用人工智慧技术方式进行加速运算。

依照Arm说明,在这两项技术授权架构组合之下,将让现有嵌入式装置发挥高达480倍的机器学习效率,同时也预期可在2021年陆续应用在各类嵌入式装置,并且实现原本仅先应用在手机等装置中,结合人工智慧技术的边缘运算效果。

此次提出的Cortex-M55,自然是针对嵌入式装置所提出全新处理器架构设计,在搭配此次同步推出的Ethos-U55NPU即可发挥装置端的人工智慧运算效果,无需像以往必须借由整合额外的DSP元件才能实现人工智慧运算模式,同时也能进一步缩减物联网装置机身尺寸,并且降低整体运算功耗。

而Arm此次也借由Cortex-M55与Ethos-U55,进一步与Google合作,使其可相容Google提出的TensorFlowLite运算框架,借此串接更多基于TensorFlowLite运算框架的人工智慧运算技术。

另外,在Cortex-M55设计中更采Armv81-M指令集,并且针对机器学习需求整合「Helium」向量加速运算设计(正式名称为MVE(M-ProfileVectorExtension))。

相比前一款Cortex-M处理器搭配DSP元件可提升15倍机器学习运算效能,同时也比现有嵌入式装置借由DSP元件运算模式带来5倍运算效能提升比例。

至于在Ethos-U55NPU设计中,除了是Arm第一款针对嵌入式装置打造的NPU,而采32核至256核数量的MAC运算引擎部分,则是在强调低功耗使用特性之余,更提供可扩充设计。

除了搭配Cortex-M55发挥最佳化运算效果,Ethos-U55NPU也能配合现有Cortex-M33、Cortex-M7等处理器设计使用。

在效能表现部分,以Cortex-M7为基准的话,Cortex-M55运算效率约提升6倍,Cortex-M55搭配Ethos-U55NPU的组合更可发挥50倍运算效率,而Cortex-M55相比Cortex-M7约可减少7倍电力损耗,额外搭配Ethos-U55NPU更能减少25倍电力损耗,同时此次提出架构设计也均符合Arm平台安全架构PSA,以及Corstone参考设计,另外也能搭配ArmTrustZone安全技术使用。

目前两款架构设计已经确定与亚马逊、AlifSemiconductor、恒玄科技(Bestechnic)、赛普拉斯半导体、Dolby、Google、恩智浦、三星、意法半导体在内业者合作,预期将可应用在各类整合声控智慧助理服务的喇叭、耳机,或是其他整合人工智慧技术边缘运算模式的嵌入式设备使用。

TaggedAI,ARM,Cortex-M55,Ethos,Ethos-U55,IoT,NPU,人工智慧,物联网

Arm在嵌入式装置处理器提供客制化指令集设计,或许也是因应近年来RISC-V开放架构设计处理器越来越受市场关注,甚至欧盟单位更计画借由RISC-V架构设计打造各类处理器产品,借此提升欧洲地区在半导体应用发展竞争力。

稍早于美国圣荷西举办的ArmTechCon2019活动中,Arm除了透露目前全球累积出货量已经超过1500亿组,同时由执行长SimonSegars再次强调计画在2023年前恢复上市,更宣布针对嵌入式装置处理器提供客制化指令集设计,同时也将以全新Mbed作业系统加快与合作伙伴在物联网应用成长,此外更宣布将与通用汽车、Toyota、DENSO、大陆集团、Bosch、恩智浦与NVIDIA在内厂商合作成立自驾车辆运算协会(AVCC),借此推动未来的自动驾驶技术发展。

而针对嵌入式装置处理器设计提供客制化指令集,意味合作伙伴将可在无需额外支付授权费用之下,即可由Arm协助进行客制化修改,借此在市场做出差异化发展,同时也因为是由Arm提供客制化设计服务,因此并不会有软体、指令集相容问题,并且建立在新版Armv8-M指令集架构之后设计,将能使用更多新技术应用。

在此之前,Arm其实已经提供合作伙伴半客制化的处理器设计方案,例如目前Qualm已经借此打造多款半客制化的处理器产品,同时也获得不少市场支持成效,甚至能在每年以更快效率推出新款处理器,并且加入全新技术应用。

不过,此次在嵌入式装置处理器提供客制化指令集设计,或许也是因应近年来RISC-V开放架构设计处理器越来越受市场关注,甚至欧盟单位更计画借由RISC-V架构设计打造各类处理器产品,借此提升欧洲地区在半导体应用发展竞争力。

因此为了维持本身市场优势,Arm也必须持续维持更多发展d性,借此吸引更多合作伙伴持续采用旗下设计方案,避免全面转向采用RISC-V架构设计发展。

除了宣布在嵌入式装置处理器提供客制化指令集设计,Arm在此次活动更宣布透过全新Mbed作业系统加快更多物联网应用成长,并且与亚德诺半导体(AnalogDevices)、赛普拉斯半导体(Cypress)、MaximIntegrated、新唐科技(Nuvoton)、恩智浦(NXP)、瑞萨电子(Renesas)、瑞昱半导体(Realtek)、三星(Samsung)、芯科科技(SiliconLabs),以及u-blox产品工作群在内合作伙伴维持深度整合,确保接下来的物联网应用成长动能。

另外,此次与通用汽车、Toyota、DENSO、大陆集团、Bosch、恩智浦与NVIDIA在内厂商合作成立自驾车辆运算协会,更计画进一步推动未来自驾车应用发展。

作者:西瓜君
来源:知乎
安全是物联网应用的一个痛点为了实现安全,需要一系列的手段,包括安全的通信(secure communication),安全的的执行(TEE),安全的启动(secure boot)TZ属于TEE ARMv8M的TZ-M与以往的TrustZone不同的是,更加简单,取消了专门的monitor mode,系统是否处于安全模式由当前CPU所运行的区域决定,如果CPU运行在Secure区域则是安全态,运行在Non-secure区域则是非安全态, 具体细节可以看ARM的白皮书。
从SoC的角度来看,除了CPU外,还需要其他部件的配合,总线啊,安全外设,对DMA的处理啊等等。
从应用上看,三表(水电气),智慧城市,汽车电子,U盾,工业自动化等等,都有很大的应用空间。对于普通用户而言,是很难感觉得到变化的。
没有TZ的话,也可以做安全设计,那就是基于MPU和USER/Kernel模式来实现,ARM Mbed中uVisor就是一个这样安全运行时。
对嵌入式系统而言,原有的设计大部分是运行在Kernel模式下的,要改成基于MPU和User/Kernel的安全设计,还是要大动干戈的。有了TZ-M, 则可以比较方便的应用安全设计,只需要重新设计安全部分以及更改非安全部分的一些接口就可以了。
在硬件实现上,TZ并不会增加许多芯片面积。相反可能会简化应用设计,如需要两个独立芯片(一个安全,一个非安全的),可以用一个支持TZ-M的芯片代替。
除了ARM的TrustZone-M外,其他厂家也有相应的安全解决方案,如Synopys的DesignWare ARC SecureShield, MIPS的MIPS-VZ

RISC-V正在成为硅谷、中国乃至全球IC设计圈的热门话题,有人将之比作“半导体行业的Linux”。作为嵌入式生态和移动端芯片的武林盟主,ARM公司自1990年成立以来,一直保持低调。然而最近,ARM因为与RISC-V的纠纷让这家IP巨头成为焦点。

昨天凌晨,全球最大芯片架构(IP)供应商Arm在美国加州圣荷塞举办的一年一度的最大技术年会 Arm TechCon大会宣布推出一项全新的功能Arm Custom instructions,允许客户在特定的CPU内核引入自定义指令功能,从而让客户能够编写自己的定制指令来加速特定的用例、嵌入式和物联网应用程序。

此举一出,Arm无疑增强了芯片合作伙伴的灵活性和差异化,以支持机器学习、人工智能、自驾车、5G 与物联网等全新边缘运算的机会,让其在与完全开放的精简指令集架构RISC-V的竞争中把握主动权,在自己未来5年重回上市的道路上注入了强心剂。在很多读者看来,这是Arm在Risc-V的攻势下做得又一个应对。

RISC-V这个2010年由伯克利研究团队基于自身科研项目而设计的一款CPU全新指令集架构,真的有那么可怕吗?
RISC-V架构的设计哲学就是“大道至简”,在IC繁杂的设计工作中,越简单的设计往往是越可靠的,RISC-V架构就是力图通过架构的定义使得硬件的实现足够简单。其特点在于精简、开源开放、模块化及可定制扩展,RISC-V也成为至今为止最具备革命性意义的开放处理器架构。

不得不说,RISC-V已成为当下最受关注的指令集,不止在全球,尤其是中国更是掀起了热潮。具体表现在联盟的成立、国家政策的支持、企业的布局等等。从目前的情况来看,中国可谓是扛起了RISC-V架构的大旗。

目前国内的平头哥、兆易创新、华米、乐鑫、芯来、格兰仕等众多厂商都有推出基于RISC-V架构的芯片,此外华为也在积极的研发基于RISC-V架构的芯片。

不过,需要指出的是,虽然RISC-V来势汹汹,但是其在高性能这块与Arm的Cortex-A系列内核仍有较大差距,其优势更多还是在于免费、低功耗、易扩展等,这也使得目前RISC-V的应用生态主要集中在物联网领域。对于Arm的威胁也主要是在物联网市场。

早在2017年6月20日,Arm宣布其Cortex-M0/M3处理器内核免收授权费用,版权费也很低。在当时Cortex-M0/M3特别受业界欢迎的时候,Arm毅然放弃授权费,其目的就是要达到实现一万亿的出货量,吸引更多从事IoT的厂商采用Arm的这两个内核。

今年7月,Arm又宣布推出全新的灵活接入(Flexible Access)式IP授权方式——Arm Flexible Access。它允许芯片设计师在为最终的选择支付授权费之前,尝试不同的芯片设计。目的是让人们更容易买得起ARM IP,同时也可以使得客户根据需求评估更广泛的产品。

近日,Arm又发起另一波反击,据Arm中国官方微信报道,Arm首席执行官Simon Segars 在10月9日的Arm TechCon 2019大会中宣布推出Arm Custom Instructions(客制化指令),这是针对Armv8-M架构新增的功能。

2020年上半年开始,客制化指令初期将在Arm Cortex-M33 CPU上实施,并且不会对新的或既有授权厂商收取额外费用,同时让SoC设计人员在没有软件碎片化风险下,得以针对特定嵌入式与IoT应用加入自己的指令。

手机时代已去,物联网俨然已成新角斗场,摩尔定律衰落,以及对边缘计算性能的不断增长的需求,导致了对产品定制和专门化的需求。物联网高度碎片化的市场以及芯片低功耗的要求,RISC-V的搅局让Arm不得不调风转舵,以回击挑战。

2012年3月14日,中国上海——ARM公司今天发布了一款拥有全球最低功耗效率的微处理器——ARM Cortex™-M0+处理器。支持ARMv6M 指令集,该款经过优化的Cortex-M0+处理器可针对家用电器、白色商品、医疗监控、电子测量、照明设备以及功耗与汽车控制器件等各种广泛应用的智能传感器与智能控制系统,提供超低功耗、低成本微控制器(MCU)。
ARM Cortex-M0+处理器为物联网发展奠定基础
作为ARM Cortex处理器系列的最新成员,32位Cortex-M0+处理器采用了低成本90纳米低功耗(LP)工艺,耗电量仅 9μA/MHz,约为目前主流8位或16位处理器的三分之一,却能提供更高的性能。
这种行业领先的低功耗和高性能的结合为仍在使用8位或16位架构的用户提供了一个转型开发32位器件的理想机会,从而在不牺牲功耗和面积的情况下,提高日常设备的智能化程度。
Cortex-M0+处理器的特点促成了智能、低功耗微控制器的面市,并为“物联网”中大量的无线连接设备提供高效的沟通、管理和维护。
低功耗联网功能深具潜能,可驱动各种节能和生活关键应用,包括从无线方式分析住宅或办公大楼性能与控制的感测器,到以电池运作、通过无线方式连接健康监控设备的身体感测器。而现有的8位或16位微控制器(MCU)缺少足够的智能和功能来实现这些应用。
半导体行业调研咨询公司The Linley Group高级分析师、《微处理器报告》(Microprocessor Report)高级编辑,Tom R Halfhill表示:“众所周知,不断改进功耗效率、安全性和便利性的物联网将最终改变世界。从自适应室内照明、在线视频游戏到智能传感器和电机控制,无处不在的网络连接几乎对任何事物都是有益的。但是,实现这一切需要极低成本、极低功耗并拥有良好性能的处理器。ARM Cortex-M0+处理器为轻量级芯片提供了32位的强劲性能,适合于各种工业与消费应用。”
ARM Cortex-M0+处理器是以通过硅晶验证(silicon-proven)、低功耗且成功获得超过50件来自半导体领先厂商授权合作的Cortex-M0处理器为基础,再重新设计加入多个重要新特性,包括单周期输入输出(IO)以加速通用输入输出(GPIO)和外围设备的存取速度、改良的调试和追踪能力、二阶流水线技术以减少每个指令所需的时钟周期数(CPI)、已经优化闪存访问,以进一步降低功耗。
Cortex-M0+处理器不仅延续了易用性、C语言编程模型的优势,而且能够二进制兼容已有的Cortex-M0处理器工具和实时系统(RTOS)。作为Cortex-M处理器系列的一员,Cortex-M0+处理器同样能够获得ARM Cortex-M生态系统的全面支持,而其软件兼容性使其能够方便地被移植到更高性能的Cortex-M3或Cortex-M4处理器。
率先获得Cortex-M0+处理器授权的厂商包括飞思卡尔半导体和恩智浦半导体。
飞思卡尔车用、工业与多元市场解决方案部门高级副总裁兼总经理Reza Kazerounian博士表示:“我们非常高兴能够作为主要合作伙伴与ARM加强合作关系,并第一个获得了ARM Cortex-M系列中体积最小、功耗最低的处理器产品的授权。基于Cortex-M0+处理器的新产品将使我们快速成长中的的Kinetis微控制器(MCU)产品线成为业内基于ARM Cortex架构的最具可拓展性的产品组合之一。Cortex-M0+处理器拥有代码复用能力、更高的性能以及优化的功耗效率,能够帮助设计者从已有的8位或16位架构转型使用最新的Kinetis器件,而无须牺牲成本和易用性。”
恩智浦半导体高性能混合信号事业部执行副总裁、总经理Alexander Everke表示:“恩智浦是业界唯一一家采用了完整ARM Cortex-M处理器系列的微控制器(MCU)供应商,我们感到非常兴奋能够将Cortex-M0+处理器加入我们的产品组合。Cortex-M0处理器产品组合已成功获得市场认可,今天已有超过70种元件类型大量出货中,而最新的Cortex-M0+处理器将进一步加速我们进入8位/16位市场。
ARM处理器部门执行副总裁兼总经理Mike Inglis表示:“Cortex-M0+处理器是ARM领跑低功耗领域的又一例证,同时再一次兑现了其推动行业向更低功耗方向发展的承诺。凭借在低功耗技术上的专业性,我们与合作伙伴为定义新处理器开展了紧密的合作,以确保对现今低成本设备的支持,并同时发掘物联网的潜在优势。”
相关ARM技术支持
Cortex-M0+处理器搭配Artisan®七轨SC7超高密度标准单元资料库和电源管理套件(PMK)最为适合,可充分发挥该处理器前所未有的低功耗特点。
Cortex-M0+处理器具备已整合Keil µVision IDE、调试器和ARM汇编工具的ARM Keil™微控制器开发套件的全面支持。作为全球公认的最受欢迎微控制器开发环境,MDK以及ULINK调试适配器系列均支持Cortex-M0+处理器的全新追踪功能。有了这些工具,ARM的合作伙伴能够获得紧密联系的应用开发环境的优势,并迅速了解Cortex-M0+处理器高性能和低功耗的特点。
这款处理器同时也拥有大量第三方工具和实时系统(RTOS)的支持,包括CodeSourcery, Code Red, Express Logic, IAR Systems, Mentor Graphics, Micrium和SEGGER。

兆易创新(GigaDevice)发布了据称是世界上首款基于RISC-V的通用微控制器(MCU), RISC-V是一款面向物联网(IoT)市场的设备。

兆易创新总部位于北京,是国内规模较大的非易失性存储器(NVM)制造商之一。兆易创新同样声称其新推出的GD32V RISC-V微控制器与基于Arm的经典GD32系列单片机“完全兼容”。

兆易创新高管强调,该公司仍是Arm的战略合作伙伴。添加RISC-V行就是为了提供选项。

几个月前,当特朗普开始对包括Arm知识产权在内的西方技术实施出口管制时,中国电子企业加强了对开源RISC-V的共同关注。然而,RISC-V是一种开源技术,不受类似的限制;对于中国制造商来说,它代表着一种易于获得的选择,可以控制自己的技术命运。

中国制造商使用RISC-V的其他例子包括华米 科技 的AI芯片黄山一号、C-Sky Microsystems的RISC-V第三代指令系统架构处理器CK902和RiVAI AI芯片Pygmy。有别人。

RISC-V为用户提供了非凡的空间。中国工程院院士倪广南在兆易创新的发布会上说:“RISC-V基于标准松散BSD (Berkeley Software Distribution)许可。用户可以自由使用design CPU,也可以开发和添加自己的CPU。他们可以扩展指令集,选择公开发布、商业化销售,或者用其他许可协议替换它,或者使用完全封闭的源代码。”

RISC-V提供了灵活性,但随之而来的不可避免的问题是缺乏一个支持生态系统。RISC-V的生态系统相当有限,特别是与基于广泛可用的Arm和X86架构的MCUs相比。这是否会阻碍RISC-V的进一步发展
中国认为,在解决物联网(本质上是一组新兴的嵌入式市场)问题时,缺乏RISC-V生态系统不是一个大问题。物联网市场仍处于发展阶段,碎片化,客户需求多样化。没有一家公司是固定的,所以生态系统支持不是一个问题。在物联网应用方面,与英特尔和Arm相比,RISC-V在移动、台式机和服务器等更成熟的市场上的劣势要小得多。

中国嵌入式软件协会副会长何晓青在会上表示:“在生态环境中,最难做的事情是移动市场,其次是台式机和服务器。物联网生态系统要简单得多。”

新莱 科技 首席执行官胡振波对此表示赞同。“服务器和台式机的软件生态系统是不可逾越的,但在嵌入式领域,软件生态系统并不像人们想象的那么糟糕,”他说。

兆易创新MCUs的第一行将被命名为GD32VF103。这一行的目标是“主流开发需求”。在介绍中,该公司列出了14款103配置。每一个都是建立在大黄蜂108MHz核心设计与原子核系统技术合作。

这14款机型的主要区别在于不同的闪存容量,以及4种不同的包选项。据该公司称,这些产品都已大规模生产和销售。

兆易创新相信它已经建立了“与RISC-V的桥梁”——为那些一直使用基于arm的MCUs进行设计的公司提供了一条快速切换到基于RISC-V的替代品的途径。该公司表示,两个产品系列之间的“完全兼容性”应确保代码的可重用性,“使跨核心MCU的选择和设计”非常方便。兆易创新表示:“这是我们非常领先的、史无前例的创新。”

兆易创新发布的数据显示,GD32VF103系列单片机在最高频率下的DMIPS为153,在CoreMark基准测试中得分为360分,该公司声称比基于GD32 arm的核心快15%,同时消耗了一半的功耗。
兆易创新相信,它在内存技术方面的专长是一个关键的区别。兆易创新EVP和MCU事业部总经理邓宇举了一个例子:“德州仪器从Arm收购了Luminary,但德州仪器的收购并不成功。Luminary没有Flash基因,所以有些产品会有程序问题。但我们有Flash的经验。我们可以确保此类问题不会发生。”

兆易创新保证,GD32VF103的产品开发速度相当快。市场营销总监金光义表示:“用户可以使用手头的开发工具来实现RISC-V。”

这些工具包括基本IDE(集成开发环境)、调试工具、嵌入式 *** 作系统和云解决方案。当然,也有开发板,包括功能齐全的评估板,针对学习板、电机控制开发板、触摸屏开发板、RC电机驱动板等具体场景的入门级指导。

“我们正在与许多供应商合作,包括软件、中间件、集成开发环境、调试下载工具和终端解决方案的供应商。”金说:“仅仅依靠我们的芯片是不够的。它还需要上游和下游。此外,我们提供一个开放的平台,我们有更多的第三方合作伙伴。我们准备开发一个完整的生态系统。

“我们也是第一个。你可以使用RISC-V通用单片机从头开始解决任何问题。

兆易创新已经出货超过3亿MCU,而且出货速度正在加快;从2亿到3亿的时间比之前的1亿到2亿要短。这些数字包括早期基于arm的mcu。

该公司预计明年将达到4亿美元,并在中国市场占据10%的份额。“RISC-V将推动我们的货运。尽管我们仍需关注市场的实际表现,但我们认为这一出货量是可以预期的。”
通过增加RISC-V版本的Arm MCUs,同时保持与Arm的战略合作伙伴关系,并继续销售基于Arm的MCUs, 兆易创新相信它可以摆脱客户的一站式购物。

“终端客户可以实现不同的形式、不同的应用程序、不同的架构和不同的产品。我们已经有了Arm架构产品;RISC-V是分化的补充。“我们是业内第一家进入RISC-V轨道,为客户提供差异化产品的公司。”

该产品线的下一步是增加对无线的支持。“我们希望加入MCU的连接功能,eRF,将在明年发布第一个加入WiFi连接的产品,”Jin说。

GD32VF103系列已经有了实际应用。例如,在GEZ单片机的微热打印机解决方案中,单片机是GD32VF103C8。该方案可应用于销售点(POS)打印机、税控打印机、自动柜员机等嵌入式微型打印机设备。它在展览会上印刷钞票。
另一个例子是基于GD32VF103C8的USB多点触控设备。以下触摸屏采集触摸信息,通过I2C将其传输给主控芯片GD32VF103C8实现触摸 *** 作,同时可识别1-5个触点。有许多特定的应用程序,包括大屏幕交互显示器、交互 游戏 、智能家居等等。

上面的示例是来自IC Superman的空气净化器解决方案,其中GD32VF103C8负责控制负离子、臭氧和电机等外围 *** 作。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/10672618.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-10
下一篇 2023-05-10

发表评论

登录后才能评论

评论列表(0条)

保存