Intel的FPGA和SoCs FPGA进行设计和开发

Intel的FPGA和SoCs FPGA进行设计和开发,第1张

  FPGA 选件高级概述

  市场上有许多不同类型的 FPGA,每种类型都有不同的功能和特性组合。可编程结构是任何 FPGA 的核心,它以可编程逻辑块阵列的形式呈现,也称为逻辑元件 (LE)(图 1(a))。FPGA 结构可进一步扩展,以包括 SRAM 块(称为块 RAM (BRAM))、锁相环 (PLL) 和时钟管理器之类的东西(图 1(b))。此外,还可以添加数字信号处理 (DSP) 块(称为 DSP 切片)和高速串行器/解串器 (SERDES)(图 1(c))。

  

 

Intel的FPGA和SoCs FPGA进行设计和开发,pYYBAGLnTLWAPiVJAAarYbJAJRk089.png,第2张

 

图 1:最简单的 FPGA 仅包含可编程结构和可配置通用 IO (GPIO) (a);不同架构是在此基本结构上增加其他元件而形成:SRAM 块、PLL 和时钟管理器 (b);DSP 块和 SERDES 接口 (c);以及硬处理器内核和外设 (d)。(图片来源:Max Maxfield)

  外设接口功能(如 CANI2C、SPIUARTUSB)可以实现为可编程结构中的软内核,但许多 FPGA 将其作为硬内核在硅片中实现。同样,微处理器也可以实现为可编程结构中的软内核,或作为硬内核在硅片中实现(图 1(d))。具有硬处理器内核的 FPGA 称为片上系统 (SoC) FPGA。不同 FPGA 针对不同的市场和应用提供不同的功能、特性和容量集合。

  FPGA 供应商有很多,包括 Intel(收购了 Altera)、Efinix、LatTIce Semiconductor、Microchip Technology(收购了 AtmelMicrosemi),以及 Xilinx。

  所有这些供应商都提供多个 FPGA 系列:有的提供 SoC FPGA,有的提供面向人工智能 (AI) 和机器学习 (ML) 应用的器件,有的则提供适用于航天应用的耐辐射器件。由于产品系列众多,每个系列提供不同的资源,因此为眼前的任务选择最佳器件可能很棘手。

  Intel FPGA 和 SoC FPGA 介绍

  Intel 提供各种各样的可编程器件产品,性能和功能从中等到极高都有,并涵盖传统 FPGA 到 SoC FPGA(即,将 FPGA 可编程结构和一种或多种强化处理器内核结合在一起的器件)。

  Intel 的产品系列当前有五个主动 FPGA 系列,包括 Max 10、Cyclone 10,和 Arria 10(图 2)。Intel 还提供极高端的 StraTIx 10 及其更新的最先进 Agilex 器件。

  

 

Intel的FPGA和SoCs FPGA进行设计和开发,poYBAGLnTL-AdPdrAADNgJ3nnNM598.png,第3张

 

图 2:在 Intel 的五个 FPGA 系列中,其中三个(从成本最低 (Max 10) 到最高容量及性能 (Arria 10))的目标应用和市场覆盖从板卡管理和 I/O 扩展,一直到嵌入式视觉和军事/国防。StraTIx 10 和更新的 Agilex 器件进一步提升了性能。(图片来源:Max Maxfield)

  Intel 的 Max 10 FPGA 集成片载 NOR 闪存,以提供 FPGA 配置。其他产品系列有基于 SRAM 的配置单元,并且会在上电时从板载外部存储器件或系统的其他位置(如在外部处理器的控制之下)加载配置。除 MAX 10 系列以外,所有其他 Intel FPGA 系列都可作为 FPGA 或 SoC FPGA 的形式提供,并与强化微处理器系统集成。

  MAX 10 FPGA 的集成功能包括模数转换器ADC) 和双通道配置闪存,后者可提供在单个芯片上存储与动态切换两张图像的功能。MAX 10 FPGA 还具有 Nios II 软核心处理器支持、DSP 块和软双倍数据速率 3 (DDR3) 存储控制器。

  MAX 10 产品组合中的代表性器件是 10M16SCU169I7P。该产品具有 16,000 个逻辑单元和 130 个输入/输出 (I/O),而且总 RAM 位数为 562,176。Intel 的 EK-10M08E144 是适用于 MAX 10 的评估板,另一个是 HINJKIT,这是 Alorium Technology, LLC 的 FPGA 物联网传感器集线器开发套件(图 3)。尤其值得关注的是,HINJKIT 的 MAX 10 FPGA 包括 Alorium Technology 的 AVR 兼容 8 位微控制器,使 HINJKIT 能与 Arduino IDE 配合使用。该板还可为第三方物联网载板、模块和配件提供高度的接口灵活性。

  Intel 的 Cyclone 10 GX FPGA 提供 12.5 GB 基于收发器的功能、1.4 Gbit/s 低压差分信号 (LVDS),以及适用于最高 1,866 Mbits/s 数据速率的高达 72 位宽 DDR3 SDRAM 接口。Cyclone 10 GX FPGA 针对机器视觉视频连接和智能视觉相机等高带宽性能应用进行了优化。

  与之相比,Cyclone 10 LP FPGA 则针对低静态功耗、低成本应用进行了优化,例如 I/O 扩展、传感器融合、电机/运动控制、芯片到芯片桥接以及控制应用。GX 和 LP 器件系列都支持垂直迁移,使设计人员从一个器件开始着手设计,然后在未来迁移到相邻密度。

  Cyclone 10 产品组合中的代表性器件是 10CL006YU256A7G。该产品具有 6,272 个逻辑单元和 176 个 I/O,而且总 RAM 位数为 276,480。相关的开发和评估板及模块还有很多,包括 P0496 DE10-NANO Cyclone V SE SoC 套件(图 4)、P0553 TSoM Cyclone V SE 评估板(也基于 Cyclone V SoC FPGA)和 P0581 TSoM Cyclone V SE FPGA 评估板,它们都是 Terasic Inc 的产品。(注意,这些板上的 Cyclone V FPGA 是 Cyclone 10 系列的较早期产品。)

  Arria 10 器件基于 TSMC 的 20 纳米 (nm) 工艺技术,将双核 Arm Cortex-A9 MPCore 硬处理器系统 (HPS) 与可编程结构组合在一起,该结构还包括强化浮点 DSP 块。Arria 10 还装载了嵌入式高速收发器、硬存储控制器,以及协议知识产权 (IP) 控制器,全都包含在单个高度集成的封装中。

  Arria 10 产品组合中的代表性器件是 10AX022C4U19E3SG。该产品具有 220,000 个逻辑单元和 240 个 I/O,而且总 RAM 位数为 13,752,320。Intel 的 DK-DEV-10AX115S-A Arria 10 GX FPGA 评估板(图 5)是开发此 FPGA 的合适平台。该板让设计人员能够开发与测试基于 Arria 10 的 PCI Express (PCIe) 3.0 设计;开发与测试由 DDR4、DDR3、QDR IV 和 RLDRAM III 存储器组成的存储器子系统;并且通过使用 FPGA 夹层卡 (FMC) 连接器连接到由 Intel 合作伙伴提供的 FMC 夹层卡,来开发模块化的可扩展设计。

  Intel 的 StraTIx 10 FPGA 和 SoC FPGA 采用 Intel Hyperflex FPGA 架构。此器件产品线中的 FPGA 可应对高吞吐量系统的需求,其具有最高 10 TFLOPS 的浮点性能,并支持从 28.3 Gbits/s (GX) 到 57.8 Gbits/s 收发器,后者在最多 144 个收发器通道中,能够满足 5G 通信、云计算、网络虚拟化和光纤传输网络的带宽要求。产品变体包括 PCIe Gen4 接口,最高能以每秒传输 16 GB 的速度 (GT/s) 提供 x16 配置,以及一种可支持特定 Intel Optane DC 永久性存储器的全新存储控制器。

  Intel 的 DK-DEV-1SGX-L-A Stratix 10 GX FPGA 评估板(图 6)支持利用 Stratix 10 产品线进行开发。该板让设计人员能够开发与测试基于 Stratix 10 的 PCI Express (PCIe) 3.0 设计;开发与测试由 DDR4、DDR3、QDR IV 和 RLDRAM III 存储器组成的存储器子系统;并且通过使用 FPGA 夹层卡 (FMC) 连接器连接到同样由 Intel 合作伙伴提供的 FMC 夹层卡,开发模块化的可扩展设计。

  使用 Intel 的 FPGA 和 SoCs FPGA 进行设计和开发

  在本 FPGA 系列文章的第 1 部分中,我们指出这些器件的传统设计方法是让工程师使用 Verilog 或 VHDL 等硬件描述语言 (HDL),在抽象级别(即寄存器传送级 [RTL])上捕获设计意图。首先可以对这些 RTL 描述进行仿真,以验证其是否符合要求,然后将其传送给综合工具,生成用于对 FPGA 进行配置(编程)的配置文件。

  抽象的下一步是捕获设计意图,主要是使用 C/C++ 之类的编程语言或 SystemC 这样的特殊实现工具;后者是一组 C++ 类和宏,可提供事件驱动的仿真接口。这些方法有助于并发进程的仿真,每个进程都使用简单的 C++ 语法进行描述。对于此类描述,可以通过像常规程序一样运行来进行分析和配置,然后传递给高级综合 (HLS) 引擎,由该引擎输出 RTL,而 RTL 会传输至常规综合引擎。

  Open CL(开放运算语言)在概念上更加抽象,该框架适用于编写可跨异构平台执行的程序。除了 FPGA,这些平台还包括中央处理单元 (CPU)、图形处理单元 (GPU)、数字信号处理器 (DSP),以及其他处理器或硬件加速。OpenCL 指定用于为这些器件进行编程的编程语言(基于 C99 和 C++11),并且指定应用程序编程接口 (API),以对平台进行控制并在运算设备上执行程序。

  对于 Intel FPGA 和 SoC FPGA,用户使用 Intel 的 Quartus Prime 设计软件为所有产品系列开发设计。该软件分为三个版本:Quartus Prime Pro Edition、Quartus Prime Standard Edition 和 Quartus Prime Lite Edition。Pro 和 Standard Edition 需要付费许可证,而 Lite Edition 可供免费下载

  Pro Edition 经过优化,可借助 Agilex、Stratix 10、Arria 10 和 Cyclone 10 GX 器件系列支持下一代 FPGA 和 SoC FPGA 中的高级功能;Standard Edition 广泛支持 Cyclone 10 LP 器件系列及其他更早期的器件系列;而 Lite Edition 可免费下载而无需许可证文件,为大容量器件系列提供理想的切入点。

  Intel 提供各式各样的其他设计工具和资源,包括 Intel DSP Builder、Intel 高级综合 (HLS) 编译器,以及 Intel FPGA SDK for OpenCL。

  Intel Distribution of the OpenVINO Toolkit 也非常实用,可帮助开发人员构建人工智能 (AI)、计算机视觉、音频、语音和语言应用程序,实现从边缘至云的深度学习推理。除了 FPGA,该工具套件还支持使用常见的 API,跨 Intel 架构和 AI 加速(CPU、iGPU、Intel 的 Movidius 视觉处理单元 (VPU) 和 Intel 的 Gaussian & Neural Accelerator (GNA))异构执行。该工具套件由基于 Cyclone V GT FPGA 的 OpenVINO 入门套件提供支持。

  总结

  最佳处理设计解决方案常常是由处理器与 FPGA 的组合提供,或由 FPGA 单独提供,或以硬处理器内核作为部分结构的 FPGA 提供。作为一项技术,FPGA 多年来发展迅速,能够满足灵活性、处理速度、功耗等多方面的设计需求,非常适合智能接口、机器视觉和人工智能等众多应用。

  Intel 提供从低到极高范围、从传统 FPGA 到 SoC FPGA 的可编程器件产品。如上所述,要使用此类器件进行设计,Intel 和其他第三方都提供强大的开发套件和工具,以满足硬件开发人员、软件开发人员以及人工智能和计算机视觉系统构建者的需求。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/2710893.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-08-17
下一篇 2022-08-17

发表评论

登录后才能评论

评论列表(0条)

保存