安霸半导体最新推出高性能AI视觉处理器CV5,你了解多少?

安霸半导体最新推出高性能AI视觉处理器CV5,你了解多少?,第1张

Ambarella(下称”安霸半导体”,纳斯达克代码:AMBA,专注人工智能视觉的一家半导体公司)宣布推出 CVflow® 系列最新芯片 CV5,该款人工智能视觉处理器可支持 8K 视频录制或 4 路独立图像输入的 4K 视频流录制。 新 SoC 芯片 CV5 将推动智能汽车摄像系统、消费级无人机、运动相机和 360° 全景相机,以及机器人视觉系统的进一步发展。安霸半导体 CVflow AI 引擎与双核 Arm®A76 处理器的完美集成为各种主流人工智能算法提供卓越性能。CV5 拥有高性能图像信号处理器(ISP),可为视频编码优化以提高人眼观感,同时为机器视觉算法优化以提升准确度。CV5 采用 5 纳米先进制程,拍摄 8Kp30 视频所需功耗低于 2 瓦。

安霸半导体首席执行官 Fermi Wang 表示:“CV5 的问世让安霸半导体可为下一代智能汽车、消费类相机和机器人视觉提供全新革命性解决方案。 我们将性能卓越的 CVflow AI 引擎与 8K 视频录制和多路 4K 视频流录制集于一身,让摄像机拥有优秀的图像处理和新颖的人工智能。”

在汽车视频流远程处理应用中,CV5 可支持多路视频流编码,涵盖前置 ADAS、驾驶员监控、车舱监控及侧视摄像头。借助于 CVflow 人工智能引擎,CV5 可同时运行高级驾驶员辅助系统(ADAS)算法(如车道偏离、前方碰撞预警)以及驾驶员监控算法(如驾驶员疲劳驾驶检测)等。 多路高分辨率视频捕捉与先进的人工智能处理的完美结合,可支持 ADAS 摄像头在远距离以更高精度识别目标物体。

对于那些盈手可握的超低功耗运动相机,尤其是要支持 8K 视频高帧率录制和回放、360 度全景和 VR 的视频设备来说,CV5 是非常理想的解决方案。

在消费级机器人和无人机应用中,CV5 的 CVflow 人工智能引擎可加速 SLAM 运算、实现路径规划、障碍检测、避障,自主定位导航等全自动运作。 具体到无人机航拍,CV5 在执行飞行控制和导航功能的同时,可实现录制高达 8Kp60 的视频。

CV5 与安霸半导体其他 CVflow 系列芯片共享同一套 SDK 和计算机视觉算法优化(CV)工具,简化了各个价格区间和不同性能选项的相机开发流程。 一套完整的机器视觉工具包括了编译器、调试器,并支持行业标准的 PyTorch™、ONNX™、Caffe™ 和 TensorFlow™ 等机器学习框架,以及卷积神经网络(CNN)性能优化完全指南,可帮助客户将自己的神经网络快速移植到 CV5 上。

CV5 芯片关键特征:

· 支持 DNN 的 CVflow 架构

· 双核 1.6GHz Arm®Cortex®-A76 附带 NEON™DSP扩展和 FPU

· 高速 SLVS-EC, MIPI-CSI (C/D PHY)接口,可接入多达 14 个摄像头

· 多通道 ISP,处理能力高达 8KP60

· 原生支持 RGGB、RCCB、RCCC、RGB-IR 和单色传感器

· 多重曝光高动态范围(HDR)处理

· 实时硬件加速的鱼眼镜头畸变校正(LDC)

· 支持多码流,高达 8Kp60 的 AVC 和 HEVC 编码

· 多种外设接口,包括 4 通道 PCIe、CAN FD、千兆网口、USB 3.1(主/从模式),三个 SD 卡控制器,MIPI DSI/CSI-2 和 HDMI 输出

· 支持高达 32GB 的 LPDDR4x / LPDDR5 / LPDDR5x, 64 位数据总线

· 可实现设备信息安全包括安全启动,支持 TrustZone®、TRNG、OTP、内存隔离,内存加密和虚拟化

· 5nm 制程

· 16×16 FBGA 封装,球间距 0.5 mm

关于Ambarella(安霸半导体)

Ambarella 的产品广泛应用于人类和计算机视觉领域,包括视频安防、高级驾驶辅助系统(ADAS)、电子后视镜、行车记录仪、驾驶员及舱内智能监控、汽车无人驾驶和机器人应用等。Ambarella 的低功耗处理器可用于智能摄像机设计,支持超高清图像处理、视频压缩、深度神经网络加速,可从高分辨率视频中提取有价值的数据。

原子层沉积 (Atomic layer deposition,ALD) 是一种高度可控的薄膜合成工艺,可制造出只有一个原子厚的薄膜。广泛应用于计算机芯片、太阳能电池、锂电池等领域。很多企业常用 ALD 来制造半导体器件。ALD 的灵活性和多样性给确定工艺参数带来了重大挑战,但仍需要专家的直觉和耗时的反复试验来确定最佳工艺参数。

最近,来自美国能源部(DOE)阿贡国家实验室的研究人员 描述了多种基于 AI 的方法来自动优化 ALD 工艺。详细说明了每种方法的相对优势和劣势,以及可用于更有效、更经济地开发新流程的见解。

该研究以《用于优化原子层沉积的智能代理》「 Intelligent Agents for the Optimization of Atomic Layer Deposition 」为题发表在《 ACS Appl. Mater. Interfaces 》杂志上。

前沿,但也面临挑战

ALD是一种工艺,通过前驱体蒸气和基板表面之间的一系列自限反应,在基板上沉积原子厚度的均匀薄膜。ALD 可访问大量的元素和化合物目录,元素周期表中超过一半的元素在出现在ALD过程中。

ALD 擅长在复杂的 3D 表面上生长精确的纳米级薄膜,例如在硅晶片上形成图案的深而窄的沟槽,以制造当今的计算机芯片。 这促进了科学家为下一代半导体器件开发新的薄膜 ALD 材料。

然而,开发和优化这些新的 ALD 工艺是具有挑战性和劳动密集型的。研究人员必须考虑许多可以改变这一过程的不同因素,包括:分子前体之间的复杂化学反应;反应器设计、温度和压力;前驱体剂量和吹扫时间

为了找到克服这些挑战的方法,阿贡科学家评估了 三种新型优化策略 :(a)随机选择气体时间;(b) 基于高斯过程代理模型的贝叶斯优化 (BO),以及 (c) 基于规则的专家系统方法,利用人类策略和物理直觉。值得注意的是, 后两种使用不同的 AI 方法,且以前从未应用于 ALD。

Table 1 列出了该研究的四种ALD 工艺模型:Al2O3 在 200 下使用三甲基铝 (TMA) 和 H2O,Al2O3 在 100 下使用 TMA 和 H2O,W 在 200 下使用六氟化钨 (WF6) 和乙硅烷 (Si2H6),TiO2 使用钛 (IV) 异丙醇 (TTIP) 和 200 下的 H2O。

敏感性分析

在比较所有四种ALD工艺模型的三种优化策略之前, 了解关键超参数对成本函数和优化性能的影响非常重要。 可确保在平等的基础上比较优化策略。以在 200 下生产 Al2O3 薄膜为例,研究ALD 系统的效果。

专家系统方法对关键超参数的值很敏感。 首先,专家系统策略需要指定一组起始时间。尝试了多种分配初始时序的方法,包括使用统一时序(所有时序相同)和随机时序(时序在优化边界之间随机初始化)。 探索 发现统一的初步计时产生了可靠的性能。

此外, 专家系统优化策略对给定时序所采用的重复 ALD 周期数也很敏感。 相比之下, 贝叶斯优化策略对采用的重复次数相对不敏感。

优化策略比较

研究人员通过比较他们如何优化 ALD 中使用的两种前驱体的剂量和清洗时间来评估他们的三种策略。加药时间(dosage time)是指前体加入反应器的时间,而吹扫时间是指去除多余的前体和气态化学产品所需的时间。

目标: 找到可以在最短的时间内实现高且稳定的薄膜生长的条件。 科学家们还使用代表反应堆内 ALD 过程的模拟来判断他们收敛到理想时间集的速度策略。

将他们的优化方法与模拟系统联系起来,让他们能够根据优化算法生成的处理条件,在每个循环后实时测量薄膜的生长情况。

研究人员比较了四种 ALD 工艺的三种优化策略的性能。通过比较了 Al2O3 薄膜在 200 C 下0.1%和10%噪声水平下生长的优化策略性能。研究表明: 在这两个噪声水平上,贝叶斯优化的性能最好,其次是专家系统,然后是低测量噪声的随机策略,高测量噪声的反向策略。

除了考虑给定优化算法在接近一组最优 ALD 时序时的效率之外,实际考虑也很重要,例如 CVD 类型生长(如果选择了不适当的低吹扫时间),从而使反应器结垢,对 ALD 反应器安全可靠运行的影响。实验表明:专家系统方法完全避免了不受控制的生长,而随机优化策略则始终对产生过量CVD型增长的条件进行采样。贝叶斯优化方法在避免大增长率方面做得更好。

研究得出: (1)随机优化(RO)在其他两种策略的优化时间质量不确定性较大的情况下表现良好,导致处理空间 探索 过程中GPC值过高。(2)贝叶斯优化(BO)可靠,性能好,不需要超参数调优。然而,在早期和后期的循环中,BO受到GPC值过高的影响。(3) 专家系统优化 (ESO) 可靠且安全,但前驱体剂量次数过于保守。

一劳永逸 (Set it and forget it)

「所有这些算法都提供了一种更快地收敛到最佳组合的方法,你不必像今天通常那样花时间将样品放入反应器中、取出样品、进行测量等。相反,你拥有实时与反应堆连接的回路。」该研究的合著者、Argonne 首席材料科学家 Angel Yanguas-Gil 说。

这种设置还通过形成一个闭环系统使两种 AI 方法的过程自动化。

尽管存在一些弱点,但人工智能方法有效地确定了不同模拟 ALD 工艺的最佳剂量和清洗时间。 这使得这项研究成为第一批表明使用 AI 可以实时优化薄膜的研究。

研究人员表示: 在未来的工作中,除了改进现有的算法外,还希望将这些方法扩展到包括反应堆温度和前驱体分压。

「这是令人兴奋的,因为它开辟了使用这些类型的方法来快速优化实际 ALD 工艺的可能性,这一步骤可能会在未来开发新应用时为制造商节省宝贵的时间和金钱。」Jeff Elam 总结道。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/8736388.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-20
下一篇 2023-04-20

发表评论

登录后才能评论

评论列表(0条)

保存