中国首款嵌入式神经网络处理器诞生

中国首款嵌入式神经网络处理器诞生,第1张

6月20日,张韵东所在的中星微 “数字多媒体芯片技术”国家重点实验室举行新闻发布会称,其发明的中国首款嵌入式神经网络处理器(NPU)芯片诞生,并已于今年3月6日实现量产。

这款被命名为“星光智能一号”的芯片,蕴含了当前计算机领域最前沿的生物人脑神经网络仿生学创新技术,且对严重依赖国外进口产品的中国集成电路产业来说,也是实现“弯道超车”的一次踊跃尝试。它标志着我国在神经网络处理器领域的研究和开发上取得了重大突破;使我国视频监控行业发展由模拟时代、数字时代跨入智能时代,在全球确立领先地位。

“原来的视频处理芯片只是相当于一只‘眼睛’。要把采集到的海量音视频数据传到后台进行识别,再把结果通知给人,没办法做到实时分析。”担任该国家重点实验室执行主任的张韵东比喻说。而“星光智能一号”可以让“眼睛”具备人脑的功能,将后台的智能判断提到了前端,可实时地识别更高级的智慧信息,如身份z号码、车牌号、一个人是谁。

为了了解其对人脸的识别能力,一名男记者现场邀请长相跟他相像的一名工作人员一起“刷脸”。果然,在读取身份z之后,摄像头在不到1秒钟的时间内就判断出工作人员才是本人。

“星光智能一号”之所以能“看懂”这些信息,该实验学术委员会主任杨晓东介绍说,是因为它集成了NPU处理器内核以及国家标准音视频编解码器(SVAC Codec),是全球首颗具备深度学习人工智能的嵌入式视频采集压缩编码系统级芯片。该实验室自主研发的嵌入式NPU,彻底颠覆了采用传统冯诺依曼架构的CPU(中央处理器),赋予其“大脑”一样的分析功能。

当前,人工智能的好戏刚刚揭幕。“卷积神经网络(CNN)算法已成为智能机器视觉领域的研究热点。”该实验室嵌入式人工智能项目组组长昝劲文在接受《中国科学报》采访时说,该算法通过仿生人脑的神经网络,可降低网络模型的复杂程度,在处理海量输入数据、大规模乘累加运算、稀疏权值矩阵等方面具有优势。

然而,传统CPU运行CNN算法效率不高。中星微NPU采用“数据驱动并行计算”架构,使算机的能耗比“至少提高了两三个数量级”,特别擅长处理视频、图像类的海量多媒体数据,使得人工智能在嵌入式机器视觉应用中可以大显身手。

据介绍,中星微每个NPU处理器有4个内核,每个内核有两个数据流处理器,每个数据流处理器有8个长位宽或16个短位宽的SIMD(单指令多数据)运算单元。“这样每个NPU处理器就包含了128个并行处理单元,相当于高速公路上有128个车道并行,让海量数据通过。”张韵东比喻说。这使得每个NPU处理器具有每秒38G Ops(标准化数字标牌接口规范)的长位宽处理能力或76G Ops的短位宽处理能力。

此次,中星微率先在全球实现对该芯片的量产应用,可谓是中国企业实现对国外集成电路产业“弯道超车”的一次成功尝试。在信息时代,集成电路产业已成为全球各国必争的战略制高点。但当前中国该产业形势却相当严峻。工信部数据显示,我国十余年来集成电路进口额长期处于各类商品之首,每年达2000亿元左右。

这种依赖性随时可将中国通信产业置于难以预料的风险之中。例如今年3月7日,中兴通讯因被美国商务部实施出口限制措施而停牌。因该公司对美国零部件和软件供应商的依赖,严重损害了其手机终端和电信设备业务,造成的损失额估计达1000亿元以上。

坚持自主创新原则,重点投入核心技术研发与标准的制定,这是中星微多年来形成的科研模式。成立于1999年的中星微,在2001年开发出第一块具有中国自主知识产权的图像处理芯片“星光一号”,结束了中国无“芯”的历史;在2010年与公安部第一研究所牵头制定了SVAC国家标准,是全球第一个针对视频监控的音视频编解码标准。这两项成果使其两次获得国家科技进步一等奖。

“数字多媒体芯片技术”国家重点实验室成立于2010年,围绕数字多媒体芯片的应用基础和关键技术开展研究。此次中星微推出的神经网络处理器和嵌入式视频监控芯片,正是对“创新驱动发展”的实践。据悉该芯片现已申请16项专利。“今天,我们敢说我们的芯片诞生了,是进行了3年多的开发,每一颗芯片都经过严格的测试。”张韵东说。

根据摩尔定律,集成电路上可容纳的元器件数目,约每隔两年便会增加一倍,性能也将提升一倍。这一发展曲线在超过半个世纪里一直与预测的一样“完美”。然而从2010年开始,这一增长节奏逐渐放缓。

“现在,半导体工艺已经逼近量子尺度,摩尔定律的尽头近在眼前。而传统CPU受限于散热问题,其时钟频率更早趋于上限。”张韵东说。“理论上,极限时钟频率是1000G,但传统CPU受限于散热,达不到10G。否则,芯片过烫、温度过高就没办法正常工作。”

如此一来,人们设想的嵌入式高级机器人还能否实现呢?对此,张韵东表示,后摩尔定律时代有几条不同的路径,一种观点是继续推进摩尔定律,即继续在新型材料、工艺制程和器件结构上努力,将摩尔定律再推进一步,在单位面积上可以实现更高的集成度;另一种观点是超越摩尔定律,即通过系统集成单颗芯片或是多芯片堆叠的方式,实现更多的功能。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/2587670.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-08-08
下一篇 2022-08-08

发表评论

登录后才能评论

评论列表(0条)

保存