中新网杭州8月10日电(苏忠奖 严宁远)计算改变世界,用芯连接未来。8日,杭州嘉楠耘智发布全新量产7纳米芯片,浙江省半导体行业协会秘书长陈光磊、浙江清华长三角研究院副院长、杭州分院院长邵向荣、嘉楠耘智联席董事长孔剑平等为7纳米芯片正式揭幕。
杭州嘉楠耘智被誉为杭州半导体领域黑马,是一家专注于区块链和人工智能集成电路芯片及其衍生设备研发、设计、生产的企业。
浙江省半导体行业协会秘书长陈光磊发布会上表示,嘉楠耘智量产具有超算力、小型化、低功耗、高质量的芯片,对浙江半导体产业的发展和中国创新创业战略具有深远意义。
据了解,嘉楠耘智成立于2013年,专门设计和销售高性能集成线路板,并曾获得浙江清华长三角研究院、趵朴投资、锦江集团等机构的数亿元投资。自2013年,嘉楠耘智成功研发并量产110nm芯片之后,在5年时间内相继成功研发28nm、16nm、7nm芯片,被誉为全球区块链重复计算领军企业。
2015年“嘉楠耘智”设计量产的超算芯片,出货量近1000万颗,在全球新增市场占有率超过30%,并在业内达到世界先进水平。同时,“嘉楠耘智”自主研发的区块链计算设备中的相关软硬件,已经取得了近20项各类知识产权。
此次,嘉楠耘智7纳米芯片相比同等运行的芯片,能耗降低60%,核心体积降低70%,运算能力和运算速度将全力提高,使得在同业的竞争中占据有利地位。
浙江清华长三角研究院杭州分院副院长尹海鹏认为,嘉楠耘智是杭州最具潜力的独角兽公司,将会像阿里巴巴一样成为杭州的金名片。
发布会上工程师罗炎认为,面对智能时代,“未来的电视机会赚钱”,区块链超算技术也将赋能传统家电。为未来人工智能和区块链时代,在家电领域的融合,提供入口级的解决方案。
真的。根据查询相关资料显示,杭州市成功研制出7纳米的芯片,并已经实现量产。该芯片由杭州本土企业杭州嘉楠耘智信息科技有限公司研发并投入量产,不仅是区块链第一个芯片,也是全球半导体第一款7nm芯片。在这个巨大市场潜力的推动下,IP厂商、工具厂商、芯片厂商和系统厂商都争先恐后地涌入这个赛道,其中不乏一些拥有深厚行业积累的厂商。如以ASIC芯片起家的嘉楠 科技 (以下简称“嘉楠”),就是当中一个重要的低调参与者。
从ASIC到RISC-V
众所周知,纳斯达克上市的嘉楠 科技 在ASIC芯片设计方面有深厚的积累,公司在芯片的前后端设计以及流片方面也有丰富的量产经验。早在2016年,嘉楠就成为了国内前十实现10nm芯片量产的公司。也就是从这一年开始,嘉楠开始了在边缘端AI芯片的 探索 。
据嘉楠 科技 董事长兼CEO张楠赓先生介绍,因为ASIC芯片对于计算效率的要求趋近极致,这就需要嘉楠一直在ASIC芯片设计中寻求算力与功耗之间的最佳平衡。因为这个研发过程对技术要求比较高,这无疑间就磨炼了公司的研发团队。与此同时,公司还发现,ASIC在计算效率上相比传统架构有了数量级的提升,这就为嘉楠后续进军RISC-V市场埋下了伏笔。同属计算密集型应用场景的边缘AI芯片就成为了嘉楠的目标。
经历了一番综合考量,嘉楠把目光投向了基于RISC-V的边缘端AI芯片。
嘉楠 科技 董事长兼CEO张楠赓先生
首先,从成本角度看,RISC-V开源免费的特性对于芯片创业公司而言非常友好。选择这一架构,意味着嘉楠可以在AI芯片研发过程中节省大量的IP授权成本,将资源投入到最核心的技术研发,帮助公司加快芯片的迭代速度,灵活应对市场环境的变化。
其次,从技术趋势角度看,RISC-V架构开源、精简和模块化的理念符合未来的技术发展趋势。计算体系结构宗师David Patterson(RISC-V的创始人之一)在ACM通讯上发表的论文中就指出了计算机体系结构的两个机遇,其中一个就是开源的指令集ISA,创建一个“面向处理器的Linux”。从目前来看,RISC-V无疑是开源指令集架构中最成功的一个。
第三,从开发角度看,RISC-V不需要像ARM一样考虑向后兼容,没有 历史 包袱,基础指令只有几十条,学习门槛相对较低;另一方面,RISC-V支持开发者按需拓展指令,这为芯片研发提供了更高的自由度。
第四,从性能角度看,RISC-V架构内核的性能可与ARM内核性能抗衡。
第五,从IP开发角度看,嘉楠从一开始就坚持IP核心自主研发的技术路线,RISC-V架构则提供了这一可能。嘉楠还能以SoC的形式将RISC-V CPU与自主研发的加速组合在一起,为客户提供边缘侧的芯片解决方案。在这一过程中,公司可以把更多精力放在IP核的迭代,而不用考虑可能面临的授权风险。
从市场发展现状看来,嘉楠打造端侧RISC-V AI芯片的做法也是一个明智的决定。
熟悉行业的读者应该知道,根据应用场景的不同,AI芯片的可以粗略划分为模型训练和推理计算。其中模型训练市场已出现巨头垄断的态势,GPU巨头英伟达不仅在硬件方面建立起技术领先优势,而且结合图形计算平台构建了强大的软件生态壁垒,那就意味着这个市场给新晋者的机会并不多。反观推理芯片组市场,则还处于发展早期,特别是边缘侧市场,不同场景对芯片的要求存在差异化,给AI芯片公司留下了更多空间,因此嘉楠一开始就专注于边缘推理芯片的研发。
同时,在边缘侧市场,可穿戴设备、摄像头和传感器等联网设备越来越多。不同物联设备对功耗和算力的要求不同,这就决定很难用单一架构适配所有场景。架构的竞争归根结底是生态之间的竞争。虽然ARM仍然是移动端市场的主流,但RISC-V开源和模块化的特点允许像嘉楠这样的芯片公司基于RISC-V进行定制化的设计,拥有更大的自由度。
此外,从目前的市场环境看,Arm正成为巨头公司争相收购的目标,这对于IP授权的独立性造成了很大威胁。而如果很多组织使用RISC-V设计处理器,就可以在更大层面上推动芯片的创新。所以长期来看,RISC-V的价值在未来会更加凸显,从而为嘉楠带来更多的市场机遇。
奔跑在这条全新的赛道上,自主研发的IP成为了嘉楠最重要的底气之一。
从K210到K510
在拍板进军RISC-V之后,嘉楠就一直坚持依托RISC-V架构,自主研发IP核心的技术路线。
张楠赓表示,公司这样做有三方面板的优势:一方面是为了把核心技术握在自己手里,避免可能面临的授权风险;另一方面,自主开发核心从长期来看可以降低研发成本,并加快芯片的迭代速度;第三,自研可以形成嘉楠自身的芯片设计方法体系,确保核心技术和研发理念的传承。
本着这样的研发思路,嘉楠迄今已经推出了两代自主研发的IP核心,分别为KPU(Knowledge Process Unit)和KPU2.0。这是专门为机器视觉任务设计的神经网络加速。因为异构计算是目前针对深度学习的主流硬件方案,为此在结合CPU与KPU加速后,嘉楠能更好地提升芯片在视觉算法模型上的性能表现。
落实到芯片方面,嘉楠在2018年就推出了公司的第一代产品勘智K210。这款产品在过去几年里也在包括智能园区、智能家居、智能能耗和智能农业在内的多个场景中发挥了重要的作用,公司也与一些行业头部公司开发了智能产品。今年,嘉楠就作为全国大学生OS设计大赛唯一的技术支持方,也为大赛提供勘智K210和开发板作为评估工具。与勘智K210甚至还在美国和日本等国际市场上率先打开局面。
但张楠赓指出,即使K210在不少领域表现抢眼,但由于该芯片的研发时间较早,在算力规划上没有考虑到后来才出现的算法模型,导致产品在应用场景的拓展上受到限制。为此,嘉楠在日前又顺势推出了新一代的中端芯片K510。
据介绍,在全新的勘智K510芯片,继续沿用了双核RISC-V CPU架构中,但嘉楠围绕RISC-V CPU子系统进行了优化。例如该CPU集成了64位的数字信号处理器DSP,配合自主研发的KPU2.0核心为AI应用加速。
此外,DSP内部还设计了专用的本地存储,进一步提升DSP的实际运算性能。研发团队还在双核CPU和DSP之间设计了专用的mailbox模块用于通信,方便软件灵活掌控整个系统。
K510同时还在总线架构、IP核心与视频子系统等多个方面也推出了全新设计。这使其算力相比一代芯片提升了3倍,经典视觉算法mobilenetv1帧率大幅提升,自研高速PHY接口理论带宽也做到了10GB/s,8位数据压缩率更是高达50%以上,极大优化了勘智AI系列在机器视觉场景的应用性能。
为了进一步解决大功耗和大面积的问题,嘉楠在K510芯片上更是采用了NoC总线架构,让每个IP工作在特定的时钟域,解决庞大时钟树的困扰。
在K510的视觉硬件配置上,嘉楠也进行了大幅优化,使其能够支持MIPI CSI2 和DVP接口,可同时支持最多3个摄像头输入。芯片内部还集成了3个图像处理单元ISP, 其中一个ISP支持3D 功能,无需软件参与,硬件完成深度数据的提取和加工,相比软件处理深度信息方式不但节省了巨大的CPU开销,性能上也会有很大提升。
嘉楠同时还提高了K510在摄像头输入接口设计的灵活性,让其既可以硬件流水线方式将摄像头输入送至ISP硬件,也可以把输入图像写入DDR,ISP再通过线下方式读取DDR内的图像完成后续处理。满足用户可以在中间加入定制化的处理需求,或者对定制化的数据进行ISP处理。
值得一提的是,通过融合公司在算法、软硬件和编译器的最新设计,嘉楠推出全新的KPU2.0,集中突破AI芯片设计中广泛存在的“存储墙”和“性能墙”的问题。为了提升计算效率,KPU2.0采用了动态3D PE阵列,第三个维度支持多种方式共享传递数据,并实现多个维度上的计算映射,提高PE阵列的利用率。同时也可以动态开启或关闭每一个2D阵列,并根据不同层级对带宽和计算资源的需求进行调整。
据了解,通过动态3D PE阵列,K510支持多种方式共享传递数据,灵活支持多个维度的计算映射,提高PE阵列利用率。采用GLB(Global Local Buffer)设计,通过可配置的SRAM阵列实现,灵活配置以满足不同数据类型在不同层上的带宽和存储需求,并提升内部RAM的利用率。结合动态3D PE阵列和GLB设计,嘉楠还独创了计算数据流技术,在计算卷积时不需要进行数据重排;通过多级存储设计提升卷积计算的数据复用率。
此外,KPU2.0还搭载了可重构的SIMD加速单元,通过创新的meshnet网络可以灵活配置支持各种激活函数、pooling和resize等算子。
作为一款定位于中高端边缘推理芯片市场,K510无论在核心架构还是外部设备接口方面,都对芯片的视觉处理能力进行了大幅优化。这就使得这个芯片能够在高清航拍、高清视频会议、智能家居、各类机器人以及车载后装智能终端等市场发挥其功用,并占领一席之地。根据公司的规划,未来几年会有多款勘智芯片亮相,助力多个不同的应用和市场。
与全球开发者共同推进RISC-V
虽然在包括嘉楠在内的多个厂商的推动下,RISC-V取得了长足发展。但从过往的 历史 看来,任何一款架构的普及都需要时间。如PC时代的x86架构统治了指令集架构市场几十年,后PC时代才迎来Arm架构的崛起,Arm也用了几十年,才走上了巅峰。换而言之,计算负载的变迁需要经过一个长时间的生命周期。也就是说我们现在虽然已经进入了万物互联时代,给RISC-V创造了机会,但这个新兴指令集来说,也只是迈出了第一步。
再者,现在的指令的发展趋势是开放度越来越高。如Arm崛起的原因很大程度上是因为它引入了更多的市场参与者。同样地,我们也将看到RISC-V作为开源架构标杆对于新一代芯片设计厂商的吸引力,也许未来的英伟达、英特尔就会从这个生态中诞生。为此嘉楠也会持之以恒地投入其中。
张楠赓同时还强调,RISC-V生态还在持续壮大,特别在边缘侧场景中,因为很多业内通行的设计标准和协议标准尚未统一,所以在百家争鸣的现阶段中, 探索 自己独特的技术路线更有意义,这也是作为RISC-V的坚定支持者嘉楠所践行的。
“但我们也应该认识到,将芯片转化为智能产品需要一个过程。与软件不一样,硬件是一段漫长的旅程、很花时间。需要先完成原型,然后客户进行测试,可能还要进行一些反复开发,所有这些事情都会比在Linux上debug花更久时间,也需要在生态上花费更多心思”,张楠赓补充说。
基于以上考虑,嘉楠会坚持依托RISC-V架构进行自主IP核研发的技术路线,为市场带来性能表现更优的芯片。同时,公司也会在软件方面发力,给客户带来更方面的研发体验。
据介绍,通过公司采用统一的AI编译器,勘智系列KPU能支持 TensorFlow、PyTorch和ONNX 模型导入。支持算子融合、稀疏压缩和量化等优化手段,对模型的延迟和带宽进行深度优化。K510同时还支持丰富的网络模型算子,当中包括常见的 CNN、RNN 算子和各类向量计算和数据处理 *** 作。
“嘉楠的成长受惠于开源,公司也将全面拥抱软硬件开源战略。嘉楠已经决定把公司在硬件模块、软件算法的积累,以及芯片手册等基本资料去阿奴共享出来给开发者使用,与全球的开发者共同推进RISC-V生态的繁荣。”张楠赓说。在他看来,推动RISC-V产业的发展,除了有利于公司本身以外。这于中国芯片产业来说,也是有百利而无一害的。
过去,芯片设计有时需要上亿研发费用,投入上百人,但这是中小企业不易承担,而且也不一定能掌握发展的主动权。但开源的RISC-V芯片设计能将芯片设计门槛大大降低,让3到5人的小团队在3到4个月内,只需花几万元便能研制出一款有市场竞争力的芯片,从而将促进芯片产业的繁荣,能更好地支持人工智能等新一代信息技术和数字经济的发展。
张楠赓认为,芯片产业最关键的是人才。在芯片设计门槛降低之后,将会吸引到更多的人才投入这个行业,这有助于奠定本土芯片产业长远发展的人才基础;另一方面,因为x86和Arm架构自身比较封闭,不容易进行创新。
“有了RISC-V之后,本土的一些架构创新的成果也容易以开源的形式进行推广,有助于打造中国在开源芯片领域的话语权。”张楠赓强调。
晶圆 集成电路 设备 汽车 芯片 存储 MLCC 英伟达 模拟芯片
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)