我们多维度解读了海康威视的产品结构及详细分析了公司供应链情况,公司目前前端摄像头产品基本能实现国产化,中后端产品的供应链去美化难度高于前端设备,可寻找次优供应链替代方案。我们仍然看好公司的长期发展,维持“买入”评级。
多维度解读海康威视产品结构。
地区维度:2018年海康国内外营收占比分别为715%、285%,其中美国市场占比约5%;产品维度:2018年海康前、中、后端营收占比为54%、18%、14%;销售模式维度:根据我们测算,海康威视的纯硬件销售占比近四成,解决方案销售占比近五成;备货维度:公司截至2019Q1末的存货金额接近60亿,存货占比近10%,18年全年的存货周转率约515,周转天数约70天。
海康威视产品的供应链情况研究。
前端摄像头产品:编解码芯片、镜头等主要元器件基本实现国产化;AI芯片基本具备国产化能力;电源管理芯片目前部分采购自美国供应商,非A厂商具备替代方案。安防镜头的采购:以国内的舜宇光学 科技 、联合光电、福光股份等为主;CMOS传感器的采购:国内豪威 科技 (韦尔股份)、格科微等,高端部分来自索尼等;编解码芯片的采购:IPC以海思为主,ISP以富瀚微为主,国内厂商均占主流;电源管理芯片的采购:以TI、安霸等国际厂商为主,公司正积极导入非A供应商;新加入的AI芯片:实验室阶段主要采购英伟达GPU,目前国内的海思、寒武纪等厂商已可提供替代的SoC产品方案。
中后端产品:供应链去美化难度高于前端设备,可寻找次优供应链替代方案。
DVR/NVR芯片:供应商以海思为主。存储硬盘:安防主要采用机械硬盘,主要采购自希捷、西数,可采用高成本SSD方案替代。服务器CPU:公司目前服务器以x86架构为主,CPU供应商主要为Intel;国内厂商兆芯、海光正研制x86架构CPU,目前已有产品落地,性能上较国际大厂仍有距离;华为基于鲲鹏920芯片推出泰山服务器( ARM架构)。
投资策略。
我们长期仍看好公司视频安防领域智能化进步带来的放量,预计新业务爆发式增长将带来新的业绩增长点。我们维持2019/20/21年EPS预测137/167/204元,考虑到公司费用端全年承压,国际局势动荡等因素,我们按照2019年PE 25倍,给予目标价3425元,维持“买入”评级。
风险因素:
国际局势动荡,核心零部件禁运,公司费用率上升,下游需求疲弱,汇率风险等。寒武纪芯片性能对比没有碾压苹果芯片。就像CPU和显卡GPU,二者各司其职。寒武纪的人工智能芯片,是专门为了“人工智能”、“智能识别”算法而设计的。所以在这类特定任务上,一定是最强的。用CPU去玩游戏,肯定没有GPU玩游戏爽,因为GPU是为游戏特殊定制的。
未来的手机,智能要求越来越多,越来越多功能需要“人工智能类芯片”,比如:图像处理、人脸识别、围棋博弈、视频处理、信息推荐、指纹解锁。所以,如果搭载了人工智能芯片,速度就会快特别多。
所以以后都是这种配置(在大手机芯片中,内嵌人工智能芯片模块),当遇到人工智能类算法时,就用人工智能芯片模块处理,常规的 *** 作,还是用原来的芯片。
显然,未来也许会出现一体式设计,就是手机芯片已经不分传统和人工智能了,融合了。
到那时,这个东西越来越快。华为这周末搞了件不大不小的事——发布了“世界首款手机AI芯片”麒麟970——各位科技媒体小编都辛苦了,大周六晚上的不是飞去德国跑会就是在电脑前蹲直播,连约会都要改期,好气哦。
咳,言归正传。
华为为了抢这个“世界第一”着实花了不少心思,作为一个以“自研”为骄傲的企业,本次麒麟970上不仅使用的是别家的(寒武纪的)神经网络处理单元(NPU),智东西还独家获悉到,麒麟970在物体识别方面的一整套嵌入式AI解决方案(从算法+Camera Tuning)都来自中科创达。
此外,据业内人士透露,寒武纪的AI架构在麒麟970上实现的梳理也并非全部是华为海思自研的技术。
这款芯片打造了多少个月?仅是加了一个NPU模块就能叫“AI芯片”吗?为什么华为要这么紧赶慢赶抢“第一”?联发科、深鉴科技等业内人士又是怎么看待麒麟970?……以上种种疑问,智东西将为你一一揭晓。
一、参数轰炸
麒麟970的参数想必大家已经被刷屏了一遍又一遍,但为了文章完整性这里还是不能免俗地需要列一列数据,看过的读者可以直接跳过这段:
众所周知,目前九成的手机芯片采用的是ARM的架构,麒麟970也不例外。麒麟970采用ARM Cortex-A73四核+Cortex-A53四核的架构,采用了台积电10nm制造工艺,搭载12核高效GPU、8核高性能CPU,45G高速LTE Modem,支持LTE CAT18,最高下载速度可以达到12Gbps,与高通目前发布的最强的X20 LTE基带实力相当。
特别值得一提的是,麒麟970的GPU用上了ARM最新推出的Mali-G72 MP12架构——这是Mali-G72 MP12 GPU的首次商用。这个架构很厉害,比上一代的Mali-G71性能提高了40%,能效提高了25%。
但如果抛去数据,一个小细节能让你更直观地理解它:在智东西跟某移动端大咖聊天的过程中,他对NPU、10nm统统只是点头微笑,唯有在看到MP12 GPU小小地惊讶了一下。
与此同时,麒麟970拥有两个用于处理图像信息的ISP,能够更快速地响应处理,并且能在低光照度环境下对降噪进行优化。
由中科创达提供的智能拍照技术则将自动识别镜头内的物体(比如一朵静止小花又或是一个奔跑的人类),系统根据该物体的属性调整相机参数或是进行主动去糊。
麒麟970会搭载在将于10月16日于慕尼黑发布的华为Mate 10手机上。
二、寒武纪?何方神圣?
既然一直在说“寒武纪”的NPU,那么这个寒武纪究竟是何方神圣呢?
寒武纪科技(Cambricon)是中科院计算所孵化出来的AI芯片创业公司,中科院计算所不仅对寒武纪进行了天使轮融资,同时还给与了长期的支持与投入。8月底,寒武纪宣布完成了1亿美元的A轮融资,投资方为国投创业、阿里巴巴、联想等,一跃成为国内AI芯片届当之无愧的独角兽。
不仅如此,寒武纪的两位创始人也非常神奇——一对出身中科院的兄弟。哥哥陈云霁目前仍在中科院计算所担任研究员,从事基础科技研发,弟弟陈天石则当起了公司的CEO。
不过,很长一段时间,寒武纪这家公司一直以“研究性”企业被业内所知,说白了就是没有产品出来。直到去年4月份的世界互联网大会期间,宣告自己的第一款AI芯片产品寒武纪1A流片了,这一点不断拿来背书,新闻联播、人民日报都说了这事;不过之后其产品到底有没有商用,有没有量产,并没有官方说法,按照2016年底寒武纪CEO 陈天石的说法,“芯片从研发、量产到商用,是一个以年为单位的周期,所以在明年,大家将可以在市面上看到使用寒武纪技术的芯片产品,比如在手机、安防监控等智能终端和云端服务器上。”
不过根据中国科学院计算技术研究所发布的贺信显示,麒麟970芯片上的NPU正是集成寒武纪1A处理器作为其核心人工智能处理单元,实现了手机上本地、实时、高效的智能处理。这也是寒武纪1A真正意义上的一次产品化应用。
不过话说回来,恐怕也只有华为这个量级的土壕,才有能力让寒武纪1A真正产品化,从这一点看寒武纪是抱上了一个不错的大腿。
三、到底什么是“AI芯片”?
上文提到,麒麟970之所以敢叫自己“AI芯片”,最主要的就是集成了寒武纪的NPU(Neural-Network Processing Unit,神经网络处理器。
现在所谓的手机处理器,比如高通的835、苹果的A11、麒麟970等,实际上所指的是一个“处理器包”封装在一起,这个计算包专业一点说叫Soc(System-on-a-Chip),高大上的说法是“计算平台”;根据分工不同,很多专用功能的处理单元加进来,比如我们最熟悉的是GPU,现在这个包里的独立单元数量已经越来越大,比如ISP(图像处理)、Modem(通信模块)、DSP(数字信号处理)等,不同的数据进来,交给不同特长的计算模块来处理,这个NPU就是手机处理器平台新加入的一个擅长神经网络计算的单元,那么到底哪些应用会用到神经网络计算?也就是现在最能代表人工智能计算的一些应用,比如模式识别里的语音、图像(人脸)识别,比如其他会用到深度学习的一些AI应用。
为了让这个深度神经元网络连接更快,“寒武纪1A”还设计了专门的存储结构,以及完全不同于通用处理器的指令集。“它每秒可以处理160亿个神经元和超过2万亿个突触,功能非常强大,功耗却只有原来的1/10。
有时候,有些计算单元会独立出来,不封装在SoC里,比如观察苹果iPhone的主板结构,其Modem模块就一直独立在其A系列处理器模块之外;寒武纪的这个NPU单元之前也是一个独立的处理器单元,只是这次整合封装到了麒麟970的Soc里面。
虽然芯片里的CPU、GPU、DSP都可以用来做运算,但是NPU是专门用于神经网络架构计算的,号称比CPU快25倍的同时效率将提高了50倍。有点类似于你想要剪东西,我给你一把剪刀。
至于为什么用的是寒武纪的NPU呢?主要原因是目前国内能做AI芯片级别的公司只有那几家,而寒武纪是中科院出身,和华为的合作自然也是顺理成章。中科院计算自己也表示,计算所自2011年以来就和华为展开合作,组建了“中科院计算所-华为联合实验室”。
不过,也没有说现在其他芯片的CPU+GPU+DSP架构在人工智能应用方面效果差到哪里去了,恰恰相反,现在的众多手机厂商都在这个架构上对AI功能进行优化。从高通骁龙到联发科Helio,无不在人工智能的芯片应用上进行了大力优化。比如高通在骁龙800和600系列芯片上做了一个软件的神经处理引擎,高通也承诺未来也会出专门用来做神经网络运算的核——比如NPU。
所以说,这个NPU,重要,但也没那么重要。以深度学习为例,深度学习分为训练(Training)和推理/应用(Inference)两部分,训练阶段的确需要非常高的计算能力,但在应用层面其实并不需要巨大的计算量——相信没有哪个纯真的用户拿手机去做Training的。
另一方面,AI不AI,最终还是得看应用嘛……需要整个移动AI应用的生态起来了,才能体现出硬件的优势。
同为手机芯片制造商,联发科的一位产品技术负责人也认为,在芯片上集成硬件相对容易,关键还是上层的应用,用户不会在意这个是不是AI,只会在意体验。
虽然华为展示出了三个常见应用方向(AR、计算机视觉、自然语言处理),还动用了开发者网页、开发者工具包、应用商店来招揽开发者,华为消费者业务CEO余承东也在发布会现场承诺,华为将打造一个开放的AI环境,开发者可以直接接入华为NPU功能,也可以通过第三方AI框架接入(目前支持TensorFlow和Caffe)。
不过,就目前来看,移动AI应用开发还很少,华为现场展示的AI功能也集中在降噪、拍照美化等方面,快则快矣,没有什么鸡蛋。在应用缺失的情况下,麒麟970、骁龙835、甚至性能再弱些的芯片使用起来也会让用户感觉相差不大。
四、为了这个“世界第一”煞费苦心
不知道大家还记不记得,去年12月16日,华为旗下手机品牌荣耀推出了2016年最后一款旗舰手机——荣耀Magic。
荣耀总裁赵明在讲述这款荣耀3周年的特殊新产品的过程中,全程未提硬件配置,只谈了这款手机的八曲面外形设计和搭载由华为2012实验室研发4年的人工智能引擎Magic Live。
除了2012实验室外,华为旗下还有诺亚方舟实验室、高斯实验室、香农实验室,华为没有透露本次麒麟970使用的人工智能技术是否来自这些实验室,但从目前看来主要是这几个部门在研发。
不过,仅从深度学习来说,华为的技术并不算领先。这也是为什么虽然华为海思方面非常想要自研“AI芯片”,但为了来得及抢上这个“世界第一”的名头,最终选择了和寒武纪、中科创达合作。
一位业内人士对此的评价是——“从急促的拍板签下IP核合同,到和Mate 10分开,赶在苹果之前发布这款芯片,时间上感觉有点赶鸭子上架。”
那么华为这个“世界第一”真的要抢得这么急吗?
真的要。
据传言,这次麒麟970的项目做了大概4-5个月,其中包括了寒武纪、中科创达方面的技术整合、以及流片。从速度来说真的很快,一方面是华为干脆果断的行事作风体现,另一方面也侧面证明了这个“世界第一”真的很急。
据了解,台积电下半年的生产线上已经有超过30款“AI芯片”的代工排期了。虽说并不全都是手机芯片,但可以看得出这的确是一股潮流趋势。这一趋势在智东西和业内人士交流过程中也感受颇深。
五、业内声音:AI芯片是趋势
同为手机芯片商,联发科的一位产品技术负责人告诉智东西,“AI芯片”确实是目前的行业趋势之一,随着手机差异化越来越少,久而久之NPU将会变成“大家都得有”的东西。
在智东西此前跟荣耀掌门人赵明的对话中也可以感受到,互联网手机的竞争正从之前的网络营销、网络销售变成更技术化的比拼,在后互联网手机的时代,人工智能正成为核心竞争点之一。
从深度学习芯片层面,与寒武纪类似,国内还有另一家专注于“AI芯片”的明星创企——深鉴科技——虽然说他们做“AI芯片”严格意义上是不对的,他们做的是用于深度学习推理应用(Inference)的FPGA板卡(具体参见智东西此前的深度专访《成立一年估值超10亿 与谷歌飙技术 这位90后CEO如何做到?》)
深鉴科技创始人兼CEO姚颂则认为,不光是手机芯片,整个半导体行业都将受到AI的冲击。随着深度学习的兴起,不同公司所在意的性能重点不同,一个语音公司与另一个安防摄像头公司所用的芯片不同,比如对于语音识别的用户,他们更加关注延迟,而不是单一的增加吞吐量。未来,处理器的架构分类上将会以应用为导向。
结语:我们离真正的AI芯片还有多远?
目前看,华为通过用麒麟970这款手机芯片架构整合NLP,抢到了“AI芯片”这个高位,噱头也好,美名也罢;但还有很多问题值得我们关注:
1、用上了NLP神经网络计算单元的麒麟970到底能发挥多大作用?会给手机体验带来什么改变,是不是“然并卵?”,要等华为Mate 10发布后具体看。
2、麒麟970这套玩法是不是就是真正的“AI芯片”套路,之后无论高通、三星还是苹果的处理器SoC是不是也会用这种在手机芯片SoC上加入类似NLP的计算模块?
3、麒麟970能不能代表华为在人工智能方面的积累,如果是,是不是NLP这样的处理单元也应该一手包办?苹果、三星、高通会一手包办还是采用第三发专攻这一领域的处理器IP方案,这是未来AI芯片产业发展模式走向需要明确的路径。
但总的来说,麒麟970的出现,让AI在手机端开始由软到硬地落地,是人工智能进一步产业化落地的一个典型代表。现在市面上CUP最好的应该是英特尔的i7这款CPU,下面有它的简介。Core i7采用的是全新Nehalem架构,虽然是新架构,但Nehalem还建立在Core微架构(Core Microarchitecture)的基础上,通过大幅增强改进而来的,外加增添了超线程(HT)、三级Cache、TLB和分支预测的等级化、集成内存控制器(IMC)、QPI总线和支持DDR3等技术。比起从Pentium 4的NetBurst架构到Core 微架构的较大变化来说,从Core 微架到Nehalem架构的基本核心部分的变化则要小一些,因为Nehalem还是4指令宽度的解码/重命名/撤销。
Nehalem的核心部分比Core微架构改进了以下部分:
全新缓存设计:采用三级缓存设计,L1的设计与Core微架构一样为内核缓存;L2采用超低延迟的设计,每个核心各拥有256KB的L2缓存,同时L2缓存也是内核缓存;L3则是采用共享式设计,被所有核心共享使用。
集成了内存控制器(IMC):内存控制器从北桥芯片组上转移到CPU片上,支持三通道DDR3内存,内存读取延迟大幅减少,内存带宽则大幅提升,最多可达三倍。
快速通道互联(QPI):取代前端总线(FSB)的一种点到点连接技术,20位宽的QPI连接其带宽可达惊人的每秒256GB,远超过原来的FSB。QPI最初能够发放异彩的是支持多个处理器的服务器平台,QPI可以用于多处理器之间的互联。
Nehalem的核心部分比Core微架构新增加的功能主要有以下几方面:
New SSE42 Instructions (新增加SSE42指令)
Turbo Mode (内核加速模式)
Improved Lock Support (改进的锁定支持)
Additional Caching Hierarchy (新的缓存层次体系)
Deeper Buffers (更深的缓冲)
Improved Loop Streaming (改进的循环流)
Simultaneous Multi-Threading (同步多线程)
Faster Virtualization (更快的虚拟化)
Better Branch Prediction (更好的分支预测)[汽车之家 新鲜技术解读] 自动驾驶系统,最关键的部件是什么呢?是传感器?是控制软件?还是处理芯片呢?我个人认为在目前这个阶段来说,处理芯片是一个最关键的部件,它的性能直接影响自动驾驶系统的好坏。过去,顶尖的芯片技术一直是国外企业垄断的,但随着中国芯片企业近年的快速追赶,情况已经有所改观。今天我们就来聊聊中国自动驾驶芯片究竟处于一个怎样的水平?
● 自动驾驶芯片是干什么用的?
虽然目前L3级别有条件自动驾驶车辆在中国尚未落地,但从一些带有高阶L2驾驶辅助系统的车辆上我们可以发现,这些车辆都带有数量不少的传感器用以检测车辆周围的障碍物,从而为控制系统决策提供数据支持。这些传感器包括毫米波雷达、超声波雷达、摄像头等。这些传感器每秒钟会产生数GB(1GB=1024MB=10242KB)的数据,自动驾驶芯片需要流畅地处理这些数据才能保证系统及时作出正确的决策,从而确保车辆的行驶安全。
可能大家对每秒数GB的数据没有概念,这里举一个生活中的例子。普通的USB30接口U盘,其读取速度峰值接近200MB/s,要从这个U盘中读取1GB的文件大约需要5秒左右的时间,足见每秒数GB的数据量是相当大的。
自动驾驶系统除了需要解决大流量数据传输问题,还需要解决的就是如何能快速处理这些海量数据,而强大的自动驾驶芯片正是那把正确的钥匙。
● 国外的自动驾驶芯片处在怎样的水平?
虽然本文主要是讲中国自动驾驶芯片的,但知己知彼,百战百胜,在审视本土状况之前,我们还是先要来简单了解国外的情况。国外自动驾驶芯片真正能够大规模进入量产车市场的无非三家,英伟达、Mobileye(现已被英特尔收购)、特斯拉。
其中,走实用路线的Mobileye目前市场占有率在70%以上,市场上的产品主要是应用于L2驾驶辅助系统的EyeQ3芯片(算力0256TOPS,“TOPS”是每秒万亿次运算的意思,详细介绍请看这篇文章相关介绍,本文标注的算力如无特别说明均指的是8位整数计算能力)以及具备L3级别自动驾驶能力的EyeQ4芯片(算力25TOPS)。像是小鹏G3、蔚来ES6/ES8、广汽新能源Aion LX就采用了EyeQ4芯片作为其驾驶辅助系统的核心。
相较于英伟达上代自动驾驶平台旗舰之作DRIVE PX Pegasus 320TOPS的算力,新的DRIVE AGX Orin平台的旗舰配置实现了成倍的性能增长。此外,DRIVE AGX Orin平台的扩展柔性化程度相比以往平台进一步提升,能够通过硬件配置的增减,满足从一般驾驶辅助到L5级别完全自动驾驶等不同级别车辆的需求。
特斯拉Autopilot 10系统采用的是1颗英伟达Tegra3芯片+1颗Mobileye EyeQ3芯片;Autopilot 20系统采用的是1颗英伟达Tegra Parker芯片+1颗Pascal架构GPU芯片;Autopilot 25系统采用的是2颗英伟达Tegra Parker芯片+1颗Pascal架构GPU芯片。
已经搭载在最新下线特斯拉车型上的自研FSD芯片,单颗芯片算力为72TOPS,Full Self-Driving Computer集成有两颗独立工作的FSD芯片,一颗“挂了”,另外一颗马上“顶上”,提升了整套系统的安全性和稳定性。
当然了,除了上面三家锋芒毕露的企业,还有不少企业在垂涎自动驾驶芯片这块蛋糕,其中包括高通、赛灵思、恩智浦等,但这些企业真正走向量产车的自动驾驶芯片还不成规模,限于篇幅,这里就不作介绍了。
● 迅速崛起的中国自动驾驶芯片企业
好了,看完国外的情况,我们目光回到国内。自动驾驶芯片市场火爆,国外科技巨头抢滩登陆,中国企业究竟实力怎么样呢?下面我们一起来看看。
◆ 寒武纪
中科寒武纪科技股份有限公司(下称“寒武纪”)的前身是中国科学院计算技术研究所下,由陈云霁和陈天石两兄弟领导的一个课题组。该课题组在2008年开始研究神经网络算法和芯片,并在2012年开始陆续发表研究成果。
2016年,上述课题组提出的深度学习处理器指令集DianNaoYu被ISCA2016所接受,实验表明搭载该指令集的芯片相较于传统执行X86指令集的芯片,在神经网络计算方面有两个数量级的性能优势。随着课题组的研究成果趋于成熟,中科寒武纪科技股份有限公司正式成立,并着手将其芯片和指令集向商业领域转化。也是在2016年,寒武纪发布了首款商用深度学习处理器寒武纪1A。
聊完这家公司的身世,下面我们来看看它的产品。目前寒武纪有两款最新的人工智能芯片IP授权,分别是Cambricon-1M和Cambricon-1H。性能指标最强的Cambricon-1M-4K在1GHz时钟频率下拥有8TOPS的算力;性能指标最弱的Cambricon-1H8mini在1GHz时钟频率下拥有05TOPS的算力。所有型号的详细算力参数可以参看下表。
Cambricon-1M和Cambricon-1H被定义为终端智能处理器IP。我们在手机或者汽车这些终端上出现的人脸识别、指纹识别、障碍物识别、路标识别等应用都能通过在芯片中集成上述处理器IP实现加速。
上面提到的“边缘”一词来自于“边缘计算”。 边缘计算是指在靠近智能设备(终端)或数据源头(云端)的一端,提供网络、存储、计算、应用等能力,达到更快的网络服务响应,更安全的本地数据传输。边缘计算可以满足系统在实时业务、智能应用、安全隐私保护等方面的要求,为用户提供本地的智能服务。思元220在边缘计算中扮演着提高数据安全、降低处理延时以及优化带宽利用的角色。
目前寒武纪高算力芯片产品被定义为智能加速卡,可用于服务器中加速人工智能运算。谷歌的AlphaGo人工智能机器人打败韩国世界围棋冠军李世石的新闻相信各位有所耳闻,AlphaGo人工智能机器人的背后其实是谷歌自研的TPU芯片。寒武纪的高算力芯片产品的特性和应用也与谷歌TPU类似,当然它们之间也可以算是竞争对手了。
所不同的是思元270-S4采用的是被动散热设计,最大热设计功耗为70W,定位为高能效比人工智能推理设计的数据中心加速卡。这也意味着该卡会有“功耗墙”设定,即当加速卡功耗达到阈值上限时会降低算力以保证较低的功耗和发热。
思元270-F4相当于是“满血版” 思元270-S4,最大热设计功耗150W,采用涡轮风扇进行主动散热。良好的散热和充足的供电使得思元270-F4能够发挥出思元270芯片的全部性能。该卡定位是为桌面环境提供数据中心级人工智能计算力,简而言之就是为台式机配的高性能人工智能加速卡。
虽然思元270在制造工艺上只采用了台积电的16nm工艺,但整体能耗比还是做得比较不错的。虽然单卡算力不及最新的英伟达旗舰计算卡,但5张思元270-S4/思元270-F4并行的话,峰值算力也能达到英伟达A100的水平。只是英伟达A100更先进的工艺应该在能耗比上面会有一定的优势。
其中思元100-C搭载了视频和图像解码单元,采用被动散热方式,最大热设计功耗为110W;思元100-D不搭载视频和图像解码单元,采用被动散热方式,最大热设计功耗为75W。目前思元100系列产品已经于2019年在滴滴云和金山云上得到应用。其中滴滴云采用思元100板卡加速d性推理服务,该服务用于深度学习推理任务;而金山云则采用思元100板卡加速语音、图像、视频等人工智能应用。
前面讲的尽是服务器级的计算卡,这是不是偏离了我们应该聊的自动驾驶芯片话题呢?其实不然。前面也提到了,寒武纪目前是一家专注于人工智能芯片开发的企业,自动驾驶领域确实涉足不深,但通过和其他国内友商的联合还是有一些建树的。
WiseADCU CN1自动驾驶运算域控制器提供了L3或以上级别自动驾驶系统所需的算力以及传感器连接数量需求,实现了仿真、模型、系统、架构、编码、加速、算法七个关键控制点的自主可控。
实际上威盛集团由于处理器产品性能竞争力弱,早就退出了主流X86处理器市场的竞争,市场中就剩下英特尔和AMD在角力。兆芯成立后,吃透了威盛的X86技术,并在威盛当时最新的处理器架构基础上进行全面的改进和优化,先后推出了ZX-A、ZX-C以及ZX-C+等处理器产品。
6月2日,科创板上市委发布2020年第33次审议会议结果公告,寒武纪上市获得通过,从受理到审批通过,寒武纪只用了68天,刷新了科创板审核速度。寒武纪上市后成为A股中唯一一家人工智能芯片公司,该领域的市场空间在2022年有望超过500亿美元,发展潜力巨大。打通了A股融资渠道的寒武纪究竟能否凭借其独特的技术优势进一步发展壮大呢?这谁都说不准,但可以确定的是,寒武纪的成功上市让很多投身于该领域的公司赢得了信心,看到了希望,中国人工智能芯片时代或将由此开启。
◆ 地平线机器人
好了,聊完寒武纪,我们来聊聊另外一家人工智能芯片企业——地平线机器人技术研发有限公司(下简称“地平线”)。地平线是由前百度深度学习研究院常务副院长余凯于2015年创立的,专注于自动驾驶与人工智能芯片的一家公司。余凯也是百度自动驾驶的发起人。
余凯建立的地平线,一直以来坚持的是软件和硬件相结合的方向。他认为,算法、芯片和云计算将构成自动驾驶的三个核心支点。相比起前面介绍的寒武纪注重打造高性能硬件芯片,地平线的商业模式是把以“算法+芯片”为核心的嵌入式人工智能解决方案,提供给下游厂商。打个比方比较好理解,如果说寒武纪卖的是处理器芯片,那么地平线卖的就是安装了 *** 作系统的整机。产品方面,相较寒武纪从终端到云端的芯片产品布局,地平线虽然自研芯片,但更偏重的是以产品功能来划分产品线。
硬件上,征程二代芯片内部集成了两个Cortex A53核心、两个自研的BPU(Brain Processing Unit,可用于加速人工智能算法)核心、DDR4内存控制器以及输入输出控制器,算力达到4TOPS,典型功耗为2W,这比起目前主流的Mobileye EyeQ4芯片的算力和能耗比都更优秀。
这些智能音箱有较强的自然语义识别功能,能够识别人们发出的语音命令,结合物联网技术,人们通过简单的语音命令除了能够让音箱播放在线音频资源外,还能够控制各种家电,如开关、灯泡、风扇、空调等。这就是AIoT的一个最简单的应用例子。
从硬件方面看,旭日二代芯片内部集成了两个ARM Cortex A53核心、两个自研的BPU核心、DDR4内存控制器以及输入输出控制器,算力达到4TOPS,典型功耗为2W。从参数上看,旭日二代和征程二代好像没什么差别,实际上征程二代可以看做是旭日二代的车规版,它满足AEC-Q100标准,在工作温度、电磁辐射等标准上会更高一些。虽然征程二代和旭日二代均采用台积电28nm工艺制造,但旭日二代芯片尺寸为14x14mm,比征程二代芯片17x17mm的尺寸更小,更有利于内嵌到AIoT设备当中。
和寒武纪一样,地平线同样拥有自研的人工智能加速芯片技术。所不同的是,地平线更注重软件和硬件的整合,从而为下游厂商提供成熟的解决方案。在资本市场,地平线同样受到追捧,其投资者众多,其中包括了世界半导体行业巨头英特尔和SK海力士以及国内的一线汽车集团等。未来地平线是否会和寒武纪一样登录科创板目前还不得而知,但CEO余凯对于在科创板上市是持积极态度的。我个人是支持有更多像地平线这样的企业登录科创板,更充分的竞争可以避免垄断同时促进该领域的加速发展。
◆ 西井科技
西井科技创办于2015年,它起初是一家做类脑芯片的厂商。所谓的类脑芯片简单来说就是以人脑的工作方式设计制造出来的芯片。目前大行其道的冯诺依曼结构处理器芯片,其计算模块和存储单元是分离的,芯片工作的过程中需要通过数据总线来连接计算模块和存储单元,数据传输上的开销太大从而限制着这类芯片的工作效率和能耗比的提升。
类脑芯片模仿的是大脑神经元的工作形式,大脑的处理单元是神经元,内存就是突触。神经元和突触是物理相连的,所以每个神经元计算都是本地的,而从全局来看神经元们是分布式在工作。类脑芯片由于具有本地计算和分布式工作的特点,所以在工作效率和能耗上相比冯诺依曼结构处理器芯片更有优势。
虽然这种类脑芯片看着和普通的处理器芯片在外观上没有什么不同,但其实内部运作原理与传统的处理器芯片有着本质的区别。国内除了西井科技开发出了类脑芯片,像是清华开发的天机(TianJic)芯片和浙大开发的达尔文(DARWIN)芯片都是类脑芯片。所不同的是,西井科技的DeepSouth芯片是全球首块可商用5000万类脑“神经元”芯片。
西井科技这艘大船拿着投资人动辄过亿的投资款,肯定是要追求盈利的。不管公司的技术有多超前,无法商业化在逐利的资本市场必然是无法接受的。随着人工智能和自动驾驶产业的兴起,西井科技找到了技术商业化的契机。
相比起我们前面两个厂商动辄上百TOPS算力的产品,西井这两款产品的算力确实有点拿不出手。但西井科技的这两款芯片能够实现片上学习,可以随时新增样本进行增量训练来提升推理准确率。
可能大家看到这里还是没看懂西井科技这两块芯片的优势所在,我在这里稍微解析一下大家就能够明白。目前的自动驾驶算法都是通过高性能服务器进行模型训练(让计算机去看摄像头或激光雷达等传感器获取的环境数据,学习目标判断方法),然后将训练好的模型再部署到车载硬件之中(把机器学习到的高效目标判断方法固化到车载自动驾驶系统之中)。
在实际应用方面,西井科技并没有一头冲进乘用车自动驾驶系统领域,而是在智能港口和智能矿场干出了自己的一片天地,并把触角伸向了智慧医疗和智慧物流领域。2017年10月,公司与全球知名港机巨头振华重工建立长期合作伙伴关系,这是西井科技进军智能港口的重要一步。
自动驾驶卡车要在港区自动装卸集装箱,需要自动驾驶系统精细的车辆控制、敏锐的环境识别以及准确的定位,这些都需要港区高清地图配合。西井科技的无人集装箱卡车定位精度在5cm以内,这是实现集装箱自动装卸的关键。全球首辆港区作业无人集装箱卡车作业成功,充分展现了西井科技在卡车自动驾驶系统以及高精度地图绘制领域的实力。
除了自动驾驶和高清地图绘制外,西井科技还为企业打包了一整套智能港口和智能矿场解决方案,利用人工智能技术提升港口和矿场的运作效率,同时能够进一步降低其运营成本。深挖行业中存在的机遇,逐步筑起行业壁垒是西井科技面对人工智能芯片市场激烈竞争的重要策略。
作为全球最早落地行业应用的自动驾驶团队,西井科技旗下自动驾驶品牌Qomolo逐路目前涵盖了无人驾驶跨运车、无人驾驶新能源集卡和无人驾驶矿卡三大项目。
面对乘用车自动驾驶芯片领域的激烈竞争,我认为短期内西井科技不会进入该领域。相反它会通过深耕已有的智能港口、智能矿场以及无人驾驶重卡市场,进一步筑高上述市场的壁垒,扩大自身的行业影响力和竞争力。但不能忽视的是,西井科技掌握的类脑芯片技术或有可能成为未来自动驾驶芯片领域的一个风口。
上文详细介绍中国3家知名自动驾驶芯片公司及其产品,相信大家应该对目前国内自动驾驶芯片现状有了一个更深了解。除了这三家公司,数字地图供应商四维图新通过收购杰发科技也布局自动驾驶芯片市场,但量产芯片目前尚未落地。百度的昆仑芯片以150W的功耗实现了260TOPS的算力,竞争力很强,但其定位为云端全功能人工智能芯片,主要用在服务器之上。百度在自动驾驶领域的亮点还是在于其Apollo自动驾驶软件平台。
● 全文总结:
寒武纪、地平线、西井科技这三家公司都有着各自的特色和亮点。寒武纪专注于芯片研发,产品算力最强;地平线除了研发芯片,还提供完整的自动驾驶软件方案,对主机厂开发更友好;西井科技掌握独特的类脑芯片设计,在智能港口、智能矿场以及无人驾驶卡车领域已经站稳了阵脚。整体来看,中国自动驾驶芯片在性能和功耗上和外国芯片相比并不差,如何在中国开放L3级别有条件自动驾驶车辆落地这个时间节点用产品和服务先发制人是中国自动驾驶芯片企业的制胜关键。究竟鹿死谁手,让我们拭目以待吧,好戏即将上演!(图/文/汽车之家 常庆林部分源于网络)不会。
寒武纪目前掌握着芯片的核心技术,公司呈现出蒸蒸日上的现象,股票趋势呈直线上升,国家并没有任何通告要收购寒武纪。
寒武纪是目前国际上少数几家全面系统掌握了通用型智能芯片及其基础系统软件研发和产品化核心技术的企业之一,能提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件。寒武纪产品广泛应用于服务器厂商和产业公司,面向互联网、金融、交通、能源、电力和制造等领域的复杂AI应用场景提供充裕算力,推动人工智能赋能产业升级。3月14日晚,AI芯片公司寒武纪公告称,其公司核心技术人员梁军因与公司存在分歧,已于近日为其办理相关离职手续,离职后梁军先生将不再担任公司任何职务。
或受该消息影响,截至发稿寒武纪股价下跌1838%,报66元。
对于此次人事变动带来的影响,寒武纪在公告中表示,梁军先生的离职,会对公司的研发管理工作产生一定影响。公司已经建立了完备的研发体系,形成了专业的研发队伍,储备了丰富的专利技术,梁军先生的离职不会影响公司的技术创新,不会对公司整体研发实力产生重大不利影响。
梁军是寒武纪首席技术官,核心技术人员之一。2017年,梁军从华为跳槽到寒武纪,负责AI芯片的总体技术和产品研发、研发团队管理,帮助搭建了寒武纪的技术和产品创新体系。量子位报道称,梁军在任期内推出了寒武纪首颗7nm AI训练芯片思元290。
在寒武纪之前,梁军在华为公司工作了17年。2000年至2003年,就职于华为技术有限公司北京研究所,任工程师。2003年至2017年,任职于华为海思,历任工程师、高级工程师、主任工程师、技术专家、高级技术专家,先后负责网络芯片架构设计、手机SoC芯片设计及团队管理。
寒武纪公告中提及,根据竞业限制条款约定,梁军先生应在合同解除后两年内履行竞业限制义务,不得在与寒武纪有竞争关系的公司任职。
梁军离职后,寒武纪并未指定新的CTO人选,目前从内部新聘任了两位技术副总经理,分管边缘和云端两大业务,为此前的边缘产品线负责人陈煜,以及此前为云端训练产品线负责人、分布式软件部高级总监曾洪博,二人皆是寒武纪成立后不久加入的员工。
寒武纪成立于2016年,由陈天石、陈云霁创办,二人均毕业于中科大少年班,其前身是中科院计算所2008年组建的“ 探索 处理器架构与人工智能的交叉领域” 10人学术团队。成立后,寒武纪致力打造各类智能云服务器、智能终端以及智能机器人核心处理器芯片。
2020年7月20日,寒武纪正式在科创板上市,成为科创板“AI芯片第一股”。上市首日创下开盘涨近290%的成绩,市值一度超过千亿元人民币。根据寒武纪财报,寒武纪2021年营业总收入为721亿元,同比增长5712%;归母净利润亏损达到847亿元,较上年同期亏损扩大9498%。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)