华为不再孤单!阿里推出“含光”芯片,创两项世界纪录

华为不再孤单!阿里推出“含光”芯片,创两项世界纪录,第1张

文 / 华商韬略 和正升 编辑/倪晨

目前超过百亿美元的云端芯片行业一直被外界所看好,并被认为是最有希望诞生第二个“英特尔”的市场。

但现在,这市场突然杀出了一个狠角色。

2019年9月25日,在2019年度的云栖大会上,阿里巴巴推出了全球最强的AI芯片——含光800。基于含光800的AI云服务在发布当天,已经同步上线了。

含光的典故来自《列子·汤问》,经国产武侠动漫《秦时明月》为人熟知, “含光”是上古三大神剑之一,含而不露,光而不耀,寓意含光芯片无形却强大的计算能力。

“含光”是一款云端AI芯片,主打推理,重点应用于视觉场景。

而阿里自研的AI芯片,是当之无愧的佼佼者。 含光800的问世创造了两项世界纪录。

首先,含光800的峰值性能为78万IPS(每秒能处理78万张照片)。而在此之前,业界最好的AI芯片只有15万 IPS,也就是说含光的芯片性能足足是第二名的5倍!

其次,含光800的能效比达500 IPS/W,而第二名只有150 IPS/W,不足含光的三分之一!

含光800的性能有多厉害?举个通俗点的例子,1颗含光800的算力相当于10颗GPU,这意味着只需要用原来十分之一的硬件,就能做完原来所有的事情。

比如,在城市大脑中实时处理杭州交通视频,需要40颗传统GPU,延时为03秒,而使用含光800仅需4颗,延时降至015秒。

比如拍立淘商品库每天新增10亿商品,使用传统GPU算力识别需要1小时,而使用含光800后可缩减至5分钟。 也就是说,在含光芯片的加持下,机器1分钟可识别两亿张照片!

但此次阿里推出芯片,并非其首次“跨界”,早在2014年时,马云就开始想:要不要做芯片,怎么做芯片。

当阿里决意做芯片后,进度堪称迅速。

2017年,阿里对外宣布成立达摩院之时,芯片就是达摩院成立之初就规划的重要研发方向之一。

2018年的云栖大会上,阿里就宣布成立一家独立运营的芯片公司——“平头哥半导体有限公司”。

“平头哥”是蜜獾的别称,是“世界上最无所畏惧的动物”,所谓生死看淡,不服就干的鼻祖就是平头哥。而这家公司,是基于阿里收购的中天微系统有限公司和达摩院自研芯片业务一起,整合成立的一家独立的芯片公司。

在一系列的努力下,如今创造世界纪录的芯片终于研发成功并投入实际应用了。

阿里巴巴集团首席技术官兼阿里云智能总裁张建锋介绍,含光800的研发采用了互联网公司的速度,从完成设计到流片只用了一年半的时间。

除了这款技惊四座的芯片外,“平头哥”已经于今年先后发布玄铁910和无剑SoC平台。

玄铁910号称目前业界性能最强的RISC-V架构芯片之一,未来可以应用于5G、人工智能、物联网、自动驾驶等众多领域。值得注意的是,这是一款抛弃了ARM架构的处理器。

此前,世界上所有的安卓系统,包括阿里自己推出的的YunOS系统,都绕不开无处不在的ARM架构,而玄铁910的推出,意味着国内 科技 公司终于另起炉灶,从芯片的底层进行革新了。

此外,平头哥还联合阿里另一家公司天猫精灵,推出采用玄铁架构的Tmall Genie plus TG6100N芯片,这款芯片将用于天猫精灵等产品中。

低成本高应用性、精简算法与存储、本地NLP以及信息安全性是TG6100N芯片的重要特点。

张建峰就曾表示: “在全球芯片领域,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步。 今天阿里巴巴有足够的能力去做传统硬件公司能做到的,包括他们不能做到的。我们有充分的信心,阿里巴巴今后会成为一家真正软硬件一体化的协同发展 科技 公司。”

随着平头哥崛起以及“含光”芯片的问世,我们有理由相信:华为在中国芯片领域,不再孤单了。

——END——

均来自网络

欢迎关注华商韬略,识风云人物,读韬略传奇。

版权所有,禁止私自转载!

在2006年超级计算机大会SC06开幕前一天,TOP500org提前公布了第28次超级计算机五百强名单,其中前十位的排行发生了重大变化,因为TOP10中的新秀有7款之多,而且两款新的AMD Opteron系统占据了第二和第九。
超级计算机TOP500的计算性能依然在飞速提升,这次第10名的平均计算能力为5420TFlpos,第500名也有2734TFlops,比上次的 203TFlops增加347%之多,而第100名的665TFlops如果放在2003年甚至可以跻身TOP10。
整体而言, TOP500的总计算能力比上次提升56%,其中前十名受影响较大。排名第一的仍是美国能源部劳伦斯利物莫国家实验室(LLNL)的“蓝色基因/L”系统 (BlueGene/L),峰值计算能力3670TFlops,平均2806TFlops;新科亚军是美国Sandia国家实验室的“红色风暴” (Red Storm),由超级计算机制造商Cray采用13277颗24GHz双核心Opteron处理器打造而成,峰值计算能力1274TFlops,虽然只有蓝色基因的347%,但却是史上第二台超越100TFlops的超级计算机;IBM的一套新蓝色基因系统“BGW”夺得季军,峰值计算能力也超过了 100TFlops大关,达到1147TFlops。
IBM的Cell系统不但拿下了冠军和季军,还占据了TOP10中的另外两个位置,在TOP500中也有93套。
排名第六的是戴尔“Thunderbird”(雷鸟)系统,基于Intel Xeon 36GHz处理器,这也是Intel平台的最高排名。TOP500中的Intel平台从上次的301台减少到263台,其中Itanium系统从37台减少到35台,不过基于最新Woodcrest Xeon 5100的系统已经开始上榜。
凭借近年来在服务器领域内的优异表现和杰出的计算性能,AMD的Opteron处理器已经在TOP500中占据了113个席位,上次只有81个。另外,PA-RISC平台20套、Alpha平台3套、富士通研发的Sparc平台3套,Sun的10套系统则全部采用了x86处理器。
(ARMONK,纽约)——近日,在IDC最新公布的世界最强功能超级计算机排行榜上,IBM的上榜数量在所有的生产商名列第一,几乎是排名第二位的公司(New HP)上榜数量的两倍。IDC的排行榜上共有304种IBM eServer系统,而新HP公司有171种,Sun公司则只有89种。此外,IDC的“平衡等级基准”也进一步证明了:一台32路IBM eServer p690服务器的性能强于Sun Fire 15K和HP Superdome,而其处理器数量仅仅是这些服务器的一半。
“IBM在超级计算领域的成功来自一个简单的哲学——我们制造超级计算机的目的是用来处理各种商业和技术环境下的超级计算应用。”IBM eServer基准测试部主管David Gelardi说,“只要更多的公司借助于超级计算机来处理大型数据挖掘和其它重要应用,IBM就会在此重要领域内继续保持其领先地位。”
排行榜上的IBM超级计算机包括从单机系统到512台计算机的大型集群。在单机水平上,32路IBM eServer p690与72路Sun Fire 15K与64路HP Superdome相比,显示出了非凡的优越性。IBM eServer p690由POWER4微处理器支持,是第一种“一个芯片上的服务器”,它包括2个1GHz以上的处理器,1个大带宽系统开关,1个大内存缓冲器和I/O接口。也正是因为p690的独特设计,它的出现才改变了UNIX业界的游戏规则。
IDC的这个排行榜也符合超级计算机前500强排名结果。超级计算机前500强的排名由来自美国田纳西州大学的Jack Dongarra和德国曼海姆大学的Hans Meuer两位超级计算专家公布,每年公布两次。这500种计算机都是世界上功能最强、性能最好的计算机,在最新的前500强排名中,IBM系统占了160种——超过其它所有生产商。
IBM还透露,他们正打算在不久的将来建立“蓝色基因/L”——一个200 Tflop(1Tflop等于每秒进行一万亿次计算)的超级计算机。目前,它的一些相关基础技术正在IBM研究中心和美国Lawrence Livermore国家研究室的共同开发中。此外,IBM也正在为各项生命科学工程建造一台Pflop级(每秒钟完成千万亿次 *** 作)蓝色基因机器。

前段时间,美哈佛大学出了一份报告,表示我国在多个尖端技术领域已经取得巨大进步。尤其是在5G、人工智能、量子计算等已取得全球领先,并开始占主导地位。

国内有专家说得很好,就是近十年来,我们跟美同时起步的技术,我们都能做到领先。现在某些方面落后的,大都是人家起步早的领域,像现在有差距的半导体方面。

不过,哈佛报告还预测,我国将成为全球成熟技术节点上最大的半导体生产国,并且未来十年我国将在半导体等核心技术上实现领先。果不其然,好消息很快传来。

第一,浙大超导量子芯片取得突破成果。 量子技术是未来 科技 竞争的一大重点,目前各国都在大力投入研发,可以说是已经展开竞赛,都希望在量子领域中占先机。

从之前的相关报道,我们也都可以看到量子计算机的优势已经非常明显,尤其是在计算速度方面更是快到惊人。而要实现稳定的量子计算机,量子芯片是其中的关键。

近日,我国在量子芯片方面又取得了突破,浙江大学发布了两款超导量子芯片。

其中,“莫干1号”采用全连通架构,包含32个超导量子比特,是目前超导量子芯片中比特数目最多的,主要是针对量子态的精确调控,以及多体物理的量子模拟。

“天目1号”芯片面向通用量子计算,采用了较易扩展的近邻连通架构,平均退相干时间为50微秒,处于世界前列。相比于“莫干1号”具备更高的编程灵活度。

浙大公布的两款量子芯片成果,充分证明我国在这方面已处于世界第一梯队水平。

第二,纯国产龙芯服务器芯片研发成功。 一直以来,在CPU上我们主要依赖国外,不管是日常工作生活用的电脑,还是服务器领域,CPU基本被英特尔和AMD垄断。

然而,随着国内对数据保密等方面的要求越来越高,对国产CPU的需求就越来越大。尤其是纯国产CPU更加期待,在这方面做得最好的就是中科院旗下龙芯中科。

在龙芯CPU首席科学家胡伟武的带领下,已推出了自主研发的三代龙芯国产CPU。

前段时间,龙芯3A5000系列通用CPU正式亮相,性能达到国际主流CPU水准。近日,中科院再次公布,面向服务器领域的纯国产CPU龙芯3C5000已经研发成功。

这款芯片有两个重要特点:其一是采用了自主架构LoongArch指令集,从内到外全纯国产设计,不再担心国外架构授权限制,之前都是使用国外X86或ARM架构。

其二是芯片性能很强大,综合性能表现不落后目前市场的主流服务器CPU,内部集成16个高性能的龙芯LA464处理器核。应用后,将大大提高我们数据的安全性。

第三,碳基芯片关键工艺课题通过验收 。 我们现在的芯片是硅基芯片,现在5nm正在量产,3nm预计明年下半年实现量产,接下来再往下发展就是2nm、1nm。

然而,由于硅基芯片技术由于受加工技术、器件物理极限等方面限制,已经接受物理极限,且成本高到已经不合适。因此,就需要寻找更加合适的下一代替代产品。

碳基芯片具有加工温度低、工作速度快、功耗低等优势,最有可能成为后摩尔时代集成电路的颠覆性技术之一。在这方面,我国也早就开始研发,并且还非常领先。

近日,好消息传来,多个部门组成的验收组,对“90 纳米碳基集成电路关键工艺研究”课题进行评审,在听取汇报、查看资料和样品实物后,一致通过了该课题研究。

并且,碳基芯片90 纳米工艺先导线正在建设中。别小看这个90纳米,根据研究成果估算,90纳米碳基芯片性能相当于28纳米硅基芯片,60纳米就相当于10纳米。

重点是,这个碳基芯片可以不用EUV光刻机,国产光刻机就可以。并且该课题开展过程,在 90 纳米材料制备、关键工艺及器件性能、应用 探索 等均取得了可喜成果,并且都处于世界领先水平。这次验收通过,表示碳基芯片距离商用又近了一大步。

以上的三个国产芯片突破,龙芯很快就可以应用,碳基芯片和量子芯片是在为未来打基础,这两种芯片将为我国未来芯片行业领先、不受限制奠定一个坚实的基础。

近日,我国半导体行业协会集成电路设计分会理事长魏少军,就芯片发展发表意见。

他表示,我国已经成为全球最为完整的芯片产品体系之一,不仅在中低端芯片领域具备较强的竞争力,在高端芯片领域也摆脱了全面依赖国外产品的被动局面。

魏少军所说的高端芯片不再全面依赖国外情况非常振奋人心,不过他主要是侧重设计方面,高端芯片设计的确已经达到全球领先,但在制造方面我们还有不小差距。

不过,从近期国内芯片行业的不断突破来看,我们在进步,问题终究会解决。

排名第一:高通(美国)  排名第二:安华高(新加坡)  排名第三:联发科(中国台湾)  排名第四:英伟达(美国)  排名第七:台积电(中国)

排名第一:高通(美国)

这应该是目前知名度最高的芯片品牌之一了。著名的骁龙系列手机处理器就是高通成产品,基本上小米、乐视、华为等公司都在用。

排名第二:安华高(新加坡)

新加坡的一家设计、研发并向全球客户广泛提供各种模拟半导体设备的供应商,公司主要提供复合 III-V 半导体产品。

排名第三:联发科(中国台湾)

中国台湾的一家芯片科技公司,目前很多中低端的智能手机用的都是联发科的处理器。

排名第四:英伟达(美国)

NVIDIA(全称为NVIDIA Corporation,NASDAQ:NVDA,官方中文名称英伟达),创立于1993年1月,是一家以设计智核芯片组为主的无晶圆(Fabless)IC半导体公司。Nvidia是全球图形技术和数字媒体处理器行业领导厂商,NVIDIA的总部设在美国加利福尼亚州的圣克拉拉市,在20多个国家和地区拥有约5700名员工。

NVIDIA最出名的产品线是为游戏而设的GeForce显示卡系列,为专业工作站而设的Quadro显卡系列,和用于计算机主板的nForce芯片组系列。2015年7月31日,英伟达公司公司宣布召回销售于2014年6月到2015年6月的平板电脑,因这批电脑存在电池过热问题。

排名第七:台积电(中国)

台湾积体电路制造股份有限公司,简称台积电、TSMC,属于半导体制造公司。成立于1987年,是全球第一家专业积体电路制造服务(晶圆代工foundry)企业,总部与主要工厂位于台湾新竹科学园区。

张忠谋,台积电创始人,现任台积电董事长(声称今年6月退休),有"芯片大王"之称。因其在半导体业的突出贡献,被美国媒体评为半导体业50年历史上最有贡献人士之一和全球最佳经理人之一。国际媒体称他是"一个让对手发抖的人",而台湾人则尊他为"半导体教父"。

参考资料:财经网——世界芯片排行榜

arm是高通的供应商,高通是arm的顾客。

简单来说arm设计cup,高通通过arm设计的cup开发工艺综合其他技术制造成实物产品。

arm负责技术,高通负责工艺和生产制造。

高通公司是全球3G、4G与5G技术研发的领先企业,目前已经向全球多家制造商提供技术使用授权,涉及了世界上所有电信设备和消费电子设备的品牌。

扩展资料:

高通做服务器芯片的优势:

事实上,单从服务器芯片市场份额来看,x86产品占据绝对“话语权”。随着数据中心市场需求增强,多家芯片制造商一直希望为一些大型数据中心运营者提供处理器,打破x86架构的市场统治地位。

正如阿蒙所言,基于ARM架构的服务器芯片有其自身优势,ARM架构在移动芯片市场有着很高的地位。去年,高通等多家半导体公司推出ARM架构服务器芯片,制程工艺主要是10nm及7nm,目标在2021年取得25%的市场份额。目前看,ARM架构服务器芯片的市场地位正在崛起。

在推动智能手机技术以及智能手机SOC的发展过程中,高通推动芯片的处理能力不断增强,今年已成功拓展至PC产品。而在数据中心领域,阿蒙认为,高通自身也具备开发服务器芯片的优势。

其中一个差异化优势体现在高性能、低功耗。

参考资料来源:百度百科-高通msm7227a

中国经济网-高通全球总裁:为何看好数据中心市场?

「初创公司要贸然打入云端市场,简直就是自寻死路」。

长久以来,云端的数据中心市场被视为创业公司的禁地,因为英特尔、英伟达、AMD 等巨头林立,竞争太过凶残。

但近年来,云计算势不可挡,云端芯片市场呈现爆发式增长,不乏勇者前来破局。

作为一家发源于中科院计算所、背靠多家「国字辈」资本、估值已经来到 30 亿美金的硬核创业公司,寒武纪挑战云端市场的底气十足。

2018 年 5 月,寒武纪发布首颗云端 AI 芯片,并对外透露获得中国前三大服务器浪潮、联想、曙光的订单。据机器之心了解,滴滴、海康威视也已经成为寒武纪的客户。

与此同时,寒武纪成数亿美元 B 轮融资。据机器之心了解,目前寒武纪的估值约为 30 亿美元,与今年 2 月完成 6 亿美元融资后成为「全球最具价值的 AI 芯片公司」的地平线不相上下。

一年后,寒武纪二代芯片已经箭在弦上,这颗积蓄了中科院计算所研发实力四年之久的二代或将为行业带来不小震荡。

机器之心独家获悉,寒武纪二代云端芯片或将于本月公布,同时我们采访到寒武纪技术研发相关知情人士、寒武纪云端芯片客户等多方信源,提前揭秘关于该颗芯片的细节亮点和核心技术。

这回有了中文名

据机器之心了解,寒武纪二代云端 AI 芯片代号为「MLU270」,延续上一代芯片「MLU170」的 MLU(Machine Learning Unit)系列。今年初,寒武纪已经为旗下芯片注册两大中文商标名,分别是「思元」、「玄思」。综上,寒武纪二代云端 AI 芯片中文名为「思元 270」。

在今年的新品议程表上,虽然还名列有其他芯片,但「思元 270」及其板卡将会是重头戏。这也表明寒武纪将从终端向华为等品牌商授权 IP 的模式,转向主打云端市场的芯片方案提供商。

在芯片架构方面,寒武纪二代芯片将从上一代的「MLUv01」升级为「MLUv02」。考虑到视频数据正呈现爆炸性增长,成为数据中心的任务主流,寒武纪在「思元 270」里内建视频解码单元,瞄准海量的视频处理市场专门配置。

据机器之心了解,寒武纪「思元 270」在今年年初研制成功,制程工艺方面明显抛弃了此前终端市场的激进打法,选择仍然沿用台积电 16nm 工艺,定位于「专注云端训练计算」。

对比两大巨头的主流云端产品线,英伟达去年 9 月发布并已发货的 Tesla T4 采用 14nm 工艺,AMD 去年 11 月发布的 Radeon Instinct MI60 和 MI50 采用 7nm 工艺,寒武纪这次似乎希望单纯依靠技术路线取胜,不再如去年对于 7nm 工艺寄予厚望。

「让英伟达难受」

在芯片性能方面,「思元 270」的性能参数有意向业界标杆英伟达 Tesla T4 看齐。

据机器之心目前了解到的情况来看,「思元 270」可支持 INT16/INT8/INT4 等多种定点精度计算,INT16 的峰值性能为 64Tops(64 万亿次运算),INT8 为 128Tops,INT4 为 256Tops。

对比 Tesla T4,FP16 的峰值性能为 65 Tops,INT8 为 130 Tops,INT4 为 260 Tops。

功耗方面,「思元 270」功耗为 75w,与 Tesla T4 持平。

但值得注意的是,这些「理论峰值」不过是纸面规格,真正实测水平相比理论峰值通常有一定缩水。据某大体量计算数据中心负责人,同时也是阿里云早期核心技术研发人员李立表示,「T4 在实测过程中,75w 功耗维持不了多久就降一半频率。」

据该负责人介绍,他在几个月前已经拿到「思元 270」的具体规格和特性,「对比而言,第一代 MLU100 是试水,第二代 270 就聚焦多了,威力非常大,NV 后面会很难受。」

与此同时,该负责人还指出,「寒武纪的方案在某些领域可能不会特别好使,尚待观察。」

核心技术解密

这里需要引入一对运算表示法的概念,整数运算(定点运算)与浮点运算。

它们是计算机计算中最为常用的两种运算表示法,顾名思义,其差异就体现在整数和浮点上,加减乘除运算都是一样的。

整数表示法,即所有位都表示各位数字,小数点固定;浮点表示法,则分成两部分,阶码和尾数,尾数就是数字部分,阶码表示乘幂的大小,也就是小数点位置。所以浮点数在做运算的时候,除了对尾数做加减乘除,还要处理小数点位置。

基于两种不同的运算表示法规则,导致面对同样长度的整数和浮点运算,后者计算模式更为复杂,需要消耗更多的资源去处理,并且二者功耗差距通常是数量级的。 简单来说,就是浮点运算占用的芯片面积和功耗相比于整数运算器都要大很多倍。

但浮点运算又有其不可取代性。首先,定点表示法运算虽然直观,但是固定的小数点位置决定了固定位数的整数部分和小数部分,不利于同时表达特别大的数或者特别小的数,可能「溢出」。

而浮点的精度虽然没有定点大,但是浮点运算的小数点位置可以移动,运算时不用考虑溢出,所以科学计算法一般都使用浮点。所谓「溢出」,指超出某种数据格式的表示范围。

此外,具体到使用 GPU 做训练,业界通常更倾向于浮点运算单元,主要是因为在有监督学习的 BP 算法中,只有浮点运算才能记录和捕捉到训练时很小的增量。 由于训练的部分模块对精度要求比较高,所以通常必须是高精度的浮点运算,比如 FP32 才能搞定,FP16 都难。

综上,虽然浮点运算相比定点运算在功耗、计算速度、性价比等方面都不占优势,但截止目前,浮点计算在云端的训练场景中仍具有不可替代的特性,并且以高精度运算为主。

那么,如何在不增加芯片面积和功耗的前提下,如何大幅提升芯片做训练的运算能力就成为云端训练芯片的主要研课题之一。

参考计算过程相对简单的推断计算思路,目前该领域的 AI 芯片多采用集成大量整数运算器或低精度浮点运算器。

面对计算过程更为复杂的训练计算,业界一直在尝试是否可能用性价比更高的定点运算器实现。「但这个问题在学术界也还没有普适的解决方案。」王一说道。

李立表达了类似的观点, 目前大家的研究热点之一,就在于如何全部的定点单元(比如 INT8)代替浮点单元,或者以主要的定点单元配合少量的高精度浮点计算单元(比如 FP32)做更多的训练任务,目的是达到定点计算的快速度,同时实现接近高精度浮点计算的精度。

谈到目前该方向的研究成果和代表论文,李立表示,行业相关的研究文章已经有一些,不过都不具有普适性。

王一进一步向机器之心透露了关于实现低精度运算的「关键心法」,要做好低精度训练,就要找到一个好的数据表示方法,既能表达最后大的数,又能让 0 附近的小量能够更好地表达,因此这个数据表示可能需要有自适应性,能随着训练的过程调整。

他还补充, 「低精度训练确实未必要是浮点数,只要能把数域表达好,0 附近的小量表达好,什么样的数据表示都可以。」

综上,寒武纪在大幅度提升训练阶段的计算功耗比方面,很有可能采用的是以整数为主的低精度运算,这在目前已公布的 AI 芯片项目中属于首创。

实际上,寒武纪在计算机计算领域的开创精神和技术积淀由来已久。早在 2014 年—2016 年期间,寒武纪创始人兼 CEO 陈天石、陈云霁两兄弟的研究就基本奠定了神经网络芯片的经典设计思路,也就是现在常谈到的 AI 芯片架构。

当时他俩的「DianNao 系列」论文横扫体系结构学术圈: Diannao(电脑)是 ASPLOS'14 最佳论文(亚洲第一次),DaDiannao(大电脑)是 MICRO'14 最佳论文(美国以外国家的第一次)……

而在大洋彼岸,美国两家风头正劲的 AI 芯片公司 Graphcore、GTI(Gyrfalcon Technology, Inc)正是沿用了 DianNao 系列论文的基本思路,采用大量堆叠的简单计算单元以实现复杂的云端计算。(机器之心曾进行过相关报道,《一款芯片训练推理全搞,Hinton 为其背书,Graphcore 完成 2 亿美元融资》、《30 年前的「CNN 梦」在这颗芯片落地,能效比高出 Tesla10 倍 | CES 直击》)

此外,要切数据中心市场的蛋糕,一套完备成熟的软件生态也是其核心竞争力的重要体现。英伟达之所以能够在云端训练领域成为绝对主流,其 CUDA 软件生态的基础功不可没。

据机器之心了解,寒武纪从 2016 年起逐步推出了寒武纪 NeuWare 软件工具链,该平台终端和云端产品均支持,可以实现对 TensorFlow、Caffe 和 MXnet 的 API 兼容,同时提供寒武纪专门的高性库,可以方便地进行智能应用的开发,迁移和调优。

「云芯」之争一触即发

尽管前述了寒武纪的种种硬核技术护体、大资本和客户加持,但想要真正在数据中心市场扎下根,以实现陈天石去年在发布会上谈到的目标:到 2020 年底,力争占据中国高性能智能芯片市场的 30% 份额,仍然面临着异常残酷的市场竞争。

整体上,英特尔在数据中心服务器芯片市场仍然牢牢占据着的 95% 以上份额。

而随着深度学习计算和人工智能技术逐步兴起的云端训练市场,同样被巨头绝对垄断。目前 90% 以上的云端加速采用英伟达 GPU,AMD、FPGA 占据非常小的份额,剩余市场还在被国内外芯片创业公司不断瓜分。

据机器之心了解,近期还有一家国内知名 AI 算法公司将要入局云端推理芯片市场。据德勤最新出炉的报道显示,到 2022 年,全球人工智能训练市场的规模将达到约 170 亿美元,云端推理芯片市场的规模将达到 70 亿美元。

可以预见,2019 年,AI 芯片之争将从端燃及云上,云端的大体量、高增速市场势必迎来更多强劲玩家。

(应采访者需求,文中李立、王一均为化名。)


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/12986700.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-29
下一篇 2023-05-29

发表评论

登录后才能评论

评论列表(0条)

保存