● 自动驾驶芯片是干什么用的?
虽然目前L3级别有条件自动驾驶车辆在中国尚未落地,但从一些带有高阶L2驾驶辅助系统的车辆上我们可以发现,这些车辆都带有数量不少的传感器用以检测车辆周围的障碍物,从而为控制系统决策提供数据支持。这些传感器包括毫米波雷达、超声波雷达、摄像头等。这些传感器每秒钟会产生数GB(1GB=1024MB=10242KB)的数据,自动驾驶芯片需要流畅地处理这些数据才能保证系统及时作出正确的决策,从而确保车辆的行驶安全。
可能大家对每秒数GB的数据没有概念,这里举一个生活中的例子。普通的USB30接口U盘,其读取速度峰值接近200MB/s,要从这个U盘中读取1GB的文件大约需要5秒左右的时间,足见每秒数GB的数据量是相当大的。
自动驾驶系统除了需要解决大流量数据传输问题,还需要解决的就是如何能快速处理这些海量数据,而强大的自动驾驶芯片正是那把正确的钥匙。
● 国外的自动驾驶芯片处在怎样的水平?
虽然本文主要是讲中国自动驾驶芯片的,但知己知彼,百战百胜,在审视本土状况之前,我们还是先要来简单了解国外的情况。国外自动驾驶芯片真正能够大规模进入量产车市场的无非三家,英伟达、Mobileye(现已被英特尔收购)、特斯拉。
其中,走实用路线的Mobileye目前市场占有率在70%以上,市场上的产品主要是应用于L2驾驶辅助系统的EyeQ3芯片(算力0256TOPS,“TOPS”是每秒万亿次运算的意思,详细介绍请看这篇文章相关介绍,本文标注的算力如无特别说明均指的是8位整数计算能力)以及具备L3级别自动驾驶能力的EyeQ4芯片(算力25TOPS)。像是小鹏G3、蔚来ES6/ES8、广汽新能源Aion LX就采用了EyeQ4芯片作为其驾驶辅助系统的核心。
相较于英伟达上代自动驾驶平台旗舰之作DRIVE PX Pegasus 320TOPS的算力,新的DRIVE AGX Orin平台的旗舰配置实现了成倍的性能增长。此外,DRIVE AGX Orin平台的扩展柔性化程度相比以往平台进一步提升,能够通过硬件配置的增减,满足从一般驾驶辅助到L5级别完全自动驾驶等不同级别车辆的需求。
特斯拉Autopilot 10系统采用的是1颗英伟达Tegra3芯片+1颗Mobileye EyeQ3芯片;Autopilot 20系统采用的是1颗英伟达Tegra Parker芯片+1颗Pascal架构GPU芯片;Autopilot 25系统采用的是2颗英伟达Tegra Parker芯片+1颗Pascal架构GPU芯片。
已经搭载在最新下线特斯拉车型上的自研FSD芯片,单颗芯片算力为72TOPS,Full Self-Driving Computer集成有两颗独立工作的FSD芯片,一颗“挂了”,另外一颗马上“顶上”,提升了整套系统的安全性和稳定性。
当然了,除了上面三家锋芒毕露的企业,还有不少企业在垂涎自动驾驶芯片这块蛋糕,其中包括高通、赛灵思、恩智浦等,但这些企业真正走向量产车的自动驾驶芯片还不成规模,限于篇幅,这里就不作介绍了。
● 迅速崛起的中国自动驾驶芯片企业
好了,看完国外的情况,我们目光回到国内。自动驾驶芯片市场火爆,国外科技巨头抢滩登陆,中国企业究竟实力怎么样呢?下面我们一起来看看。
◆ 寒武纪
中科寒武纪科技股份有限公司(下称“寒武纪”)的前身是中国科学院计算技术研究所下,由陈云霁和陈天石两兄弟领导的一个课题组。该课题组在2008年开始研究神经网络算法和芯片,并在2012年开始陆续发表研究成果。
2016年,上述课题组提出的深度学习处理器指令集DianNaoYu被ISCA2016所接受,实验表明搭载该指令集的芯片相较于传统执行X86指令集的芯片,在神经网络计算方面有两个数量级的性能优势。随着课题组的研究成果趋于成熟,中科寒武纪科技股份有限公司正式成立,并着手将其芯片和指令集向商业领域转化。也是在2016年,寒武纪发布了首款商用深度学习处理器寒武纪1A。
聊完这家公司的身世,下面我们来看看它的产品。目前寒武纪有两款最新的人工智能芯片IP授权,分别是Cambricon-1M和Cambricon-1H。性能指标最强的Cambricon-1M-4K在1GHz时钟频率下拥有8TOPS的算力;性能指标最弱的Cambricon-1H8mini在1GHz时钟频率下拥有05TOPS的算力。所有型号的详细算力参数可以参看下表。
Cambricon-1M和Cambricon-1H被定义为终端智能处理器IP。我们在手机或者汽车这些终端上出现的人脸识别、指纹识别、障碍物识别、路标识别等应用都能通过在芯片中集成上述处理器IP实现加速。
上面提到的“边缘”一词来自于“边缘计算”。 边缘计算是指在靠近智能设备(终端)或数据源头(云端)的一端,提供网络、存储、计算、应用等能力,达到更快的网络服务响应,更安全的本地数据传输。边缘计算可以满足系统在实时业务、智能应用、安全隐私保护等方面的要求,为用户提供本地的智能服务。思元220在边缘计算中扮演着提高数据安全、降低处理延时以及优化带宽利用的角色。
目前寒武纪高算力芯片产品被定义为智能加速卡,可用于服务器中加速人工智能运算。谷歌的AlphaGo人工智能机器人打败韩国世界围棋冠军李世石的新闻相信各位有所耳闻,AlphaGo人工智能机器人的背后其实是谷歌自研的TPU芯片。寒武纪的高算力芯片产品的特性和应用也与谷歌TPU类似,当然它们之间也可以算是竞争对手了。
所不同的是思元270-S4采用的是被动散热设计,最大热设计功耗为70W,定位为高能效比人工智能推理设计的数据中心加速卡。这也意味着该卡会有“功耗墙”设定,即当加速卡功耗达到阈值上限时会降低算力以保证较低的功耗和发热。
思元270-F4相当于是“满血版” 思元270-S4,最大热设计功耗150W,采用涡轮风扇进行主动散热。良好的散热和充足的供电使得思元270-F4能够发挥出思元270芯片的全部性能。该卡定位是为桌面环境提供数据中心级人工智能计算力,简而言之就是为台式机配的高性能人工智能加速卡。
虽然思元270在制造工艺上只采用了台积电的16nm工艺,但整体能耗比还是做得比较不错的。虽然单卡算力不及最新的英伟达旗舰计算卡,但5张思元270-S4/思元270-F4并行的话,峰值算力也能达到英伟达A100的水平。只是英伟达A100更先进的工艺应该在能耗比上面会有一定的优势。
其中思元100-C搭载了视频和图像解码单元,采用被动散热方式,最大热设计功耗为110W;思元100-D不搭载视频和图像解码单元,采用被动散热方式,最大热设计功耗为75W。目前思元100系列产品已经于2019年在滴滴云和金山云上得到应用。其中滴滴云采用思元100板卡加速d性推理服务,该服务用于深度学习推理任务;而金山云则采用思元100板卡加速语音、图像、视频等人工智能应用。
前面讲的尽是服务器级的计算卡,这是不是偏离了我们应该聊的自动驾驶芯片话题呢?其实不然。前面也提到了,寒武纪目前是一家专注于人工智能芯片开发的企业,自动驾驶领域确实涉足不深,但通过和其他国内友商的联合还是有一些建树的。
WiseADCU CN1自动驾驶运算域控制器提供了L3或以上级别自动驾驶系统所需的算力以及传感器连接数量需求,实现了仿真、模型、系统、架构、编码、加速、算法七个关键控制点的自主可控。
实际上威盛集团由于处理器产品性能竞争力弱,早就退出了主流X86处理器市场的竞争,市场中就剩下英特尔和AMD在角力。兆芯成立后,吃透了威盛的X86技术,并在威盛当时最新的处理器架构基础上进行全面的改进和优化,先后推出了ZX-A、ZX-C以及ZX-C+等处理器产品。
6月2日,科创板上市委发布2020年第33次审议会议结果公告,寒武纪上市获得通过,从受理到审批通过,寒武纪只用了68天,刷新了科创板审核速度。寒武纪上市后成为A股中唯一一家人工智能芯片公司,该领域的市场空间在2022年有望超过500亿美元,发展潜力巨大。打通了A股融资渠道的寒武纪究竟能否凭借其独特的技术优势进一步发展壮大呢?这谁都说不准,但可以确定的是,寒武纪的成功上市让很多投身于该领域的公司赢得了信心,看到了希望,中国人工智能芯片时代或将由此开启。
◆ 地平线机器人
好了,聊完寒武纪,我们来聊聊另外一家人工智能芯片企业——地平线机器人技术研发有限公司(下简称“地平线”)。地平线是由前百度深度学习研究院常务副院长余凯于2015年创立的,专注于自动驾驶与人工智能芯片的一家公司。余凯也是百度自动驾驶的发起人。
余凯建立的地平线,一直以来坚持的是软件和硬件相结合的方向。他认为,算法、芯片和云计算将构成自动驾驶的三个核心支点。相比起前面介绍的寒武纪注重打造高性能硬件芯片,地平线的商业模式是把以“算法+芯片”为核心的嵌入式人工智能解决方案,提供给下游厂商。打个比方比较好理解,如果说寒武纪卖的是处理器芯片,那么地平线卖的就是安装了 *** 作系统的整机。产品方面,相较寒武纪从终端到云端的芯片产品布局,地平线虽然自研芯片,但更偏重的是以产品功能来划分产品线。
硬件上,征程二代芯片内部集成了两个Cortex A53核心、两个自研的BPU(Brain Processing Unit,可用于加速人工智能算法)核心、DDR4内存控制器以及输入输出控制器,算力达到4TOPS,典型功耗为2W,这比起目前主流的Mobileye EyeQ4芯片的算力和能耗比都更优秀。
这些智能音箱有较强的自然语义识别功能,能够识别人们发出的语音命令,结合物联网技术,人们通过简单的语音命令除了能够让音箱播放在线音频资源外,还能够控制各种家电,如开关、灯泡、风扇、空调等。这就是AIoT的一个最简单的应用例子。
从硬件方面看,旭日二代芯片内部集成了两个ARM Cortex A53核心、两个自研的BPU核心、DDR4内存控制器以及输入输出控制器,算力达到4TOPS,典型功耗为2W。从参数上看,旭日二代和征程二代好像没什么差别,实际上征程二代可以看做是旭日二代的车规版,它满足AEC-Q100标准,在工作温度、电磁辐射等标准上会更高一些。虽然征程二代和旭日二代均采用台积电28nm工艺制造,但旭日二代芯片尺寸为14x14mm,比征程二代芯片17x17mm的尺寸更小,更有利于内嵌到AIoT设备当中。
和寒武纪一样,地平线同样拥有自研的人工智能加速芯片技术。所不同的是,地平线更注重软件和硬件的整合,从而为下游厂商提供成熟的解决方案。在资本市场,地平线同样受到追捧,其投资者众多,其中包括了世界半导体行业巨头英特尔和SK海力士以及国内的一线汽车集团等。未来地平线是否会和寒武纪一样登录科创板目前还不得而知,但CEO余凯对于在科创板上市是持积极态度的。我个人是支持有更多像地平线这样的企业登录科创板,更充分的竞争可以避免垄断同时促进该领域的加速发展。
◆ 西井科技
西井科技创办于2015年,它起初是一家做类脑芯片的厂商。所谓的类脑芯片简单来说就是以人脑的工作方式设计制造出来的芯片。目前大行其道的冯诺依曼结构处理器芯片,其计算模块和存储单元是分离的,芯片工作的过程中需要通过数据总线来连接计算模块和存储单元,数据传输上的开销太大从而限制着这类芯片的工作效率和能耗比的提升。
类脑芯片模仿的是大脑神经元的工作形式,大脑的处理单元是神经元,内存就是突触。神经元和突触是物理相连的,所以每个神经元计算都是本地的,而从全局来看神经元们是分布式在工作。类脑芯片由于具有本地计算和分布式工作的特点,所以在工作效率和能耗上相比冯诺依曼结构处理器芯片更有优势。
虽然这种类脑芯片看着和普通的处理器芯片在外观上没有什么不同,但其实内部运作原理与传统的处理器芯片有着本质的区别。国内除了西井科技开发出了类脑芯片,像是清华开发的天机(TianJic)芯片和浙大开发的达尔文(DARWIN)芯片都是类脑芯片。所不同的是,西井科技的DeepSouth芯片是全球首块可商用5000万类脑“神经元”芯片。
西井科技这艘大船拿着投资人动辄过亿的投资款,肯定是要追求盈利的。不管公司的技术有多超前,无法商业化在逐利的资本市场必然是无法接受的。随着人工智能和自动驾驶产业的兴起,西井科技找到了技术商业化的契机。
相比起我们前面两个厂商动辄上百TOPS算力的产品,西井这两款产品的算力确实有点拿不出手。但西井科技的这两款芯片能够实现片上学习,可以随时新增样本进行增量训练来提升推理准确率。
可能大家看到这里还是没看懂西井科技这两块芯片的优势所在,我在这里稍微解析一下大家就能够明白。目前的自动驾驶算法都是通过高性能服务器进行模型训练(让计算机去看摄像头或激光雷达等传感器获取的环境数据,学习目标判断方法),然后将训练好的模型再部署到车载硬件之中(把机器学习到的高效目标判断方法固化到车载自动驾驶系统之中)。
在实际应用方面,西井科技并没有一头冲进乘用车自动驾驶系统领域,而是在智能港口和智能矿场干出了自己的一片天地,并把触角伸向了智慧医疗和智慧物流领域。2017年10月,公司与全球知名港机巨头振华重工建立长期合作伙伴关系,这是西井科技进军智能港口的重要一步。
自动驾驶卡车要在港区自动装卸集装箱,需要自动驾驶系统精细的车辆控制、敏锐的环境识别以及准确的定位,这些都需要港区高清地图配合。西井科技的无人集装箱卡车定位精度在5cm以内,这是实现集装箱自动装卸的关键。全球首辆港区作业无人集装箱卡车作业成功,充分展现了西井科技在卡车自动驾驶系统以及高精度地图绘制领域的实力。
除了自动驾驶和高清地图绘制外,西井科技还为企业打包了一整套智能港口和智能矿场解决方案,利用人工智能技术提升港口和矿场的运作效率,同时能够进一步降低其运营成本。深挖行业中存在的机遇,逐步筑起行业壁垒是西井科技面对人工智能芯片市场激烈竞争的重要策略。
作为全球最早落地行业应用的自动驾驶团队,西井科技旗下自动驾驶品牌Qomolo逐路目前涵盖了无人驾驶跨运车、无人驾驶新能源集卡和无人驾驶矿卡三大项目。
面对乘用车自动驾驶芯片领域的激烈竞争,我认为短期内西井科技不会进入该领域。相反它会通过深耕已有的智能港口、智能矿场以及无人驾驶重卡市场,进一步筑高上述市场的壁垒,扩大自身的行业影响力和竞争力。但不能忽视的是,西井科技掌握的类脑芯片技术或有可能成为未来自动驾驶芯片领域的一个风口。
上文详细介绍中国3家知名自动驾驶芯片公司及其产品,相信大家应该对目前国内自动驾驶芯片现状有了一个更深了解。除了这三家公司,数字地图供应商四维图新通过收购杰发科技也布局自动驾驶芯片市场,但量产芯片目前尚未落地。百度的昆仑芯片以150W的功耗实现了260TOPS的算力,竞争力很强,但其定位为云端全功能人工智能芯片,主要用在服务器之上。百度在自动驾驶领域的亮点还是在于其Apollo自动驾驶软件平台。
● 全文总结:
寒武纪、地平线、西井科技这三家公司都有着各自的特色和亮点。寒武纪专注于芯片研发,产品算力最强;地平线除了研发芯片,还提供完整的自动驾驶软件方案,对主机厂开发更友好;西井科技掌握独特的类脑芯片设计,在智能港口、智能矿场以及无人驾驶卡车领域已经站稳了阵脚。整体来看,中国自动驾驶芯片在性能和功耗上和外国芯片相比并不差,如何在中国开放L3级别有条件自动驾驶车辆落地这个时间节点用产品和服务先发制人是中国自动驾驶芯片企业的制胜关键。究竟鹿死谁手,让我们拭目以待吧,好戏即将上演!(图/文/汽车之家 常庆林部分源于网络)Ampere架构的计算卡A100、桌面超算HGX A100,Hopper架构的计算卡H100、桌面超算HGXH100,将在该系列中首次引入液冷散热,从而提高散热效率、降低能耗、节省空间和成本。采用了直接芯片(Direct-to-Chip)冷却技术。功耗将比风冷版本低30%。
蓝海大脑的高性能服务器挺好的,具有高性能,高密度、扩展性强等特点。液冷GPU服务器产品支持1~20块 GPU卡,还可以选择,毕竟能可以选择也是很好的,芯片主要采用龙芯、飞腾、申威、海光、英伟达、Intel、AMD。完全定制啊,敲开心。适用于深度学习训练及推理、生命科学、医药研发、虚拟仿真、遥感测绘等场景,覆盖服务器、静音工作站、数据中心等多种产品形态,量身定制,满足客户全场景需求。技术人员给的建议都非常受用。
根据Intel之前的说法,2020年他们将首次推出两代服务器处理器,升级换代的间隔大幅缩短到4-5个月时间,其中一个是14nm工艺的Cooper Lake,另外一个是10nm工艺的Ice Lake-SP。
在目前的两代至强可扩展处理器中,14nm工艺的Skylake、Cascade Lake系列都是最多28核,这是14nm工艺下原生多核的极限,但是10nm工艺呢?之前传闻Ice Lake服务器版的核心数也不会增多,这样的话对阵AMD的64核处理器时候就更没什么机会了。
韩国网站日前在介绍华硕服务器产品线时意外泄露了Intel处理器平台的路线图,其中有些资料跟之前泄露的就不一样了,尤其是Ice Lake系列的具体规格。
Skylake、Cascade Lake这两代的处理器已经发布,不一一介绍了,14nm节点还有Cooper Lake,预计2020年Q2季度问世,Socket P+eack,最大功耗300W,这个指标比前面两代14nm工艺处理器大幅提升, 因为它实现了没插槽最多48核处理器,大幅超过了最多28个原生核心的限制 。
Cooper Lake的这个48核倒是容易解释,Intel在Cascade Lake-AP处理器就实现这个水平了,通过MCM多芯片封装,将2个Cascade Lake处理器封装为一个处理器就能让核心数大幅增长, 之前Intel做过2个24核的、2个28核的,实现了56核112线程的巨大提升 。
但是10nm Ice Lake处理器的核心数就不好解释了, 上面标注的是38核,TDP功耗也是270W,比普通28核的14nm处理器的205W大幅增加 ,增幅基本上跟核心数增加呈线性比例。
这个38核怎么来的呢?假如跟前面的48核Cooper Lake一样也是胶水MCM封装,技术上没问题,但实在没必要,更何况14nm都做到48核了,10nm没理由再搞个38核的,越做越少是没道理的。
排除这一点,那就意味着10nm Ice Lake处理器可以 做到原生38核或者更高了,也代表着Intel终于可以超越28核,在高性能服务器芯片市场上通过提升核心数的方式来跟AMD的EPYC霄龙处理器竞争了,虽然总核心数还是落后很多。
考虑到10nm工艺的晶体管密度达到了1亿/mm2,是14nm工艺的27倍,Intel技术上显然是可以做到更多核心的。
除此之外,10n Ice Lake处理器其他规格也先进不少,8通道DDR4-3200内存虽然没提升, 但支持二代非易失性傲腾内存,而且也加入了PCIe 40支持了 。
1、项目概况
当前我国采用进口处理器芯片的高端计算机占据国内市场 90%以上的份额。受信息产业安全、供应链安全等多方面因素的影响,发展基于国产处理器的高端计算机的重要性日益凸显。
目前,国产处理器芯片已经较为成熟,主要架构包括 X86、MIPS、ARM 等,不同架构的处理器芯片具有各自的适用场景和应用优势,适合多头并进,协调发展。
本项目研发基于 X86、MIPS、ARM 等不同架构国产处理器芯片的高端计算机系列产品,满足高端计算机国产化过程中不同场景的需求,打破国外厂商对中国计算机产业的技术垄断,促进中国信息产业的持续 健康 发展。项目达产后,不但能够为中国行业用户提供更多高性价比的选择,还可以保障关键信息系统的安全可控,具有广阔的市场发展空间和前景。
2、项目实施的必要性
(1)保障信息安全和产业安全
掌握基于国产处理器芯片的高端计算机设计与制造技术,是保障国家网络与信息安全的前提条件。根据工信部数据,中国集成电路进口额居各类进口产品之首;国务院发展研究中心发布的《二十国集团国家创新竞争力黄皮书》也指出,中国关键核心技术对外依赖度高,80%芯片都靠进口。在高端计算机领域,包括处理器芯片在内的核心部件几乎完全依赖国外进口,使我国高端计算机在产业链供应方面存在较大的安全隐患。
过去几年里,国产处理器芯片技术取得长足进步,先后出现了 X86、MIPS、ARM 等不同架构的多款国产处理器芯片,接下来推动基于国产处理器芯片的产业生态环境建设任务极为紧迫。研发基于国产处理器芯片的高端计算机系列产品,能够保障关键信息系统的安全可控,打破国外厂商在集成电路产业的技术垄断和安全威胁,扭转我国信息技术被动局面,促进中国信息产业的持续 健康 发展。
(2)促进信息技术应用创新和产业生态环境建设
目前全球高端集成电路产业处于垄断竞争格局,西方国家的处理器芯片巨头厂商如 Intel、AMD 等,通过数十年的持续技术创新和巨额投资,建立了强大的专利壁垒、技术标准体系和产业生态体系,牢牢控制了全球绝大部分市场。虽然我国在这个领域取得了一定的创新和突破,但我国在这个领域的产业基础非常薄弱,技术人才和资金等资源都不足。
推动国产处理器芯片的产业化,需要构建“芯片设计与制造、整机系统、软件生态、应用服务”完整创新链和产业链,方能保障相关产业的持续 健康 发展。研制基于国产处理器的整机系统,一是推动国产高端计算机产业发展,高端计算机面向国民经济主战场,属于信息行业发展的基础保障设施,只有研制基于国产处理器芯片的高端计算机,才能继续推动信息技术应用创新的产业生态环境建设,推动国产处理器在各行业领域的应用和产业发展;二是为其他相关产业发展消除潜在的隐患,我国众多产业的技术研发和运营在一定程度上依赖于高端计算机,若因各种原因导致核心芯片供应链受到影响,则可能对我国若干依赖于云计算、大数据、人工智能、高端计算机平台的行业和产业造成巨大不利影响。
(3)提升企业竞争力和可持续发展能力
长期以来,高端计算机处理器芯片的价格主导权被少数国外企业控制,国内高端计算机企业的盈利空间和盈利能力受到很大约束和限制。通过研制不同体系架构的基于国产芯片的高端计算机,将促使公司更专注于自主核心产品研发,进一步加强在该领域的技术优势,不断推出多种类型、易于为不同市场接受的系列高端计算机产品,不仅可以提高我国整机企业的盈利能力,也将极大降低我国信息化和智能化的成本,促进我国数字经济和智慧 社会 安全、高质量发展。因此,项目的实施将确保公司产品在技术规格上保持领先优势,持续满足广泛的行业用户和应用需求,进一步提高公司产品的市场竞争力,获得更好的经济和 社会 效益。
3、项目实施的可行性
(1)项目研发符合国家政策方向
“新基建”政策的本质是推动支撑传统产业向网络化、数字化、智能化方向发展的信息基础设施的建设,加速全产业的数字化转型,以促进现代信息技术与产业经济的融合,使得经济能够在数字化的辅助之下产生新的质变。
近年来,国家层面不断推动信息技术应用创新发展战略,引导我国企业研制具有自主知识产权和国际竞争力的产品,提高我国信息技术水平和信息产业的可靠性和安全性。另一方面,本项目基于国产处理芯片研发的高端计算机,对支撑我国现代服务业发展,提升传统产业竞争力,推动国内信息产品智能制造能力达到国际先进水平等方面也具有重要的战略意义。本项目属我国重点发展的战略新兴产业,符合《“十三五”国家信息化规划》等产业政策导向。
(2)公司具备本项目实施所需的技术和研发基础
公司是国内最早从事高端计算机业务的厂商之一,主要涉及高性能计算机、通用服务器产品的研发、设计、生产和销售。公司在高性能计算机体系结构、高效能计算系统、高速互连技术、液体冷却技术、高端计算机管理和运维软件、先进计算服务平台软件等方面具有深厚的技术积累。近年来,针对市场形势的变化,公司加大了基于国产处理器的高端计算机产品的预研力度,攻克了基于国产处理器的高端计算机产品研发的各项技术难题,预研样品在产品规格、产品品质、产品易用性等各个方面达到国内领先水平。
作为国内高端计算机领域的核心厂商,公司拥有完备的研发人员储备及技术服务体系。公司研发中心是国家发改委等六部委批准的国家认定企业技术中心,并获批建设国家先进计算产业创新中心。研发人员队伍知识结构和年龄结构合理,具有雄厚的系统级研发实力,在系统架构设计、硬件研制、 *** 作系统研制,以及行业应用软件定制和优化方面已有大量积累。公司成熟的生产制造体系和技术服务体系也是项目成果产业化的重要保障和成功基础。
(3)公司具备项目相关解决方案支持和销售渠道基础
公司多年来一直在自主创新领域全面布局,构建了从芯片硬件、系统解决方案到先进计算、云计算服务的全链条布局,公司产品的客户群体遍及政府机关、企业、电力、教育、医疗、科研机构等诸多行业。公司目前已开始建设基于国产处理器芯片的解决方案中心和产业生态平台,并吸纳大量周边解决方案提供商加入到基于国产芯片的产品生态系统,以平台生态合作带动国产芯片通用行业解决方案的规模化,预计未来五年能够在多个技术和行业领域实现全国产化的产业生态系统。公司在高端计算机产品开发和产业化过程中,积累了大量的技术支持经验和解决方案资源,有助于确保本项目拟研制产品的成功推广和规模化销售。
4、项目建设规划
(1)项目实施主体
本项目的实施主体为中科曙光。
(2)项目投资额
本项目总投资金额为 200,00000 万元,拟使用募集资金投入 200,00000 万元,用于研发设备购置、知识产权购置、生产设备购置、研发人员支出、研发材料及组件支出等。
(3)项目建设内容
本项目分别基于 X86、MIPS、ARM 架构的国产处理器芯片,开展高端计算机整机系统研发,设计具有国际先进水平的高性能工作站、边缘服务器、人工智能服务器、存储服务器、多节点服务器等不同规格的高端计算机产品,实现不同架构、不同规格、不同形态、广泛覆盖的国产高端计算机综合解决方案。
1)X86 架构高端计算机产品:本项目基于 X86 架构国产处理器研制 5 款高端计算机产品,包括:
① 高性能工作站 :研制基于国产 X86 处理器的高性能工作站产品。为特种应用、电力、金融等行业提供满足业务需求的高性能工作站;为制造业设计仿真、特效制作、科研开发提供支持高端显卡、大容量内存的高性能工作站;
② 边缘服务器 :研制基于国产 X86 处理器的边缘服务器产品。在边缘计算场景下,对大量靠近终端的现场数据进行实时处理,减少对数据中心的冲击和直接依赖;大幅缩短数据的传输距离,减少网络传输和延迟问题,提升应用和服务的效率和可靠性,降低成本;
③ 人工智能服务器 :研制基于双路高性能国产 X86 处理器的人工智能服务器。提供多种 GPU 连接拓扑,可为不同的深度学习应用提供不同的优化方案,为人工智能的训练、推理学习提供强大的运算能力;
④ 存储服务器 :研制基于国产 X86 处理器的高性能存储服务器。具备高密度存储空间,提供强大的计算性能和丰富的 IO 扩展,适用于对存储容量、服务器性能、可扩展性及可靠性要求严格的金融、交通、电信、能源、互联网等行业;
⑤ 多节点服务器 :研制基于国产 X86 处理器的多节点服务器。采用模块化设计,具备卓越的计算性能和强大的 IO 扩展能力,为企业级用户、云计算中心、大数据、高性能计算等多种业务提供集群服务器系统。
2)MIPS 架构高端计算机产品:本项目基于国产 MIPS 架构处理器研制 3 款高端计算机产品,包括:
① 办公工作站 :研制基于国产 MIPS 处理器的办公工作站。为政府机关、特种应用等场景提供业务办公终端,具有独特的安全设计,消除电子政务等众多战略领域的安全隐患;
② 文档服务器 :研制基于国产 MIPS 处理器的文档服务器。面向电子政务信息服务的需求,提供政府部门重要文档的存储备份、检索功能;兼容主流国产 *** 作系统、数据库软件等;消除电子政务等众多战略领域的安全隐患;
③ 存储服务器 :研制基于国产 MIPS 处理器的存储服务器。针对不同的云数据平台使用场景,提供基于 MIPS 架构处理器的基础型存储服务器产品,适用于大规模云计算环境的低成本近线存储系统。
3)ARM 架构高端计算机产品:本项目基于国产 ARM 架构处理器将研制 3 款高端计算机产品,包括:
① 办公工作站 :研制基于国产 ARM 处理器的办公工作站。为政府机关、特种应用等场景提供业务办公终端,具有独特的安全设计,消除电子政务等众多战略领域的安全隐患;
② 文档服务器 :研制基于国产 ARM 处理器的文档服务器。面向电子政务信息服务的需求,提供政府部门重要文档的存储备份、检索功能;兼容主流国产 *** 作系统、数据库软件等;消除电子政务等众多战略领域的安全隐患;
③ 存储服务器 :研制基于国产 ARM 处理器的存储服务器。针对不同的云数据平台使用场景,提供基于 ARM 架构处理器的基础型存储服务器产品,适用于大规模云计算环境的低成本近线存储系统。
(4)项目建设周期
本项目建设期 3 年。
5、项目预期效益
经测算,本项目税后财务内部收益率为 1254%,税后投资回收期(含建设期)为 622 年,经济效益指标良好。
6、项目的批复文件
本项目不涉及厂房建设及新增用地。截至本报告公告之日,本项目尚在办理备案及环评手续。
7、编制单位介绍
深圳市思瀚管理咨询有限公司是专业产业规划研究服务机构,主要提供可行性研究报告、商业计划书、行业研究报告、概念性规划、初步规划、建筑规划、产业规划、园区规划、企业IPO上市咨询等相关业务。
思瀚将人才培养作为企业发展的根本,制定人才培养“三鹰”计划,通过“雏鹰计划”加速新员工成长,通过“飞鹰计划”助推骨干提升,通过“精鹰计划”培养具有国际化视野的复合型人才,实现个人发展与组织发展的双赢。拥有资本市场及产业研究投资经验的专业管理团队审核体系人员组成,目前思瀚研究产业研究院拥有分析师、咨询顾问、产业项目行业专家为客户提供一站式、个性化、综合性的企业咨询解决方案,80%以上具备相关专业硕士学位,他们均是各自所在领域的权威人士,通过优质整合成为服务客户的强大智囊顾问团,更好的为客户提供高质量个性化定制服务。
选择最好的GPU服务器需要考虑以下因素:
GPU性能:GPU性能是选择GPU服务器的最重要因素。你需要找到具有最新GPU芯片和高性能的服务器,这将直接影响计算速度和任务处理时间。例如,NVIDIA Tesla V100和A100 GPU都是目前最强大的GPU芯片。
内存容量:GPU服务器的内存容量越大,可以处理的数据就越多,从而提高处理效率。如果你的任务需要处理大量数据,那么选择内存容量较大的服务器是非常重要的。
存储容量和类型:选择具有足够存储空间和高速存储设备(如SSD)的服务器,这对于大数据量的处理和存储非常重要。此外,考虑存储设备的类型,例如NVMe SSD比SATA SSD更快,但成本更高。
网络连接速度:GPU服务器需要与你的本地计算机或其他服务器进行通信,因此网络连接速度也很重要。选择具有高速网络接口卡(NIC)的服务器,并考虑网络传输速度和延迟。
价格:选择适合你预算的GPU服务器。价格取决于服务器的配置、性能和品牌等因素。选择具有良好性价比的服务器,以便在预算范围内获得最佳性能。
品牌和技术支持:选择知名品牌的GPU服务器可以获得更好的技术支持和保障。特别是如果你是初学者,选择品牌信誉良好的服务器可能更加可靠。
最后,你应该选择最适合你的任务需求的GPU服务器,不仅要考虑服务器的性能,还要考虑价格、品牌和支持等因素。
新款的ADI仿真器比较
EBF-ADSP-EMUIIADZS-ICE-100B
仿真系列:Blackfin系列仿真系列:Blackfin系列
外观:精密封装外观:裸板
速度:15Mbyte/s(12Mbps)速度:255KB/S
供电方式:USB供电、支持热插拔供电方式:USB供电、支持热插拔
调试软件:完全兼容ADI公司的VisualDSP45、VisualDSP50集成开发环境
货期:现货供应货期:6个月
质保:保修三年质保:保修一年
售后:方便快捷售后:需要走国外流程
everliang@eflagtech
做深度学习的话,我还是可以有立场说些的。因为我们实验室当时就遇到了这些问题,选择深度学习GPU显卡时建议选择专门做液冷的A100或者RTX3090、RTXA6000、RTXA40等卡,蓝海大脑的液冷GPU服务器具有高性能,高密度⌄扩展性强等特点。液冷GPU服务器产品支持1~20块 GPU卡,还可以选择,毕竟能可以选择也是很好的,芯片主要采用龙芯、飞腾、申威、海光、英伟达、Intel、AMD。完全定制啊,敲开心。适用于深度学习训练及推理、生命科学、医药研发、虚拟仿真等场景,覆盖服务器、静音工作站、数据中心等多种产品形态,量身定制,满足客户全场景需求。技术人员给的建议都非常受用。欢迎分享,转载请注明来源:内存溢出
评论列表(0条)