中国的超算技术发展中建立了四大超算技术中心,曙光、天河又屡次拿下业界Top500排行榜性能冠军,风头一时无两。其中,国内研发机构与Intel、Nvidia的合作为国产超算的发展贡献了很大力量,那么为何过去对这类合作并无限制的美国政府会突然宣布对华技术封锁呢?
以往超算的核心芯片大都可以在公开市场买得到,不可能被彻底禁运。多年以来美国也因为此一直没有对中国的超算技术发展加以干涉。但是随着业界形势的变化,一些新的状况出现了。最关键的变化是异构计算的崛起。过去超算主要使用常见的Xeon CPU搭建,而现在的高性能HPC往往会搭载大量的专用计算芯片,如Xeon Phi、Tesla和FirePro。这些芯片产量较少,在市面销售不多,而且编程模式比较特殊。超算研究机构为了加快研制速度往往会与芯片企业合作,提前半年甚至更久拿到未上市的新一代计算芯片,并在后者帮助下进行系统编译优化工作。
国产天河2号超算就是与Intel合作,提前数月拿到了Xeon Phi计算卡并完成了部署。待Xeon Phi正式发售时天河2号已经跑完了测试项目,准备进入商业运行阶段。彼时负责天河2号项目的国防科大与Intel进行了深度沟通,获得了大量编程指导,很顺利地进行了系统代码部署。如果没有这层合作关系,不仅天河的工期会大大延后,由于异构计算的复杂性国防科大也很难独立完成超算的软件调试优化任务。
美国意识到了异构计算时代芯片企业与超算制造方合作的重要性。只要掐断美国企业和中国机构的合作关系,即便后者能够从公开市场买到芯片,也需要等到芯片正式发售后才能做到;缺乏芯片设计商的指导,中国的超算项目也很难充分利用芯片性能,进而在与美国同行的对抗中丧失优势。如此一来,美国便可重夺超算性能冠军宝座,而中国会遇到不小的麻烦。以天河为例,本来今年其计划升级到新一代Xeon Phi芯片,继续坐稳冠军位置,但突如其来的禁令必然会影响原定方案。今年天河很可能会让出性能之王的称号了。
那么,中国的超算项目能改用国产芯片取代进口技术吗?
中国很早就开始研制自主知识产权的超算用芯片,先后诞生了计算所的龙芯、国防科大的飞腾和江南所的申威处理器。早在2008年,计算所曙光超算项目就计划使用8000-10000颗龙芯3B CPU搭建第一台国产千万亿次HPC。遗憾的是龙芯3B直到曙光超算部署两年后才小量生产,且首批产品问题多多性能低下基本没有实用性,最后只部署了3000颗作研究用。国防科大的天河超算用到了科大自主设计的飞腾CPU,但只用在互联网络,没有承担计算任务。江南所的申威部署在一台神威超算中,整体计算能力不是很突出。
几种国产芯片的主要问题是它们的性能远逊于美国对手:单芯片浮点性能不过200G Flops以下,远不如新一代Xeon E5的700G Flops,更比不上Xeon Phi、Tesla等众核协处理器。而且这些国产CPU的内存性能都很不理想,大大限制了实际应用的表现。这就是为什么国产超算依旧青睐进口芯片,而对国产芯片不甚感冒的原因。
倘若用这些国产芯片取代进口的Xeon Phi、Tesla,需要部署十倍数量以上的计算节点才能获得相同的性能。但现有的网络技术无法支持数以十万计的节点高效互联,换句话说这条路是不可行的。想要取代进口芯片,中国必须发展出顶尖的异构计算技术。但是制造类似Xeon Phi这样的芯片有很大难度:大量核心之间的互联不好做;高带宽的内存系统很难做;芯片之间的通信总线要求很高。过去几年来国内研究机构在这几项技术领域只是有一定探索,水平与Intel、Nvidia等差距较大。想要追上世界一流水平,制造出匹敌同时代Xeon Phi、Tesla的芯片,没有几年的时间和大量的资金、人力投入是不行的。江南所正在研制的众核处理器有望组建一套10亿亿次超算,但节点效率、能源效率等指标都不会很高。
进口芯片不再容易,国产技术短时间难以成熟,中国的超算产业将迎来数年的低潮期。连续几次夺冠的辉煌在未来几年是难以见到了,国人只能坐视美国重新坐上霸主地位。目前美国能源部分别选择Intel、Nvidia、IBM的方案订购了三台20-30亿亿次规模的超算,将在未来两年陆续交付。到2018年之前美国都会称霸超算性能排行榜。
但是美国的技术封锁将大大刺激中国政府的相关政策:即使是为了“争口气”,中国也会向几大芯片研究机构注入前所未有的资源来加快研究进度,力争早日摆脱对美国技术的依赖。国产芯片会因为美国的禁运迎来大好的发展机遇,前进速度也会成倍加快。在国家推动下,数年后中国自主芯片产业就会崛起为不可忽视的力量,不仅在超算领域,而是在服务器、PC、移动设备产业与美国企业展开全面对抗。从这一角度来看,美国的禁运对中国长远来看是好事一桩。没有压力就没有动力,这次中国不想上也得上了。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)