全球超算竞赛

日期:12-07
科技部超算E级

原标题:全球超算竞赛

导读:多位接受采访的业内人士告诉21世纪经济报道记者,从目前各国研发进展来看,美国很可能会占据超算榜第一名两年、四届以上的时间,不过超算竞争的焦点已经转移到了下一代的百亿亿次竞争。

本报记者陈宝亮北京报道

11月底,科技部高性能计算重点专项在北京、上海、大连、广州等地对多个研究任务进行中期检查。这场为期五年、总计20个重点研究任务的E级超级计算机专项,如今已进程过半。

E级超算(exascale-levelsupercomputer,每秒百亿亿次)是目前全球公认的下一代超级计算机,中国、美国、日本、欧洲都在启动国家计划、期望在2020-2022年间推出E级超算系统。如果科技部高性能计算重点专项如期完成,中国将率先在2020年推出3套E级超级计算机系统,重新拥有“全世界最快的计算机”。

过去几年中,中国超算曾经11届登上全球超算TOP500榜首。2010年,中国超算天河一号二期以每秒2566万亿次计算首次登顶。其后,2013-2017年间,中国的天河二号、神威·太湖之光超级计算机连续5年10届领跑TOP500。但在2018年6月、11月,IBM的Summit、Sierra超算系统先后超越太湖之光,将第一、第二名收入囊中。

多位接受采访的业内人士告诉21世纪经济报道记者,从目前各国研发进展来看,美国很可能会占据超算榜第一名两年、四届以上的时间,不过超算竞争的焦点已经转移到了下一代的百亿亿次竞争。

中国引领超算路线

全球超算TOP500榜单自1994年开始统计,但2000年之前,中国鲜有登榜。直至2002年,联想开发出深腾1800高性能计算集群,成为首个进入TOP500榜单的中国本土超算,当年排名43位。

其后,曙光、浪潮也相继登榜。但很长一段时间内,包括中国在内的全球超算市场几乎被IBM、惠普、Cray等巨头垄断,中国部署的超算系统数量也并未大幅增长。

但2008年之后,中国迎来了转折点。中科院计算所并行软件实验室主任、国家超算济南中心主任张云泉向记者介绍:“当时中国率先尝试了新型的体系架构,而这种体系架构引领了这一代的全球超算的技术路线,中国超算也顺势崛起了。”目前,TOP500中绝大多数超算都是采用了CPU+GPU异构体系架构,但这种架构最早是在中国开始大规模采用。

2008年,时任中科院过程工程研究所所长、中科院副院长李静海率先使用240块英伟达GPU搭建了第一台代号为Mole-9.7的GPU机群,其后通过与联想、曙光联合研发了GPU机群系统,过程工程研究所在2009年首次实现了单精度千万亿次的超算系统。

其后,天河一号同样采用了CPU+GPU异构融合体系架构,2010年11月,天河一号二期以2566万亿次运算速度震惊了世界。

“英伟达最初就是想在超算领域推广GPU,但美国超算界认为GPU在科学计算领域表现太差,所以没人愿意尝试。”张云泉向记者介绍,“反而中国的大胆尝试,开创、引领了这一体系架构,并把美国超算也带到了这条技术路线上。”目前,排在榜首的Summit同样使用了PowerCPU+GPU架构,其中2.8万块GPU提供了90%以上的算力。

其后,超算产业与人工智能碰撞。“超算的排行主要依靠Linkpack测试,系统80%的算力在计算矩阵乘法,而深度学习算法的核心,也是矩阵乘法。”超算产业一举突破了此前的学术、科研、能源、航天、军工等领域,进入到互联网的大数据、人工智能产业。张云泉认为:“现在,超算已经超出了最初的科学计算范畴,而是融合了人工智能、科学计算、大数据的多元计算。”

进入2015年,中国互联网公司开始向TOP500申报,中国超算系统排名数量激增。2015年11月,中国上榜超算系统达到109套,仅次于美国的199套,比上届增长了近200%。2016年6月,中国上榜168套系统,首次超过美国,后者上榜165个系统。而最新一届的TOP500中,中国上榜227套系统,是美国的2倍。同期,来自联想、曙光、浪潮的超算系统,也从2015年初的不到30个,增至接近300个。

发展模式转型

不过,快速成长的超算,给中国带来的投资收益却远低于其他国家。根据美国能源部科学办公室持续追踪统计,2018年6月,全球各国在超算领域每1美元的投入,可以产生463美元的收益。在英国、日本,1美元的超算收入可带来高达730、1200美元的回报,在美国则为373美元,但在中国,这一回报却只有8.5美元,不及全球平均值的2%。

“中国在超算上,走的是政府引领路线,打造的超算系统性能遥遥领先于科研、产业需求。”张云泉介绍,“每个国家最初都是这样一个阶段,只不过国外早就走过了这一阶段,他们现在都是根据科研需求制定超算路线。”

一直以来,中国的超算水平均超过了应用需求。但2016年以来,中国共有6项超算应用入围戈登贝尔奖提名,这是高性能计算应用领域的最高奖项。2016、2017年,基于太湖之光的“全球大气动力学全隐式模拟”、“非线性地震模拟”两项应用成功获得戈登贝尔奖,这一获奖时间比业界预期提前了五年。

“中国不仅有能力研制世界一流的超算,还能有效利用顶尖的计算性能解决高精尖的科学计算问题,我们现在需要根据科研、应用的能力去统筹超算路径。”张云泉认为,“科研、应用能力的提升,让我们有希望在未来5-10年的时间里,把发展模式从机器驱动转变为应用需求驱动。”

而科技部高性能计算重点专项中,E级高性能计算机系统、高性能计算应用软件研发、高性能计算环境研发并列为三大技术方向。2018年7月、8月、10月,天河三号E级原型机、神威E级原型机、曙光E级原型机先后完成交付。

“通过太湖之光的培育,现在已经有几十个自己开发的超算应用,而且这些应用现在都很快就移植到了神威E级原型机上,出了很多测试结果,神威的超算生态已经成型了。”张云泉向记者介绍,“而且,在技术路线上,神威的众核架构,又走在了前面,很可能会成为E级超算的主流架构。”

事实上,美国超算先驱UIUC大学曾预测,E级超算需要采用众核架构,但Intel为了延续其X86生态的兼容性不敢轻易尝试新的体系架构,直到Intel超算Aurora(极光)失利之后,Intel近期才开始尝试众核路线。同时,日本富士通近期发布、用于E级超算的A64FX处理器,也采用了众核架构。而神威则从问世之初就采用了众核架构,技术路线上领先数年。

不过,虽然中国拥有技术路线优势,但国际E级超算竞争异常激烈。以美国为例,美国政府每年拨款数亿美元支持先进计算研究(ASCR)项目,2017年,ASCR专门成立了新的E级计算项目(ECP),且ASCR经费开始逐渐上涨,2016、2017年经费分别为6.21亿美元、6.63亿美元,而2018、2019年预算则涨至8.1亿美元、8.99亿美元。

2018年4月,美国能源部宣布将以18亿美元的预算采购3套E级超算系统,分别部署在阿贡实验室、橡树岭实验室、劳伦斯利弗莫尔三个国家级实验室,且2021年之前至少有一套交付使用。

除美国之外,欧盟也在加大对超算的投入。2018年9月,欧盟20多个成员国发起欧洲高性能计算联合承诺(EuroHPCJU)。该计划预计在2019-2020年间投入14.2亿欧元,采购两台P级、两套Pre-E级超算系统,并开发欧洲自主CPU、E级超算系统、应用软件等。而在接下来的计划中,欧盟预计在2021-2028年间投入27亿欧元,部署多套E级超算系统。

相比之下,国内政府对于超算的投入并不多。根据中国网格网络运行管理中心统计,2015-2017年,科技部、自然科学基金委、地方政府对超算总投入约10亿元。该数字远低于欧美国家。而据知情人士介绍,“目前,国内科技部对E级原型机的项目指南还没出,大家还没有向财政部申请E级原型机的资金,所以国内E级原型机有可能会拖延,与美国撞车,届时的竞争更精彩。”

康得新改道现金收购上海傲邦 大股东高质押困局稍解 纾困进行时
相关阅读: