原标题:解码超算:自主化迭代打开基于人工智能的应用空间
本报记者骆轶琪深圳报道
导读
中国国家级超算中心已有6所,在地方性发展和应用方面也从传统的国民和军事应用,接档到对人工智能和大数据算法的支持之上。
在基础的前沿科技超级计算机发展方面,世界大国激烈的竞争态势从未停息。
美国时间11月12日发布的新一期全球超级计算机500强榜中,美国能源部下属橡树岭国家实验室开发的“顶点”(Summit)蝉联冠军,其处理器数量从228万多个增加到近240万个,浮点指令周期(PFLOPS)从半年前的每秒12.23亿亿次提升至每秒14.35亿亿次。第二位来自美能源部下属劳伦斯利弗莫尔国家实验室开发的“山脊”(Sierra)。
中国的“神威·太湖之光”和“天河二号”分列第三、第四位,前者浮点指令周期为每秒9.3亿亿次。
中国在超级计算机方面曾多次拿下世界第一,这项被称为“国之重器”的技术中,无论研发、还是应用落地方面,都在不断推演迭代。
接受21世纪经济报道记者专访时,国家超级计算长沙中心副主任、湖南大学教授彭绍亮介绍,上世纪70年代,中国对超算的研究还依靠引进主机,进入21世纪,以天河、神威系列为代表的超算主机在全球不断挑战榜首。自主化方面,也由借助英特尔芯片支持,到逐步替换搭载自主研发的飞腾系列芯片,并不断迭代。
目前,国家级超算中心已有6所,在地方性发展和应用方面也从传统的国民和军事应用,接档到对人工智能和大数据算法的支持之上。
“超算发展是跨层的,从底层芯片技术、存储互联技术,到上层应用必须全方位发展。目前越来越多关注点从底层到了上层移动。底层再好的计算和硬件,还是希望支撑更好的上层应用,比如AI和大数据应用。我们希望通过超算解决实际的大规模计算应用,这也是近年国际普遍趋势,即通过跨层联合设计,来指导新一代超算设计。”彭绍亮总结,由应用驱动整个超算发展,从而设计更快、更适合应用的超级计算机。
自主研发迭代
从榜单来看,中国上榜超算数量领先,且在能效上有所提升;但在总运算能力上,美国领先,占比38%,中国占比31%。
我国对超级计算机的研发,可以追溯到上世纪70年代。彭绍亮告诉记者,彼时国内尚未掌握自有机器生产制造技术,仍然依靠进口。
进入80年代,银河-1号诞生象征着中国拥有了自主知识产权的超级计算机;直到2009年天河一号作为我国首台千万亿次峰值系统位居榜首,此后直到2015年,天河系列超算主机持续蝉联世界第一位。
“一个国家的综合国力,尤其体现在计算能力上。当前,是美国、中国、日本、欧洲几大板块共同竞争。”他指出,虽然算力方面中国尚未登顶,但从IT基础科研角度看,超算领域中国已有与世界上强势力量同台竞争的能力。
本次公布的榜单中,排在前面的中国超算主机包括神威、天河、曙光等系列,背后是不同科研机构和基于不同算法架构搭建的计算机系统。
彭绍亮出自航天科技大学,参与研发和应用的主机均为天河系列。他向记者介绍,不同系列主机意味着不同的技术路线。天河系列主机架构,在互联性方面世界领先,即通过高速互联,提高计算机整体计算和处理数据能力。
这也意味着,天河系列超算主机增强底层互联能力之后,在大数据处理和人工智能支撑方面,有着先天优势。“越是对计算规模需要大的应用,越能发挥优势。通过把处理器互联在一起,可以解决大的科学计算问题。”
最核心的芯片部分,在超算研发早期,中国主机运用的是英特尔系列处理器。近年来也推出了自主研发的处理芯片。“比如国防科技大学研发的下一代超级计算机,打算用自主研发的飞腾系列芯片。”彭绍亮介绍,虽然目前,在性能上存在差距,但可用性已经解决。
平安证券分析师闫磊指出,“神威·太湖之光”超算中,将自主可控做得更为彻底,完全使用了国产众核芯片申威26010,该芯片可以提供加速功能。
闫磊分析,相比美国,我国超算起步较晚,但这也意味着中国发展超算没有历史包袱,不需要考虑是否兼容以前的应用。美国在超算部署上明显早于中国,而且在应用和编程方面优势也较为明显,所以他们受到的限制比较多,尤其是需要考虑兼容现有超算资产。
应用扩围AI
超级计算机技术的应用其实早就渗透到日常生活中。
彭绍亮向21世纪经济报道记者介绍,超算的应用分为传统科学功能计算和新一代支持大数据与人工智能的运算。前者具体包括对天气预报、流体力学模拟、飞行器设计等国民生产和军事应用等领域的落地。后者是随着智能时代的到来的潜移默化的产物。
“在设计天河一、天河二时,2010年左右我们就在思考,这么大的计算机除了支持传统的科学功能计算,也要支持AI应用和大数据分析。”他进一步解释,AlphaGo就是一台典型的超级计算机,通过整合大量计算资源进行大规模计算。目前来看,天河一号的体系结构类似AlphaGo,即CPU+GPU的架构。
2016年AlphaGo击败李世石的消息传出时,彭绍亮就曾做过测算,“当时天河一号的计算能力相当于10-20台AlphaGo,意味着可以进行10-20盘同时对弈。”
而他所在的国家超级计算长沙中心属于国家级6大超算中心之一,其目标就是产学研用的转化。“长沙地处中南地区,辐射湖南、湖北、江西、四川、河南、贵州等地,相对来说规模没有那么大,但我们更希望让中小企业应用起来,解决企业数据分析和人工智能计算问题。”
具体到应用场景,彭绍亮介绍,目前长沙中心已经在气象检测、金融预警、影像渲染、建筑设计等领域有较大落地实现。
“比如我们跟招商银行总行合作,提前对不良企业的信贷和关联交易进行有效检测和预警。长沙中心是国内最早做金融大数据平台的超算中心。”他称,中心还与湖南广电合作,比如《爸爸去哪儿》电影渲染就是由中心完成。
此外在国家近年来加速推进的BIM(建筑信息模型)领域,超算也能在地下管网、地面楼宇和道路设计等方面,先行仿真模拟推算,再推出实体。“中国是北半球最大的建筑试验场,涵盖到修地铁和管网等领域,很多都是基于这个软件在操作。”
彭绍亮负责的是生命科学方面的研发和应用。“应用早期我们就在想,超算对生命科学能起到怎样的颠覆性作用?因此我们首先瞄准全世界误诊率最高的10种疾病尝试,做出来的结果让我们很惊喜。”他介绍,比如肺结核病,在全世界诊疗的准确率平均在50%左右,如今借助超算,可以把诊疗准确率提高20%左右。“因为有海量的数据、症状包括临床表现。每来一个病人,就可以整合所有数据进行一次大规模运算。那么结合千万个医生的智慧,给一个病人看病。做出来的精度,比一个医生看病更精准。”
目前长沙中心已针对36种疾病建立模型,彭绍亮未来希望借助更多政府和企业的力量,将疾病覆盖到300种乃至3000种。“我们想建立一个全科医生的通用模型。之所以考虑覆盖3000种疾病,是因为90%的人一生只会得不超过3000种疾病。”
但IT出身的他在生命科学方面制作模型面临诸多难题。因此中心在前期模型搭建方面就花了好几年时间。“把疾病参数输入到模型中,筛选重要数据,之后模型如何计算,如何跟数据进行多轮次迭代。”他介绍,“一般相对简单的疾病做模型要到3周左右。”
“我们希望把长沙中心打造成生物医疗大数据中心。”彭绍亮指出,该中心在生命科学方面重点关注三个领域:AI辅助诊疗、药物设计、精准医疗。目前已经把长沙中心研发的超算机器人应用在了医院中,辅助医生提高问诊效率和精准度。
而在精准医疗方面,通过与华大基因合作,分析其业务流水线,长沙中心把数据分析过程中,出现瓶颈的软件移植到超算中心上,从而让基因分析技术能够更多用到临床。比如在天河二号上构建一个人类基因组成的相关软件流水线,把2000人超过300TB临床基因数据,在超算上重新测序,测试时间可以控制在4小时内完成数据分析。而这些数据在普通微机上运算,大概需要至少6-7个月。
“超算擅长进行复杂的计算,远超过一个个体医生的计算思维能力。越是复杂的医疗问题越能够发挥超算的能力。”彭绍亮总结。