2018年中国高性能计算机发展现状分析与展望

2019年1月31日10:03:012018年中国高性能计算机发展现状分析与展望已关闭评论 81 views

张云泉

(中国科学院计算技术研究所计算机体系结构国家重点实验室 北京 100190)

 要 根据2018年11月发布的中国高性能计算机TOP100排行榜的数据,文中从总体性能、制造商、行业领域等方面对国内高性能计算机的发展现状进行了深入分析。中国TOP100的平均Linpack性能继续保持高于国际TOP500平均Linpack性能的局面,且TOP100的入门性能门槛仍然超过TOP500。中国TOP100上的超级计算系统均是国产超算系统,曙光和联想并列为数量冠军,曙光、联想和浪潮三强争霸的局面继续保持和加强。在此基础上,根据十七届排行榜的性能数据,对未来中国大陆高性能计算机的发展趋势进行了分析和预测。根据新的数据,笔者认为:峰值Exaflops的机器将在2019-2020年间出现;峰值10Exaflops的机器将在2022-2023年间出现;峰值100Exaflops的机器将在2024-2025年间出现。

关键词 高性能计算机,TOP100,排行榜,性能,分析

中图法分类号 TP38

文献标识码 A

DOI  10.11896/j.issn.1002-137X.2019.01.001

 

State-of-the-art Analysis and Perspectives of 2018 China HPC Development

ZHANG Yun-quan

(State Key Laboratory of Computer Architecture,Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190,China)

Abstract Based on the data of China’s high performance computer TOP100 rankings published in November

2018,this paper made an in-depth analysis of the current development status of high performance computers in China from the overall performance,manufacturer,industry and other aspects.The average Linpack performance of TOP100 in China continues to be higher than that of the international TOP500,and the threshold for entry performance of TOP100 still exceeds that of TOP500.China’s supercomputing system on TOP100 has almost all been a domestic supercomputer system,and the Shuguang and Lenovo have become the champion on the number of systems on Top100.The situation of the three strong hegemony of Shuguang,Lenovo and Inspur continues to be maintained and strengthened.On the basis of this,according to the performance data of the seventeenth ranking list,this paper analyzed and predicted the development trend of high-performance computers in mainland China in the future.According to the new data,we believe that machines with peak Exa ops will appear between 2018 and 2019;machines with peaks of 10 Exa ops will appear between 2022 and 2023;machines with peaks of 100 Exa ops will appear between 2024 and 2025.

Keywords High performance computer,TOP100,Ranking,Performance,Analysis

1 背景

自1993年起,国际上每年都会按Linpack的测试性能公布在世界范围内已安装的前500台高性能计算机排行[1],为高性能计算机的研制生产、市场发展、应用交流和趋势分析预测提供了重要参考。在2002年之前,我国的高性能计算机未曾向国际申报Linpack性能测试结果,故未列入国际TOP500排行榜;但在中国软件行业协会数学软件分会首次发布中国高性能计算机排行榜的当年(即2002年),就实现了零的突破。在中国TOP50排行榜中名列第一的联想深腾1800万亿次机群在2002年世界TOP500中排第43名,结束了在世界TOP500排行榜中没有国产高性能计算机的历史。2003年,在中国TOP100排行榜中名列第一的联想深腾6800万亿次机群在2003年世界TOP500中排第14名,创造了国产高性能计算机的历史新高。2004年,在中国TOP100排行榜中名列第一的曙光4000A更是取得了6月份世界TOP500排行榜第10的历史性突破,这引起了世界的关注。2010年9月发布的国产天河一号A千万亿次超级计算机通过采用先进的CPU+GPGPU的异构混合加速体系架构,以2.56 PFlops的Linpack性能夺取2010年11月国际TOP500排行榜的第一名,这是中国国产超级计算机首次夺得世界冠军;我国安装的超级计算机的上榜数量也首次超越日本和欧盟,排名世界第二,仅次于美国,这标志着我国超级计算机硬件的研制水平已在国际上领先。2013年,我国的高性能计算机科研工作者戒骄戒躁,刻苦攻关,勇攀高峰,于当年6月凭借国防科技大学研制的天河二号超级计算机再次夺取世界TOP500第一名。迄今为止,中国研制的天河系列超级计算机已经7次夺取世界第一,天河二号更是取得了六连冠的辉煌成绩,牢牢稳固了中国在世界TOP500超级计算机冠军俱乐部中的位置。安装在中国大陆的超算系统在2016年6月和11月的TOP500上的数量再创历史记录:6月份在历史上首次超过美国,排名世界第一,且11月份继续保持与美国持平;而联想生产的超算系统更是首次闯入世界前二强,排名仅次于美国HPE。中国超算系统的研制水平和能力经过十多年的快速发展,已经跻身世界先进水平的行列。2016年,中国超级计算系统不仅连续8次夺取世界TOP500第一名,连续两次夺取TOP500数量冠军,而且在全球超算大会SC16上首次获得了戈登贝尔奖;更为可喜的是,由中国科学技术大学安虹教授带领的大学生团队代表中国一举夺得了世界大学生集群大赛的Linpack单项冠军和总冠军。对于中国超算界来说,2016年是“中国超算大满贯年”。2017年,中国超级计算系统继续保持上升势头,太湖之光继续领跑,与天河二号一起连续5年共10次夺取世界TOP500第一名,创下新的历史记录。中国团队在全球超算大会SC17上再次获得戈登贝尔奖。2018年11月公布的TOP500榜单中,我国以227台数量远超第二名(美国)的109台。我国联想制造的超算系统达到了140台,位列厂商第一,浪潮和曙光分别以84台和57台位列第二、三名,3家厂商共计281台,超过总数的一半,其中出口54台,这充分说明了我国超算的发展已经牢牢占据领先地位。TOP500超级计算系统作为计算科学的必备基础设施,已经成为国家之间的战略必争点和创新转型的利器,各国都投入巨资争夺世界制高点,以超级计算机系统为核心的算力经济时代已经到来。经过30年的快速发展,中国研制超算系统的能力已经跻身世界先进水平的行列。美国虽然仍是世界超算强国,但是其在TOP500上的数量份额已不足25%,难以恢复20年前独霸世界TOP500中70%的系统的盛况。

此次测评按国际惯例选用Linpack测试(HPL)[4],该软件包的最新2.0版本于2008年9月底发布。本文给出对中国计算机学会高性能计算专委会于2018年11月发布的中国高性能计算机性能TOP100排行榜[1]数据的深入分析与展望。文中的图表数据主要来源于中国HPC TOP100。后文将中国HPC TOP100简称中国TOP100[2]

2 总体性能分析

图1和表1分别给出的是中国TOP100的总体性能发展趋势图以及TOP10计算机的详细情况。

与2018年11月发布的世界TOP500高性能计算机的情况相比较,可以看到:

(1)2018年11月世界TOP500总Linpack性能达到了1414 PFlops,是2017年845 PFlops的1.67倍,增速较2017年有大幅提高;根据2018年中国TOP100排行榜的数据,中国TOP100的总Linpack性能是307.8 PFlops,是2017年223.65 PFlops的1.37倍,增速从2017年的1倍速提高到1.37倍速。这说明世界超级计算的发展增速有所回升。

中国研制的神威太湖之光超级计算机以93 PFlops的Linpack性能蝉联了4次世界TOP500冠军,使得中国研制的国产超级计算机在世界TOP500的冠军位置上;保持了历史性的10次!2018年美国制造的两台超算系统Summit和Sierra超过神威太湖之光,其中Summit的峰值达到200 PFlops,其Linpack性能首次突破百P(达到143 PFlops);Sierra仅以微弱的优势超越神威太湖之光获得亚军。2019年神威太湖之光能否继续保持世界季军的位置,充满了变数。

(2)2018年11月,世界TOP500机器的Linpack性能都超过了847 TFlops;2018年,中国TOP100机器的Linpack性能都超过了1127 TFlops,中国排行榜的上榜门槛再次超过世界TOP500。中国TOP100中有98个系统是机群,机群体系架构的数量继续保持绝对的优势。其中,采用异构加速体系架构的机器数量达到了32套,且由过去的集中在前几名和比较大的机器变为分散在TOP100中,这样的变化表明:随着深度学习等大数据应用的普及,GPU加速的异构体系结构获得了更广泛的应用。

(3)世界TOP500中TOP10的最低性能都超过了17 PFlops,其中Cray公司3台,IBM 3台,国家并行计算机工程中心、国防科技大学、日本富士通公司和联想各1台。高端能力超算(TOP10)的研制呈现出几家独大的局面,中国、美国、日本和欧盟都在积极占领制高点,且都发布了2021年左右的E级超级计算机的研制计划,抢占下一个制高点。中国TOP100中,TOP10的最低性能大于2.07PFlops,其中国防科技大学4台,曙光3台,神威2台,浪潮1台。

(4)世界TOP500中有476套系统使用Intel处理器,达到创记录的95.2%的比例。采用异构加速体系架构的系统数量再次增加,从2017年的102套增加到138套。中国TOP100的趋势与TOP500一致,2017年有32套系统采用了GPU/MIC加速,与2017年的30套基本持平,这主要归因于深度学习算法在互联网公司的成功应用,使得CPU+GPU的异构加速集群成为当前互联网公司进行AI训练的首选体系架构。

(5)亚洲国家在世界TOP500上的机器数量有大幅度增加,从251台增加为276台以上。排行榜中来自中国大陆的系统有227套,总数排世界第一。虽然中国上榜的数量排名世界第一,但我们应该清醒地认识到:其中大部分的机器并非应用于传统的科学计算应用,而是新兴的互联网云计算和大数据应用。

(6)目前中国TOP100排行榜中机器的平均Linpack性能为3.07PFlops,是2017年2.23 PFlops的1.37倍,增速有所回升;2017年世界TOP500排行榜中机器的平均Linpack性能为2.82 PFlops。国内和国际排行榜的平均性能双双首次超过2.5 PFlops。我国发布的神威太湖之光和天河二号两台超级计算机的Linpack性能就占到了中国TOP100的总性能的一半以上!如何用好神威太湖之光和天河二号,发挥其巨大的计算能力,做好中国的超级计算应用软件,成为未来两三年内中国超级计算行业面临的挑战性问题。

2018年中国高性能计算机发展现状分析与展望

图1 中国高性能计算机年度性能发展趋势(2002-2018年)

Fig.1  Annual performance development trend of China HPC(2002-2018)

 

表1 中国TOP100排行榜中的TOP10(2017年11月)

Table1 TOP10 in China TOP100(2017.11)

2018年中国高性能计算机发展现状分析与展望

3 制造商分析

图2为中国TOP100制造商的上榜机器数量份额图。

2018年中国高性能计算机发展现状分析与展望

图2 中国TOP100制造商机器数量份额图(2018年11月)

Fig.2  Share chart of China TOP100 manufacturer’s number of machine(2018.11)

2018年中国TOP100排行榜上各厂商的机器数量份额出现了比较大的变化,国外厂商制造的机器数量不再出现在榜单中(历史首次),这说明国产超算在国内市场上已经占据绝对主导地位。国产机器的市场份额主要被曙光、联想和浪潮三家瓜分,2018年曙光和联想并列第一,浪潮以12台位列第三。HP公司从曾经的中国TOP100排行榜连续多年的冠军,变成去年仅有一套系统在榜单上,再到2018年退出国内超算舞台,其变化历史让人不胜唏嘘。

图3给出的是2002-2018年中国TOP100国内外厂商系统份额的趋势变化情况。

在装机数量上,前三名分别为曙光、联想和浪潮,曙光(40%)和联想(40%)并列第一,浪潮(12%)位列第三。华为公司作为HPC厂商继续出现在2018年的TOP100上,并继续占据2%的份额。浪潮、曙光和联想(Lenovo)公司虽然夺得机器总数量的前三名,且总数量达到惊人的92台,但其机器总性能远低于神威和国防科技大学的机器性能总和,这说明这些机器仍然属于中小规模。虽然曙光2017年丢失了冠军宝座(被浪潮夺得),但是2018年曙光通过其中科院先进计算联盟,依托原有城市云的积累,在全国攻城掠地,先后拿下太原、合肥等重要城市,以及国家气象局和地球模拟器等亿元大单,在原有高性能计算方向强势回归,又重新夺回冠军并与联想并列第一,实现了9次TOP100装机数量冠军的传奇。联想公司通过对IBM公司X86HPC产品线的并购,第五次在机器数量份额上与曙光并列,但是如何保持良好的发展势头并持续大力投入,是联想公司需要解决的问题。目前的中国超算市场初步形成了浪潮、曙光和联想三足鼎立的格局,这3家共占据了90%以上的份额,国外厂商在HPC领域已经淡出中国市场。国产厂商在逐渐获得国内市场的垄断优势之后,开始纷纷布局国际市场,开启国际化的征程,其中华为和联想本身已经是跨国公司,具备先发优势。而浪潮公司和曙光公司从2018年开始,也已在国际市场上有所斩获。从TOP500数据看,我国以227台数量远超第二名(美国)的109台。联想制造的超算系统达到140台,位列厂商第一,浪潮和曙光分别以84台和57台位列第二、三名,3家厂商共计281台,超过总数的一半,其中出口54台。这充分说明了我国超算发展已经牢牢占据领先地位,超级计算系统会成为中国继高铁之后另外一个可以出口的中国制造高科技产品。

2018年中国高性能计算机发展现状分析与展望

图3 中国TOP100国内外厂商系统份额趋势(2002-2018年)

Fig.3 System share trend of domesticand foreign manufacturers in China TOP100(2002-2018)

4 行业领域分析

为便于分析,图4给出了2018年中国TOP100中的行业应用领域系统数量份额关系。

2018年中国高性能计算机发展现状分析与展望

图4  中国TOP100行业应用领域系统份额图(2018年11月)

Fig.4  System share chart of industry applications in China TOP100(2018.11)

从2018年11月发布的中国TOP100的行业应用领域来看,2018年国内高性能计算主要分布在互联网大数据/深度学习、互联网服务/云计算、网络安全、科学计算、超算中心、政府电信、气象石油和工业制造8个领域,领域数量与2017年相同。互联网大数据/深度学习的占比较2017年的46%下降为27%,但仍然是份额排名第一的新领域。这与中国互联网公司的云计算应用的快速崛起和大数据中深度学习算法的广泛应用有很大关系,互联网公司通过深度学习算法重新发现了超级计算机(特别是GPU加速的异构超级计算机)的价值,纷纷投入巨资建设新系统。国内的几大主要应用领域是互联网大数据/深度学习、互联网服务/云计算、超算中心和信息安全等。国内最为突出的特点是互联网服务云计算和大数据应用(特别是深度学习应用)的异军突起,两者的份额之和超过了47%,但较2017年的76%也有所下降。

在2018年中国TOP100中,从应用领域的机器数量份额上看:互联网大数据/深度学习(占27%)继续保持第一;互联网服务/云计算(占20%)继续保持第二;与云计算合并的份额上升;科学计算(占17%)重新进入前三名;超算中心(占13%)排第四名;政府电信(占6%)排名第五。

综合来看,目前的互联网大数据/深度学习、互联网服务/云计算、科学计算、超算中心等领域是高性能计算的主要应用方向。互联网大数据(特别是AI领域)增长强劲,2018年没有出现新的应用领域。

根据历年积累的数据,在图5中给出中国TOP100 2002-2018年的应用领域趋势图。

2018年中国高性能计算机发展现状分析与展望

图5 中国TOP100应用领域趋势(2002-2018年)

Fig.5  Application field trend of China TOP100(2002-2018)

如果按产学研(学主要是指教育;研主要是指科研机构,如超算中心、大气气象、生物信息、科学计算等;其他都算作产业)3个大领域粗略划分,那么2018年产学研三者的数量比例为70∶0∶30。目前产业的份额占据了2017年TOP100排行榜的70%,与2017年三者之间的比例关系相比,研究机器的占比有较大幅度回升;专门用于高性能计算教育的超算环境与去年一样还是零台。当然,其中很大一部分科学计算和教育功能转移到了6家国家超级计算中心,并未消失。超算中心的机器数量份额虽然只占到了13%,但其性能份额仍然排名第一,且几乎达到了总性能的2/3,这说明国家对超算中心的投入在2018年随着3套E级原型机超算系统的研制和升级完成产生了更大的影响和效果。2018年中国超算军团继续在世界超算舞台上占据冠军的位置。目前,中国、美国、日本和欧盟等国家和地区都已经公开发布了其未来的E级超级计算系统的研制计划,几乎都希望在2020-2024年间发布E级系统,夺取世界第一的位置。中国的“十三五规划”在经历科技部的科研管理体制的改革之后,国家设立的3个E级原型系统的研制课题分别由国家并行计算机工程中心与国家超算济南中心合作(计划安装在山东青岛)、曙光公司(计划安装在上海和深圳))和国防科技大学(计划安装在天津)牵头负责研制;2018年,3台原型机均已部署到位,即将选定冲击E级超级计算系统的研制方和安装地点。

5 展望

综合从2002年开始的中国大陆高性能计算机TOP100排行榜的第一名Linpack性能、第一名峰值性能和总性能,得到了图1所示的中国高性能计算机性能发展趋势图(2002-2018年)。从图中的数据可以看出,中国高性能计算机的研制和生产也是有一定规律的。具体地,从2002-2005年,中国超算的发展经历了一次快速发展期,这个发展期维持到2005年(总共4年),然后开始进入一个平稳发展期。而2007年排行榜第一名性能的小幅增长说明大陆地区开始走出平稳发展期,进入新一轮快速发展期。2008年百万亿次机器的出现证实了我们的观察。2009年千万亿次天河一号的提前横空出世,颠覆了我们之前的2010年底或2011年初发布峰值千万亿次国产机器的预言。2010年11月,天河一号A登顶世界TOP500,作为了从2008年开始的超算发展活跃期的一个休止符。2012年天河一号A再夺国内TOP100第一,标志着我国超算的研制仍然维持在平稳发展期,2013年天河二号的出现结束了这个时期。2013年6月,天河二号帮助中国再夺世界第一且连续6次蝉联世界第一和连续3次蝉联中国TOP100第一,这说明中国超算发展在短暂进入活跃期后再次进入平稳发展期。这个平稳发展期本来应该在2015年结束,但是由于限售时间的影响而推迟到2016年才结束。果然,中国超算在2016年以超算排行榜连续第八次夺取冠军、首次获得总数量第一名且总性能几乎与美国持平、国产超算应用在国产神威太湖之光超级计算机获得戈登贝尔奖和中国科学技术大学大学生团队在美国SC大会比赛获得单项和总冠军等最强音,将2016年定格为“中国超算的大满贯年”。2017年开始,中国超算再次不可避免地进入一个新的平稳发展期,没有新的大机器发布,3家超算研制单位将在获得科技部的资助后专心研制新的E级超级计算机。2018年,3台E级原型机均已部署到位,将正式决定哪几家单位获得最后的E级系统的研制资格。新的快速发展期将最早在2020年重新启动。与此同时,美国的超级计算机将迎来一轮活跃期,美国凭借已发布的100 PFlops机器重新夺回世界第一,并且还将陆续发布几台100 PFlops机器。

基于第一名的峰值性能趋势预测,根据新收集的数据,可以得到新预测结果:峰值Exaflops的机器将在2019-2020年间出现[5-6];峰值10Exaflops的机器将在2022-2023年间出现;峰值100Exaflops的机器将在2024-2025年间出现。这些预测整体上偏向乐观趋势,预计会比实际的发布时间早1~2年。

综上,2018年中国TOP100排行榜主要体现了以下几个主要趋势:

(1)神威太湖之光继续蝉联中国TOP100第一名;

(2)曙光和联想公司并列中国TOP100数量份额第一名;

(3)TOP100总体性能突破300PFlops,中国高性能计算市场的增速有所回升;

(4)TOP100平均性能突破3千万亿次,继续领先国际平均水平;

(5)入门系统性能门槛继续大幅提升,达到1127 TFlops,再次大幅超过国际TOP500入门系统性能的847 TFlops;

(6)98套系统采用机群结构,计算机体系结构创新形势依然严峻;

(7)上榜高性能计算机制造商为6家,首次实现全国产,市场份额进一步集中在曙光、联想和浪潮3家厂商,这3家厂商共占据92%的数量份额;

(8)应用领域变化不大,高性能计算应用特别是在大数据和云计算领域呈现快速发展的局面,大数据、超算中心、互联网服务/云计算和网络安全等是高性能计算的主要应用方面。

在2019年,各国E级计算机计划的发展是值得关注的大事。我国3套E级原型系统的研制均已顺利完成,最后的E级系统研制任务花落谁家更值得关注。随着美国E级超级计算机系统研制计划的提前和中国E级超级计算系统研制计划的可能延后,中美两个超级计算大国之间谁能在2020年左右夺取世界第一的位置充满了变数。

参考文献

[1]MEUER H,SIMON H,STROHMAIER E,et al.TOP500 Supercomputer Sites [OL]. http://www.top500.org.

[2]张云泉,孙家昶,袁国兴,等. 中国高性能计算机TOP100排行榜 [OL]. http://www.samss.org.cn.

[3] DONGARRA J. An Overview of High Performance Computing and Challenges for the Future [OL]. http://www.netlib.org/utk/people/Jack Dongarra/SLIDES/siam-0708.pdf.

[4]PETITET A,WHALEY C,DONGARRA J,et al. HPL Benchmark 2.0[OL].http://netlib.org/benchmark/hpl.

[5]ZHANG Y Q, SUN J C, YUAN G X,et al. A Brief Introduction to China HPC TOP100 : from 2002 to 2006[C]//Asian Technology Information Programs.ACM,2007:32-36.

[6] ZHANG Y Q, SUN J C, YUAN G X,et al. Perspectives of China’s HPC system development : a view from the 2009 China HPC TOP100 list[J].Frontiers of Computer Science in China,2010,4(4):437-444.

weinxin
扫码,关注科塔学术公众号
致力于成为国内领先的科研与学术资源导航平台,让科研工作更简单、更有效率。内容专业,信息准确,更新及时。
avatar