“神威·太湖之光"超级计算机是由中国国家并行计算机工程技术研究中心研制,清华大学管理运营的超级计算机。该超算从2016年6月起四次雄踞“全球超级计算机500强”榜首,2016年至2018年,连续三年6个项目入围被誉为“超级计算应用领域诺贝尔奖”的“戈登·贝尔奖”。
“神威·太湖之光"于2012年7月开始进行项目调研论证,2013年4月项目审批申请,2014年3月中国科技部立项,同年8月机房改造立项,2015年7月机房施工结束,12月31日主机研制完成,“超算中心”同时成立。从2016年6月荣登“全球
超级计算机500强”榜首之后,“神威·太湖之光"还多次蝉联该榜榜首,并且基于该超算的相关应用项目获得高性能计算应用领域最高奖“
戈登贝尔奖”(2017年和2021年)及两项
提名奖(2017年)。
截至2022年12月,依托“神威·太湖之光”,中国无锡超算中心牵头推行中国“十三五”科技研发计划项目4项,参与20项中国国家重点研发计划项目或课题,承担中国
江苏省、
无锡市及高校、企事业单位的横向项目120余项,除了在地震模拟、气象气候、先进制造,“神威·太湖之光”也帮助无锡超算中心在大规模计算、生物医药、
分子动力学等方面取得一系列科研成果。
发展历程
立项及研制
中国从基于自主可控
超级计算机系统的软件与应用、服务于国家特殊需要和高新技术产业发展考虑,重新布局了超级计算机的研制工作。“十三五”国家重点研发计划设立了“
高性能计算”重点专项,在高性能计算机研制、系统软件及应用等方面给予布局支持。其中,研制“神威·太湖之光”就是中国重点组织开展的一项重大科研任务。
“神威·太湖之光”于2012年7月开始进行项目调研论证,
江苏省人民政府于次年4月22日正式提出在
无锡市建设10亿亿次超级计算中心,得到科技部的支持。2014年3月5日,中国科技部同意“高效能计算机及应用服务环境(二期)”重大项目立项,同年8月机房改造立项。2015年7月机房施工结束,2015年12月31日,“神威·太湖之光”超级计算机研制完成。
从时间上看,“神威·太湖之光”立项到研制成功,仅仅用了两年多的时间,速度惊人。对此,超算中心应用支持主管刘钊介绍,“神威·太湖之光”的研制时间虽短,但之前经过了很长时间的技术预研。“它采用的是国家‘核高基’重点科技专项支持的全国产‘申威’CPU。‘申威’系列的技术路线比较明晰而稳定,而且采用上一代‘申威’CPU的‘神威蓝光’超算为‘太湖之光’的发展做了很好的铺垫和尝试。没有它,‘太湖之光’也就不会那么快研制出来。”激励中国加速研究自主可控超算的原因还有
美国针对中国的“芯片禁运”。
2015年2月18日,
美国商务部发布在联邦政府网站的一份公告中,把与
超级计算机相关的4家中国机构列入限制出口黑名单,分别是中国国防科学技术大学、国家超算长沙中心、国家超算天津中心和国家超算广州中心。这一名单原本并未引发过多关注,直到4月7日,
英特尔向美国政府提出了将数万芯片出口给中国的国家超级计算广州中心的许可申请,但遭到拒绝。此次事件也影响了“天河二号”的升级计划,也在一定程度上促成了“神威·太湖之光”搭载中国生产的“申威SW26010”处理器。
夺魁与卫冕
“神威·太湖之光”研制完成232天后(2016年6月19日),在德国法兰克福国际超算大会(ISC)公布的新一期全球
超级计算机TOP 500榜单上,由中国
国家并行计算机工程技术研究中心研制、安装在
国家超级计算无锡中心的“神威·太湖之光”取代此前已“六连冠”的国产系统“天河二号”,登上榜首。TOP 500榜单是对全球已安装的超级计算机“排座次”的权威排行榜。从1993年起,由TOP 500国际组织以实测计算速度为基准每半年发布一次。在2016年6月19日公布的最新榜单上,中国超级计算机上榜总数为167台,超过
美国的165台,首次成为上榜数量最多的国家。
德国法兰克福国际超算大会(ISC)公布的数据显示,“神威·太湖之光”一举斩获三项世界第一:系统的峰值性能125.436PFlops,持续性能93.015PFlops,性能功耗比6051MFlops/W,即峰值速度达到每秒12.54亿亿次,持续计算速度每秒9.3亿亿次,性能功耗比为每瓦60.51亿次。对于“12.5亿亿次”是什么概念,时任中国
国家超级计算无锡中心主任杨广文这样解释道:“假设我们有一个十万人的足球场,里面有十万个人,每人有一个笔记本,它的计算能力相当于一百个这样的足球场的这么多人进行计算。”
2016年11月16日,“神威·太湖之光”又以每秒9.3亿亿次的浮点运算速度,蝉联全球
超级计算机500强榜单的榜首。[20]而国际超算大会在2017年6月和11月更新的两次TOP500榜单中,“神威·太湖之光”再次卫冕,并且与“天河二号”连续第四次斩获冠亚军,且中国超级计算机上榜总数又一次反超
美国,夺得第一。
自2016年6月20日发布以来,多个应用团队项目通过使用“神威·太湖之光”获得突破,截至2016年11月已经取得100多项应用成果。事实上,“神威·太湖之光”堪称“劳模”,2016年11月的媒体报道中提及,“神威·太湖之光”的“作息时间表”显示其工作时间超过六成,“睡眠”时间仅占两成,而且它还非常“健康”,故障率仅为0.6%。统计数据显示,截至2016年11月已经有100多家科研单位、100多个大型应用在“神威·太湖之光”系统上运行,涉及气候气象、海洋、航空航天、生物、材料、高能物理、药物、生命科学等19个应用领域。
应用成果
“神威·太湖之光”主要服务中国国家重大科技项目,如中国大飞机C919精细数值模拟、
天宫一号陨落路径预测计算等课题等,同时也十分重视服务产业创新。例如,超算中心和
远景能源有限公司合作开展“格林威治智慧风场”项目,超算中心基于自身超强的运算能力、专业的技术人员等为远景能源提供包括风资源预测、风场精细选址、风机建造等在内的一整套生命周期服务。2016年10月,超算中心仅用12天的时间就完成了2014-2015年间全国的风资源数据测算,比原本的45天提速近4倍,并将数据误差控制到0.5%。
2016年至2018年,连续三年6个项目入围被誉为“超级计算应用领域
诺贝尔奖”的“
戈登贝尔奖”,“千万核可扩展全球大气动力学全隐式模拟”“非线性地震模拟”两个项目先后折桂,成为中国超算应用的实力“背书”。前者可全面提高应对极端气候事件和自然灾害的减灾防灾能力;后者可为防震救灾以及地震高发区城市建筑规划设计提供科学依据。此后,“神威·太湖之光”也帮助科研人员在量子计算、航空航天、分子动力学模拟等应用中取得了各种科研成果。
应用领域
气象气候
基于“神威·太湖之光”
超级计算机,科研人员设计并开发了一种用于大气
动力学中经常出现的强时间依赖问题的高可扩展性全隐式求解器。该求解器使用异构多重网格局部分解算法,显著地加快了求解器的收敛过程,并利用了粗粒度并行。此外,设计了在物理上的多块异步不完全LU 分解方法来解决每个重看子域上的子问题,从而进一步取得粗粒度并发。同时,在不同硬件层级上实现了系统层面上的优化,充分利用了异构计算单元,从本质上减少了数据移动的开销。在“神威·太湖之光”的帮助下,求解器实现了快速且准确的大气模拟,分辨率达公里级,整机持续计算性能为7.95PFlopS。
地震模拟
“神威·太湖之光”利用其强大的计算能力了,帮助科研人员成功设计实现了高可扩展性的非线性地震模拟工具,该工具充分发挥国产处理器在存储、计算、通信资源等方面的优势。研究团队选取了
唐山地震震源附近达320公里X 312公里X40公里的空间区域以0.001秒为时间单位,精确模拟了该区域在地震发生后 150秒内的地质变化,
分辨率可达到8米,频率可达到 18
赫兹。分辨率越高、频率越高,对地震模拟刻画越精确,能模拟地震的震级越大,而频率越高,则对高频信息的刻画越准确。这也是国际上首次实现如此大规模下的高分辨率、高频率的非线性塑性地震模拟。该工具首次实现了对唐山大地(M7.2,1976)发生过程的高分辨率精确模拟,使得科学家可以更好的理解
唐山地震所造成的影响,并对未来的地震灾害救援演习、预防预测等研究具有重要的借鉴意义。
量子计算
研究团队基于“神威·太湖之光”,研发了量子计算模拟器 SWQSIM,提出近似最优的张量网络并行切分和收缩方法及混合精度算法,可高效扩展至数千万核并行规模,并提供每秒 4.4 百亿亿次的持续计算性能,与“悬铃木”200 秒完成 0.2% 保真度的百万采样任务相比较,“顶点”需要一万年完成同等复杂度的模拟 ,SWQSIM 则可在 304 秒以内得到百万更
Hi-Fi度的关联样本,在一星期内得到同样数量的无关联样本,打破其所宣称的“量子霸权”。
航空航天
中国在整体设计上拥有完全自主
知识产权的大飞机
C919首飞成功,也离不开“神威•太湖之光”的助力。相关研究机构与国家超算无锡中心合作,开展了C919多种飞行状态的模拟,完成了C919大型客机相关特性的精细数值模拟,计算网格规模由千万网格提升到两亿网格,计算时间缩短到10小时以内,大大减少了风洞试验次数,降低了设计成本。
其他应用
截至2022年12月,依托“神威·太湖之光”,中国无锡超算中心在服务中国国家重大专项、重大需求方面成绩卓越:牵头推行中国“十三五”科技研发计划项目4项,参与20项中国
国家重点研发计划项目或课题,承担中国
江苏省、
无锡市及高校、企事业单位的横向项目120余项,除了在地震模拟、气象气候、先进制造,“神威·太湖之光”也帮助无锡超算中心在大规模计算、生物医药、
分子动力学等方面取得一系列科研成果。应用方面,中国无锡超算中心已完成20多个应用领域、200多项百万核心大型问题的求解任务,有效支持了科学研究与产业创新。
研发意义
高性能超级计算机是全球发达国家竞争的关键,对国家安全和经济社会发展至关重要。因此,加快中国超级计算机的发展和应用对科技创新和高质量经济社会发展有重大意义。过去40年,中国超级计算机从无到有,从跟跑到局部领先,并实现了关键核心技术的自主可控,成功突破技术封锁。随着“神威·太湖之光”超级计算机和“申威26010”处理器等标志性成果的出现,打破了长期以来国产超级计算机平台无“芯”可用的局面,奠定了安全、自主、可控的国产平台技术基础。然而,我们也要看到,中国超算系统解决问题的能力仍然有待提高,相关联的
商业软件仍被国外垄断,在软件研制、应用开发和人才培养等方面仍然有许多工作要做。
世界排名及获奖记录
2016年6月20日,在德国
法兰克福ISC2016国际超级计算大会中,峰值计算速度、持续计算速度、性能功耗比这三项关键指标均排名第一。
2016年11月14日,新一期全球
超级计算机500强榜单14日公布,所有核心部件全部由中国自主制造的“神威·太湖之光”蝉联冠军。
2017年6月19日,在ISC2017国际高性能计算大会上,中国国产“神威·太湖之光”超级计算机以每秒12.5亿亿次的峰值和9.3亿亿次的持续计算能力,再次获得世界超级计算机TOP500第一名,实现了首次三连冠。
2017年11月13日,新一期全球超级计算机500强榜单发布,中国超级计算机神威·大湖之光”和“天河二号”连续第四次分列冠亚军,且中国超级计算机上榜总数又一次反超
美国,夺得第一。此次中国“神威·太湖之光”和“天河二号”再次领跑,其浮点运算速度分别为每秒9.3亿亿次和每秒3.39亿亿次。
2017年11月17日,在美国丹佛举行的
全球超级计算大会(SC2017)上,2017年国际高性能计算应用领域最高奖“戈登·贝尔”奖(ACM Gordon Bell Prize)提名中,基于“神威·太湖之光”的应用成果又有两项入围。最终,“非线性地震模拟”获得“戈登·贝尔”奖。
2018年6月25日,在德国法兰克福召开的全球超算大会(ISC2018)上 ,“超级计算机500强”(TOP500)最新榜单正式发布。“神威·太湖之光”位居第二,首次被美国超级计算机顶点(Summit)超越。
2018年11月,第52期的全球超级计算机TOP榜单出炉,中国超级计算机“神威·大湖之光”位居第三,美国能源部DOE的顶点(Summit)继续高居榜首,第二名是美国的Sierra。
2019年全球超算500强榜单公布,“神威·大湖之光”依旧位居第三,较2018年11月排行无变化。
2020年及2021年全球超算500强榜单公布,“神威·大湖之光”位居第四,一至三名分别为来自
日本的Fugaku(
富岳)、
美国的顶点(Summit)和Sierra。
2021年11月19日,在
全球超级计算大会(SC21)上,
国家超级计算无锡中心、
之江实验室、
清华大学、上海量子科学研究中心等单位基于新一代“神威·太湖之光"
超级计算机,联合研发的神威量子
仿真器Q (SWQSIM)摘得2021年度ACM“
戈登·贝尔"奖。
2023年6月全球超级计算机 500 强公布,开发并安装在位于中国
江苏省无锡市的
国家超级计算中心的神威太湖之光以 93 Pflop/s位列第七。
硬件组成
“神威·太湖之光”超级计算机是由中国
国家并行计算机工程技术研究中心研制、安装在中国
国家超级计算无锡中心的超级计算机,占地面积605平方米。这台超级计算机由40个运算机柜和8个网络机柜组成。每个运算机柜比家用的双门冰箱略大,打开柜门,4组由32块运算
插件组成的超节点分布其中。工作人员介绍,每个插件由4个运算节点板组成,一个运算节点板又含2块“申威26010”高性能处理器。一台机柜就有1024块处理器,整台“神威·太湖之光”共有40960块处理器。
申威26010是中国自主设计生产的芯片,中国
国家超级计算无锡中心主任
杨广文介绍道:“这是一款具有独特性的处理器,它采用了片上融合的异构众核体系结构,以及具有自主
知识产权的指令集和完整的配套软件生态系统。这种独特的体系结构在25平方厘米的方寸之间集成了260个运算核心、数十亿
晶体管,达到了每秒3万亿次计算能力。”此外,申威26010的架构体系是Alpha 64位RSIC,乱序执行,运行频率为1.45GHz,260个核心,整个处理器包括4个MPE(Management Processing Element)管理单元、4个CPE(Computing Processing Element)计算单元及4个MC内存控制器单元组成,其中CPE单元又由8x8阵列的64核心组成,所以总计是260个核心。这样1个处理器就是1个节点,每个节点搭配8GB DDR3内存,256个节点组成1个超级节点,160个超级节点互联连接,因此总计是40960个节点,10649600个核心,内存容量1.3PB。
值得一提的是,从世界领先的高效水冷技术到软硬件协同、智能化的功耗控制方法,“神威·太湖之光”实现了层次化、全方位的绿色节能,功耗比达到每瓦特60.51亿次运算,是当时(2016年)世界上最绿色节能的
超级计算机之一。
操作系统
“神威·太湖之光”超级计算机除了强悍的硬件配置以外,神威超级计算机还搭载了经过十多年开发的国产系统神威睿思。该系统具有高度自主可控和强大的安全性能优势。通过对Linux内核进行全面剖析和特殊改造,并结合神威处理器自主指令系统特点和国产处理器新增的安全特性,大大提升了硬件和软件的安全性。该系统主要应用于
高性能计算和网络安全领域,包括超级计算机、集群计算机系统、通用操作系统以及网络安全防护、主机安全防护、数据安全防护和安全管理等定制操作系统。此外,神威睿思操作系统主要应用于高性能计算与安全两个领域。产品含括
超级计算机和各种集群计算机系统;桌面、服务器类通用操作系统,以及网络安全防护、主机安全防护、数据安全防护、安全管理等网络安全类的定制操作系统。
参考资料
识典百科.神威·太湖之光”:顶天立地,迈向“更大宇宙”.2023-11-18