嘿嘿!中国的超算最顶级?谁和你说的是顶级?我们国家超算机数量确实是世界第一,这点毋容置疑,但技术方面,目前远远还未达到顶级。
2019年11月,超算TOP500榜,我国上榜超级计算机达到228台,总体算力占据32.3%,美国上榜的超级计算机117台,总体算力占据37.1%。
也就是说,我们228台超算算力抵不过美国117台超算算力。
今天我们就来说说,中国的超算技术为什么和顶级无关?首先,中国超算的总体思路,我感觉就是不差钱,只要整出来就完事了,至于其它的不需要考虑。
所以一开始就倾向于所谓的总体设计,尤其是主板,处理器的主核、从核都是完整配套的,最后集成在主板上。
好处是,集成度高,缺点是成本过高,通用性无,也无法民用。
而这种所谓的整体配套在历史上我们其实吃过很多亏,因为它很难适应科学技术的快速发展,后果就是牵一发而动全身,反而造成了技术的滞后。
实际上,结果已经来了,就在2020年6月23日,TOP500发布了世界超级计算机TOP500排名,日本超级计算机Fugaku( 富岳)以每秒23047 TFlop的峰值速度,超越美国“顶点”计算机,夺取第一名宝座。
Fugaku超算这次不仅在TOP500上取得了第一,在HPCG、HPL-AI和Graph500的排名中均取得了第一。
Fugaku采用了富士通的48核A64FX SoC,这是500强榜上唯一一个由ARM处理器,也是ARM处理器首次登陆超算排行榜500强。
Fugaku每秒达到41.55亿亿次的运算速度,约是第二名美国"顶点”超算运算速度每秒14.88亿亿次的2.8倍。
这就是技术的先进性带来的巨大贡献,ARM处理器的运用将改变以往整个超算硬件设备。
前三中没有中国的超算,神威.太湖之光超级计算机和天河2A超级计算机排在第四和第五,运算速度分别是9.3亿亿次和6.14亿亿次。
太湖之光采用了40960个“申威26010”众核处理器板。该众核处理器采用64位自主申威指令系统,峰值性能为12.54京次/秒,持续性能为9.3京次/秒。(1京为1亿亿)
而申威26010处理器是我国江南所自主研发的,采用28nm制程工艺,主频1.45G,拥有260个核心,双精浮点峰值高达3.06TFlops。
每片处理器包含4个核心,片上的4个核心通过片上网络互联,并通过PCI-E 3.0对外连接,每个核心拥有独立的128位DDR3控制器连接到8GB DDR3-2133内存,这样4个核心一共拥有32GB的DDR3内存。
你理解成,一片申威26010处理器上粘了4块CPU就可以了,最后核心总数为10,649,600 个。
单纯从技术来讲,SW26010的协处理器只有16KB的L1指令缓存和64KB的本地存储,intel的phi处理器轻松吊打SW26010的计算核心,一点问题没有。
一片申威26010处理器板,我们无从得知多少钱。
但太湖之光的总投资我们是知道的,18个亿的国家拨款,包括了硬件、研发和软件费用,但不包括运营维护费用。
综上所述,您还觉得我们的超算在世界上是顶级的吗?
未来,中国的超算将朝着高性能、低功耗的方向拓展。而芯片设计、任务分配、算法优化、应用范围、散热系统等依然是努力的重点。
今天,有什么经验需要分享呢?
立即撰写