“天河三号”后,神威E级超算原型机在济南正式部署启用
目录:
然而,这样的大型计算机的系统架构师将面临一些关键问题,该名单的一位管理员警告说,“交付机器所面临的挑战是巨大的” “田纳西大学杰克·东亚拉说,诺克斯维尔是研究员,他是Top500的主要负责人之一。 Dongarra在本周在盐湖城举行的SC2012会议上发表了演讲,上周发布了最新版本的名单。
在E级表现可行之前,我们仍有一段路要走。 E级机器将能够执行一次浮点运算FLOPS(每秒浮点运算)或10到18次FLOPS。即使是当今最快的超级计算机也只能提供不到百分之二十的超级计算机能力。
Top500
新高度
在星期一发布的最新超级计算机500强名单中,名单上最快的计算机是橡树岭国家实验室Titan系统,一台能够执行17.59 petaflops的机器。 Petaflop是每秒4万亿次的浮点计算,或10到15次FLOPS。但是,每个新的Top500-每年编译两次的列表 - 显示了超级计算机速度增长的速度。从列表上看,超级计算机似乎每十年左右获得十倍的电力。 1996年,第一台teraflop计算机出现在Top500上,2008年,第一台petaflop计算机出现在名单上。根据这一进展推断,Dongarra估计E级计算应该在2020年左右到来。高性能计算(HPC)社区已经将E级计算视为一个重要里程碑。英特尔创建了一系列大型多核处理器,称为Phi,该公司希望能够成为可能在2018年前运行的E级计算机的基础。
在他的演讲中,Dongarra勾勒出了E级机器的特点。这样的机器可能会有大约100,000到1,000,000个节点,并且在任何给定时间将能够执行多达10亿个线程。单个节点的性能应该在1.5到15 teraflops之间,并且互连需要吞吐量为每秒200到400千兆字节。超级计算机制造商将不得不构建他们的机器,以便它们的成本和功耗不会以线性方式增加以及性能,以免他们购买和运行太昂贵,Dongarra说。一台E级机需要花费大约2亿美元,而且只需要大约20兆瓦,即每瓦大约50千兆瓦。Dongarra预计,构建这种计算机的一半成本将用于购买该系统的内存。根据内存制造商的路线图,Dongarra估计,到2020年,1亿美元将购买32 PB至64 PB内存。
Top500
软件挑战
除了硬件方面的挑战外,Exascale超级计算机的设计者还必须也可以解决软件问题。 Dongarra说,一个问题将是同步。今天的机器在许多不同的节点之间传递任务,尽管随着节点数量的增加,这种方法需要进行简化
“今天,我们的并行处理模型是一个分叉/连接模型,但是你不能在[并行的Exascale级别,我们必须改变我们的模型,我们必须更加同步,“Dongarra说。沿着同样的路线,需要开发算法来减少节点之间的整体通信量。
其他因素也必须考虑。该软件必须带有内置的优化例程。 “我们不能依靠用户设置正确的旋钮和拨号来让软件在任何接近峰值性能的地方运行,”Dongarra说。故障恢复能力将成为另一个重要特性,结果的可重复性或保证复杂计算在超过一次运行时都能产生完全相同的答案。
重复性似乎是计算机的一个明显特征。但事实上,对于多节点超级计算机的大量计算来说,这可能是一个挑战。“从数值方法的角度来看,很难保证按位重复性,”Dongarra说。 “主要的问题在于减少 - 并行总结数字,如果我不能保证这些数字的排列顺序,我会得到不同的舍入误差,这种小的差异可以放大“他说,”我们必须想出一个方案,我们可以保证这些操作的顺序完成,所以我们可以保证我们获得相同的结果,“Dongarra说,Joab Jackson涵盖了
IDG新闻服务
的企业软件和通用技术突发新闻。在@Joab_Jackson的Twitter上关注Joab。 Joab的电子邮件地址是[email protected]