极品飞车:研究人员开启世界上最快的人工智能超级计算机

6000个NVIDIA A100 gpu提供4千万亿次的混合精度性能,帮助NERSC推动科学发展。
通过 Dion哈里斯

它将有助于拼凑宇宙的3D地图,探测亚原子间的相互作用,以获取绿色能源等等。

波尔马特今天,美国国家能源研究科学计算中心(NERSC)正式投入使用,这台超级计算机将提供近4台exaflop对7000多名研究人员的人工智能性能进行了评估。

这使得波尔马特这是地球上最快的16位和32位混合精度数学系统。这还不包括今年晚些时候劳伦斯伯克利国家实验室系统的第二阶段。

超过20多份申请正准备成为第一批乘坐6159辆汽车的人NVIDIA A100 Tensor Core gpu波尔马特这是世界上最大的a100动力系统。他们的目标是推动天体物理学、气候科学等领域的科学发展。

宇宙的3D地图

在一个项目中,超级计算机将帮助组装迄今为止可见宇宙的最大3D地图。它将处理暗能量光谱仪(德西),这是一种宇宙相机,一次曝光可以捕捉多达5000个星系。

研究人员需要的速度波尔马特的gpu可以捕捉一个晚上的数十次曝光,从而知道第二天晚上的DESI指向哪里。在以前的系统上,准备一年的数据来发表可能需要几周或几个月的时间,但是波尔马特应该能帮助他们在短短几天内完成任务。

NERSC的数据架构师罗林·托马斯(Rollin Thomas)正在帮助研究人员准备他们的代码,他说:“在我们的准备工作中,gpu的速度提高了20倍,我真的很高兴。波尔马特

珀尔穆特的坚持得到了回报

DESI的地图旨在揭示暗能量,即宇宙加速膨胀背后的神秘物理。暗能量在很大程度上是通过2011年诺贝尔奖得主索尔·珀尔马特(Saul Perlmutter)的工作发现的,他是伯克利实验室一位仍然活跃的天体物理学家,他将帮助以他命名的新超级计算机落成。

托马斯说:“对我来说,索尔是一个例子,说明人们可以将永不满足的好奇心和乐观的承诺正确结合起来。”托马斯与珀尔马特一起参与了这项诺贝尔奖获奖发现的后续项目。

超级计算机融合了人工智能和高性能计算

类似的精神推动了许多将在NERSC的新超级计算机上运行的项目。例如,材料科学的工作旨在发现原子之间的相互作用,从而为更好的电池和生物燃料指明道路。

传统的超级计算机几乎无法处理量子浓缩(Quantum Espresso)等程序在几纳秒内生成几个原子模拟所需的数学运算。但通过将高精度的模拟与机器学习相结合,科学家们可以在更长的时间内研究更多的原子。

“在过去,不可能对电池接口等大型系统进行完全原子模拟,但现在科学家计划使用波尔马特NERSC的应用性能专家布兰登·库克(Brandon Cook)说,他正在帮助研究人员启动此类项目。

这就是张量核心在A100中发挥独特作用的地方。它们加速了用于模拟的双精度浮点数学和深度学习所需的混合精度计算。

类似的工作在11月获得了NERSC的认可戈登·贝尔入围使用NVIDIA V100 gpu的BerkeleyGW项目。NERSC负责该项目的负责人和应用性能监督的杰克·德斯利佩(Jack Deslippe)说,A100的额外力量有望将这种努力提升到一个新的水平。

软件可以帮助波尔马特

软件是战略的组成部分波尔马特Deslippe说,微软也支持OpenMP和其他流行的编程模型Nvidia HPC SDK系统使用。

另外,急流,用于gpu上的数据科学的开源代码,将加快NERSC不断壮大的Python程序员团队的工作。它在一个项目中证明了它的价值,该项目分析了NERSC Cori超级计算机上的所有网络流量,比之前在cpu上的研究快了近600倍。

Thomas说:“这使我们相信RAPIDS将在通过数据加速科学发现方面发挥重要作用。”

应对新冠肺炎挑战

尽管疫情大流行,波尔马特准时。但该团队不得不重新考虑关键步骤,比如如何为在家工作的研究人员举办黑客马拉松,为系统的百亿亿级应用程序编写代码。

与此同时,来自惠普企业的工程师帮助组装了系统的第一阶段,并与NERSC的工作人员合作,后者升级了他们的设施以适应新系统。托马斯说:“我们非常感谢那些在现场建立系统的人的工作,特别是在所有特殊的COVID协议下。”

在虚拟发布会上,英伟达首席执行官黄仁勋祝贺伯克利实验室的工作人员计划用超级计算机推动科学发展。

波尔马特的融合人工智能和高性能计算的能力将在材料科学、量子物理、气候预测、生物研究等广泛领域取得突破。”

人工智能超级计算的时间

今天的虚拟剪彩仪式是一个非常真实的里程碑。

“科学人工智能是美国能源部的一个增长领域,在粒子物理、材料科学和生物能源等领域,概念验证正在进入生产用例,”NERSC数据和分析服务组代理负责人瓦希德·比姆吉(Wahid Bhimji)说。

“人们正在探索越来越大的神经网络模型,并且需要访问更强大的资源,所以波尔马特其A100 gpu、全闪存文件系统和流数据功能正是满足人工智能需求的好时机,”他补充道。

研究人员想继续他们的工作波尔马特可以提交访问请求对系统。