速度需求:研究人员打开世界上最快的人工智能超级计算机

6000个NVIDIA A100 gpu提供4 exaflops的混合精度性能,帮助NERSC推进科学。
通过 Dion哈里斯

它将帮助构建宇宙的3D地图,探索绿色能源的亚原子相互作用等等。

波尔马特这台超级计算机今天在美国国家能源研究科学计算中心(NERSC)正式亮相,它将为7000多名研究人员提供近4 exaflops的人工智能性能。

这使得波尔马特地球上最快的16位和32位混合精度数学AI系统。而且这种表现甚至还不包括今年晚些时候将在劳伦斯伯克利国家实验室进行的系统的第二阶段。

超过24份申请正准备成为第一批乘坐这6159辆车的人NVIDIA A100张量核心图形处理器波尔马特它是世界上最大的a100动力系统。他们的目标是推进天体物理学、气候科学等领域的科学。

一幅宇宙的3D地图

在一个项目中,这台超级计算机将帮助组装迄今为止最大的可见宇宙3D地图。它将处理暗能量分光仪(德西),这是一种宇宙相机,一次曝光就能捕捉到多达5000个星系。

研究人员需要的速度波尔马特的图形处理器可以捕捉一个晚上的几十次曝光来知道第二天晚上的DESI指向哪里。在以前的系统上,准备一年的数据发表可能需要几周或几个月的时间,但是波尔马特应该能帮助他们在几天内完成任务。

NERSC的数据架构师Rollin Thomas说:“在我们的准备工作中,我们在gpu上获得了20倍的加速,我真的很高兴。”他正在帮助研究人员准备代码波尔马特

珀尔马特的坚持会有回报

DESI的地图旨在揭示暗能量,即宇宙加速膨胀背后的神秘物理现象。暗能量在很大程度上是通过索尔·珀尔穆特(Saul Perlmutter) 2011年获得诺贝尔奖的工作而发现的。珀尔穆特目前仍在伯克利实验室(Berkeley Lab)工作,他将帮助开发以他命名的新超级计算机。

托马斯说:“在我看来,索尔是一个例子,说明了人们能在永不满足的好奇心和对乐观的承诺的正确结合下做些什么。”托马斯在佩尔穆特获得诺贝尔奖之后与他一起开展了一些项目。

超级计算机混合人工智能,高性能计算

类似的精神为许多项目提供了动力,这些项目将在NERSC的新超级计算机上运行。例如,材料科学的目标是发现原子间的相互作用,从而为开发更好的电池和生物燃料指明方向。

传统的超级计算机几乎无法处理用Quantum Espresso等程序在几纳秒内模拟几个原子所需的数学运算。但是,通过将高度精确的模拟与机器学习相结合,科学家可以在更长的时间内研究更多的原子。

“在过去,对像电池接口这样的大型系统进行完全的原子模拟是不可能的,但现在科学家们计划使用波尔马特正在帮助研究人员启动此类项目的NERSC应用性能专家布兰登·库克(Brandon Cook)说。

这就是张量核在A100中发挥独特作用的地方。它们加速了用于模拟的双精度浮点数学和深度学习所需的混合精度计算。

类似的工作在11月获得了NERSC的认可戈登·贝尔决赛使用NVIDIA V100图形处理器的BerkeleyGW项目。在NERSC领导该项目并监督应用性能的Jack Deslippe说,A100的额外力量将把这种努力提高到一个新的水平。

软件可以帮助波尔马特

软件是战略的组成部分波尔马特Deslippe说,并指出OpenMP和其他流行的编程模型的支持英伟达HPC SDK系统使用。

另外,急流这将加快NERSC不断壮大的Python程序员团队的工作。它在一个项目中证明了它的价值,该项目分析了NERSC的Cori超级计算机上的所有网络流量,比之前在cpu上的工作快近600倍。

“这使我们确信RAPIDS将在通过数据加速科学发现方面发挥重要作用,”托马斯说。

应对新冠肺炎挑战

尽管大流行,波尔马特在安排。但该团队不得不重新考虑一些关键步骤,比如如何为在家编写系统百亿亿级应用程序代码的研究人员举办黑客松。

与此同时,来自惠普企业的工程师帮助组装了系统的第一阶段,与NERSC的工作人员合作升级了他们的设施以适应新系统。托马斯说:“我们非常赞赏现场人员的工作,特别是在所有特殊的COVID - 19协议下,推动系统的运行。”

在虚拟发布会上,英伟达首席执行官黄延森(Jensen Huang)祝贺了伯克利实验室的工作人员利用超级计算机推进科学的计划。

波尔马特的将人工智能和高性能计算相融合的能力将带来材料科学、量子物理、气候预测、生物研究等广泛领域的突破。”

准时的人工智能超级计算

今天的虚拟剪彩代表了一个非常真实的里程碑。

“科学上的人工智能是美国能源部的一个增长领域,在那里,概念的证明正在向粒子物理、材料科学和生物能源等领域的生产使用案例转移,”NERSC数据和分析服务集团代理负责人瓦希德·比姆基(Wahid Bhimji)说。

“人们正在探索越来越大的神经网络模型,并且需要获得更强大的资源,所以波尔马特A100图形处理器、全闪存文件系统和流数据能力正好满足了对人工智能的需求,”他补充道。

研究人员想要在波尔马特可以提交访问请求的系统。