NVIDIA A100助力DGX SuperPOD系统,打破16项世界纪录
英伟达是唯一一家在MLPerf Training v0.7测试中均采用市售商用产品的公司。
北京时间7月30日,MLPerf组织发布了第三个版本MLPerf Training v0.7基准测试(Benchmark)结果。在这次测试中,NVIDIA DGX SuperPOD超级计算机系统共打破16项世界纪录。
MLPerf是成立于2018年5月的行业基准测试组织,致力于机器学习硬件、软件和服务的训练和推理性能测试,囊括行业中几乎所有知名企业和机构,比如Intel、NVIDIA、Google、微软、阿里巴巴等。
DGX SuperPOD系统公布于去年6月17号。最初由96台 NVIDIA DGX-2H 超级计算机和 Mellanox 互连技术在短短三周内建成,提供9.4千兆次的处理能力,用于该公司在无人驾驶车辆部署计划中的需求。
而此次创造纪录的NVIDIA DGX SuperPOD系统主要基于Ampere架构以及Volta架构,并且搭载了今年5月份发布的Ampere架构GPUA100。
在强化学习测试上,NVIDIA用256块 A100卡和64块 AMD Epyc 7742 CPU 核心,用时29.7分钟,成功训练了一款全尺寸19x19围棋模型。该测试是本轮最复杂的测试,内容涵盖从游戏到训练的多项操作。
此前NVIDIA在2018年12月的首次测试中就创下6项记录,次年7月再次创下8项记录。特别值得一提的是,英伟达是唯一一家在MLPerf Training v0.7测试中均采用市售商用产品的公司。
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新