英伟达发布超级计算机DGX SuperPO 用于自动驾驶汽车AI训练

光山新闻网 林晓舟 2019-06-25 11:05:13
浏览

(图片来源:英伟达官网)

盖世汽车讯 据外媒报道,英伟达发布了超级计算机DGX SuperPOD,位列全球最快超级计算机第22名。它提供AI基础设施,可满足自动驾驶汽车部署的大量需求。该系统由Mellanox互联技术在短短三周内建成,由96台英伟达DGX-2H超级计算机组成。具有9.4千万亿次浮点运算的处理能力,能够训练安全的自动驾驶汽车所需的大量深层神经网络。

自动驾驶汽车AI训练是最大的计算密集型挑战

一辆数据收集车辆每小时产生1TB的数据。这些数据乘以整个车队的驾驶年数,就会得到PB级的数据。这些数据用于训练算法,学习道路规则,并发现车辆运行的深层神经网络中的潜在故障,然后在连续的循环中对其进行再训练。

英伟达AI基础设施副总裁Clement Farabet表示,“AI领导力需要计算基础设施领导力。很少有AI挑战像训练自动驾驶汽车那样苛刻,这需要对神经网络进行成千上万次的再训练,以满足极端精度需求。DGX SuperPOD巨大的处理能力是无可取代的。”

DGX SuperPOD由1536台英伟达V100 Tensor Core GPU驱动,并与英伟达NVSwitch和Mellanox网络光纤互联,具有卓越的数据处理性能。该系统昼夜不停运行,优化自动驾驶软件,对神经网络进行再培训的周转时间可能比以前更快。例如,DGX SuperPOD硬件和软件平台训练ResNet-50仅需不到两分钟的时间。2015这款人工智能模型问世,当时最先进的NVIDIA K80 GPU耗时25天时间对其进行训练。DGX SuperPOD提供结果的速度要快18000倍。

其他性能水平类似的TOP500系统由数千台服务器组成,而DGX SuperPOD所占空间很小,大约比排名靠前的同类系统小400倍。英伟达DGX系统已被其他需要大量计算的组织所采用,包括宝马、大陆、福特和Zenuity、Facebook、微软和富士胶片。而且还被一些研究机构采用,例如日本理化研究所和美国能源部国家实验室。

参考构架创建自己的SuperPOD

DGX SuperPOD不仅运行深度学习模型速度快,而且由于其模块化的企业级设计,DGX SuperPOD的部署速度也非常快。这种规模的系统通常需要6-9个月的时间来部署,但DGX SuperPOD只需3周,工程师们遵循的是一种规定的、经过验证的方法。

建造DGX SuperPOD这样的超级计算机,帮助英伟达学会了如何为大型AI机器设计系统。这是超级计算技术的一项重要发展,它将巨大计算能力从学术界带到交通公司,以及其他希望使用高性能计算加速创新的行业。对于没有AI就绪数据中心,但希望使用英伟达SuperPOD构架来满足需求的组织,英伟达利用DGX就绪数据中心程序,为其提供简化的快速部署方案。该公司数据中心代管服务供应商支持企业客户构建部署基于DGX系统的世界级AI数据中心。