NVIDIA推动的深度学习计算平台进一步发展
——六个月内实现10倍性能提升
- 来源:中国安防行业网
- 2018/4/2 9:00:3539445
【中国安防展览网 品牌专栏】 2018年3月27日—NVIDIA公布了其的深度学习计算平台所取得的一系列重要进展,相较于六个月前发布的上一代产品,其深度学习工作负载性能实现了10倍提升。
NVIDIA的平台已被各大云计算服务提供商和服务器制造商所采用,此次公布的主要进展包括NVIDIA® Tesla® V100(强大的数据中心GPU)的2倍内存提升,以及革命性的全新GPU互联结构NVIDIA NVSwitchÔ,它可使多达16个Tesla V100 GPU同时以2.4 TB /秒的速度进行通信,这一速度创下历史新高。 NVIDIA还推出了一个更新的、全面优化的软件堆栈。
此外,NVIDIA推出 NVIDIA DGX-2Ô,是其在深度学习计算领域取得的重大突破。这是*能够提供每秒两千万亿次浮点运算能力的单点服务器。DGX-2具有300台服务器的深度学习处理能力,占用15个数据中心机架空间,而体积则缩小60倍,能效提升18倍。
NVIDIA创始人兼执行官黄仁勋在GTC 2018上公布了这一消息,他表示:“深度学习的超凡进展仅仅是对未来的启示。其中的很多进展都是基于NVIDIA深度学习平台,该平台已快速成为标准。我们正在以大幅超越摩尔定律的步伐加快提升平台的性能,以实现突破,进而为医疗保健、交通运输、科学探索和其他众多领域带来革命性改变。”
Tesla V100实现内存翻倍
Tesla V100 GPU被的研究人员广为采用,2倍的内存提升使其能够处理大部分内存密集型深度学习和高性能计算工作负载。
如今Tesla V100 GPU配备了32GB内存,将助力数据科学家对更深度、更大规模的深度学习模型进行训练,且比以往都更加。与之前的16GB版本相比,它还能将内存受限的HPC应用性能提升高达50%。
Tesla V100 32GB GPU目前可用于所有NVIDIA DGX系统。此外,各大计算机制造商Cray、HPE、IBM、联想、Supermicro和Tyan也宣布将于第二季度内推出各自全新的Tesla V100 32GB系统。 Oracle云基础设施也宣布计划将于今年下半年在云端提供Tesla V100 32GB。
NVSwitch: 革命性的互联结构
NVSwitch的带宽比好的PCIe交换机高出5倍,让能够采用更多的超级互联GPU来构建系统。它将帮助突破早前系统的限制并运行更大的数据集。它也为更大规模、更复杂的工作负载开启了可能,包括神经网络并行训练的建模。
NVSwitch在NVIDIA NVLinkÔ(NVIDIA开发的*高速互联技术)的创新基础上实现了进一步扩展,让系统设计人员能够构建更的系统,进而灵活地连接任何基于NVLink的GPU的拓扑结构。
先进的GPU加速深度学习和HPC软件堆栈
NVIDIA深度学习和HPC软件堆栈的更新面向社群免费提供。当前社群共有超过82万名注册用户,而一年前约为48万。
此次更新包括新版本的NVIDIA CUDA®、TensorRT、NCCL和cuDNN,以及面向机器人的全新Isaac软件开发套件。此外,通过与云服务提供商的密切合作,各大主流深度学习框架都在持续优化,以充分利用NVIDIA的GPU计算平台。
NVIDIA DGX-2:*性能高达每秒2 千万亿次浮点运算的系统
NVIDIA新推出的DGX-2系统通过借鉴NVIDIA为所有层级的计算堆栈开发的各种业界的技术优势,实现了每秒2 千万亿次浮点运算的里程碑式突破。
DGX-2是*采用NVSwitch的系统,其中采用的16个GPU均共享统一的内存空间。这让获得了相应的深度学习训练能力,以处理大规模的数据集和复杂的深度学习模型。
DGX-2结合了全面优化更新的NVIDIA深度学习软件套件,旨在助力数据科学家突破深度学习研究和计算的外部极限。
DGX-2能够在不到两天的时间内完成对FAIRSeq的训练,FAIRSeq是一种采用新技术的神经网络机器翻译模型,其性能相较于去年9月份推出的基于Volta架构的DGX-1提高了10倍。
Tesla V100 32GB得到业界广泛支持
微软技术院士兼语音和语言业务负责人黄学东表示:“在过去几年中,微软和NVIDIA在AI技术方面的合作取得了巨大进展,包括近在汉译英方面的突破。借助全新Tesla V100 32GB GPU,我们将能够更快速地针对更大规模、更为复杂的AI模型进行训练。这将有助于提升自身语音识别模型和机器翻译模型的准确性,使其达到人类的水平,并强化Cortana、Bing和Microsoft Translator等产品。”
SAP以色列创新中心副总裁Michael Kemelmakher表示:“我们采用SAP Brand Impact这款能够近乎实时地对视频中的品牌曝光率进行自动化分析的应用,评估了搭载全新Tesla V100 32GB的DGX-1。内存的升级提高了我们在较大的ResNet-152模型上处理更高清晰度图像的能力,将平均错误率降低40%,进而能够提供准确、及时且可审计的规模化服务。”
NVIDIA DGX 产品组合
DGX-2是NVIDIA DGX产品组合中的新产品。该组合由三个系统组成,旨在帮助数据科学家快速开发、测试、部署并扩展全新的深度学习模型及创新成果。
DGX-2搭载16个GPU,是该产品阵容中的*。该系列中的其它产品还包括采用8个Tesla V100 GPU的NVIDIA DGX-1系统,以及拥有紧凑型桌边式设计、采用4个Tesla V100 GPU的首台个人深度学习超级计算机DGX Station™。这些系统使数据科学家能够将工作从运行于桌面的复杂实验,扩展至高难度的深度学习问题,帮助他们全力完成工作。
关于NVIDIA
NVIDIA(纳斯达克股票代码:NVDA)是一家人工智能计算公司。它在1999年发明的GPU激发了PC游戏市场的增长,重新定义了现代计算机显卡,并且对并行计算进行了革新。近,通过将GPU作为可以感知和理解世界的计算机、机器人乃至自动驾驶汽车的大脑,GPU深度学习再度点燃了全新的计算时代——现代人工智能。