按关键词阅读:
【英伟达发布全球最强GPU,多款新品同时亮相】在今年五月 , 英伟达发布了基于全新Ampere架构打造的GPU A100 。
据该公司CEO黄仁勋介绍 , A100 采用台积电当时最先进的7 纳米工艺打造 , 拥有 540 亿个晶体管 , 面积高达 826mm2 , GPU 的最大功率也达到了 400W 。 又因为同时搭载了三星 HBM2 显存、第三代 Tensor Core和带宽高达600GB/s 的新版 NVLink , 英伟达的A100在多个应用领域也展现出强悍的性能 。
文章插图
从英伟达提供的数据可以看到 , 如果用 PyTorch 框架跑 AI 模型 , 相比上一代 V100 芯片 , A100 在 BERT 模型的训练上性能提升 6 倍 , BERT 推断时性能提升 7 倍 。 而根据MLPerf组织在十月底发布的最新推理基准测试(Benchmark)MLPerf Inference v0.7结果 , 英伟达A100 Tensor Core GPU在云端推理的基准测试性能是最先进英特尔CPU的237倍 。
但英伟达不止步于此 。 在昨日 , 他们发布了面向AI超级计算的全球最强GPU——A100 80GB;与此同时 , 他们还带来了一体式AI数据中心NVIDIA DGX Station A100以及NVIDIA Mellanox 400G InfiniBand产品 。
全球最强的AI超算GPU
据英伟达方面介绍 , 公司全新的 A100 80GB GPU的最大特点在于采用了HBM2E内存技术 , 能将A100 40GB GPU的高带宽内存增加一倍至80GB , 这样的设计也让英伟达成为业内首个实现了2TB/s以上的内存带宽的企业 。
文章插图
“若想获得HPC和AI的最新研究成果 , 则需要构建最大的模型 , 而这需要比以往更大的内存容量和更高的带宽 。 A100 80GB GPU所提供的内存是六个月前推出的前代产品的两倍 , 突破了每秒2TB的限制 , 使研究人员可以应对全球科学及大数据方面最严峻的挑战 。 ”NVIDIA应用深度学习研究副总裁Bryan Catanzaro表示 。
此外 , 第三代Tensor Core核心、MIG技术、结构化稀疏以及第三代NVLink和NVSwitch , 也是全新GPU能够获得市场认可的保证 。
文章插图
从英伟达提供的资料我们可以看到 , 该公司的第三代Tensor Core核心通过全新TF32 , 能将上一代Volta架构的AI吞吐量提高多达20倍;通过FP64 , 新核心更是能将HPC性能提高多达2.5倍;而通过 INT8 , 新核心也可以将AI推理性能提高多达20倍 , 并且支持BF16数据格式 。
MIG技术则能将单个独立实例的内存增加一倍 , 并可最多提供七个MIG , 让每个实例具备10GB内存 。 英伟达方面表示 , 该技术是一种安全的硬件隔离方法 , 在处理各类较小的工作负载时 , 可实现GPU最佳利用率 。 例如在如RNN-T等自动语言识别模型的AI推理上 , 单个A100 80GB MIG实例可处理更大规模的批量数据 , 将生产中的推理吞吐量提高1.25倍 。
至于结构化稀疏 , 则可以将推理稀疏模型的速度提高2倍;包括第三代NVLink和NVSwitch在内的新一代互连技术 , 则可使GPU之间的带宽增加至原来的两倍 , 将数据密集型工作负载的GPU数据传输速度提高至每秒600 gigabytes 。
除了性能提升以外 , 基于A100 40GB的多样化功能设计的A100 80GB GPU也成为需要大量数据存储空间的各类应用的理想选择 。
以DLRM等推荐系统模型为例 , 他们为AI训练提供了涵盖数十亿用户和产品信息的海量表单 。 但A100 80GB可实现高达3倍加速 , 使企业可以重新快速训练这些模型 , 从而提供更加精确的推荐;在TB级零售大数据分析基准上 , A100 80GB将其性能提高了2倍 , 使其成为可对最大规模数据集进行快速分析的理想平台;对于科学应用 , A100 80GB可为天气预报和量子化学等领域提供巨大的加速 。
“作为NVIDIA HGX AI超级计算平台的关键组件 , A100 80GB还可训练如GPT-2这样的、具有更多参数的最大模型 。 ”英伟达方面强调 。
下一代400G InfiniBand
在发布A100 80GB的同时 , 英伟达还带了下一代的400G InfiniBand产品 。 在讲述英伟达的新品之前 , 我们有必要先了解一下什么是InfiniBand 。
所谓InfiniBand , 是一种网络通信协议 , 它提供了一种基于交换的架构 , 由处理器节点之间、处理器节点和输入/输出节点(如磁盘或存储)之间的点对点双向串行链路构成 。 每个链路都有一个连接到链路两端的设备 , 这样在每个链路两端控制传输(发送和接收)的特性就被很好地定义和控制 。 而早前被英伟达收购的Mellanox则是这个领域的专家 。
资料显示 , Mellanox为服务器 , 存储和超融合基础设施提供包括以太网交换机 , 芯片和InfiniBand智能互连解决方案在内的大量的数据中心产品 , 其中 , 更以InfiniBand互连 , 是这些产品中重中之重 。
稿源:(未知)
【傻大方】网址:http://www.shadafang.com/c/111J2H3H020.html
标题:英伟达发布全球最强GPU,多款新品同时亮相