NVIDIA造出16核心全球最大GPU,靠的就是它!( 二 )

对英伟达来说,单芯片计算能力已经达到了目前技术条件下的上限,除非更换全新的制程,否则14/16nm世代的工艺已经很难再榨出油水(TSMC 12nm工艺实际上只是之前16nm工艺的深度优化版本,起名12nm更多是商业用途)。为了满足计算能力的需求,英伟达开始考虑并联多个GPU来获得更好的性能。

和桌面SLI等消费级技术完全不同的是,工业和科学研究所需要的计算加速设备对GPU并联的需求更高,8个起步,16个也才刚刚够看。鉴于此,英伟达需要一种全新的总线来连接所有的GPU,以实现数据共享和满足计算所需,这就是NVLink的由来。

NVLink

小试牛刀的160GB/s

说起NVLink,我们不得不提到PCIe总线。在NVLink出现之前,多GPU之间的互联是由PCIe总线完成的,PCIe 3.0 x16总线能够提供32GB/s的双向带宽,借助于PCIe Switch的存在,PCIe总线能够完成CPU-GPU、GPU-GPU之间的数据交换。一个典型的例子就是AMD的CrossFire X多卡互联系统,完全借助PCIe总线来传递数据,甚至不需要额外的桥接通道,相比之下,英伟达的SLI技术至今依旧在使用桥接芯片实现GPU的直接连接。