英伟达GTC China大会最新干货 GTC是什么会议



英伟达联手JD.COM打造全球首个智能配送城市,拉BAT滴滴秀A100中国云朋友圈 。
作者|
心缘编译|
shadow东信12月15日报道距离2020年底还有两周时间 。今天,英伟达2020全球GPU技能峰会的最后一站——GTC中国大会召开在即,英伟达又到了晒晒年底中国朋友的红豆博客圈了 。
受疫情影响,数以万计的参与者在线上参与了这项技能活动 。与以往不同的是,整个动作增强了调音技巧的研究和落地进度,没有新品发布 。
这一次,在今年的前几届GTC大会上,在厨房砧板前发表演讲的不是英伟达首席执行官黄仁勋,而是英伟达首席科学家比尔·戴利(Bill Dally) 。

▲英伟达首席科学家比尔·戴利
在一个小时的主题演讲中,这位著名的计算机科学家介绍了英伟达各种AI讨论的最新进展,并分享了其研究实验室关于AI推理、硅光子学和GPU集群加速的三个最新讨论 。他认为,不仅图形的未来是AI,几乎一切的未来都是AI 。
在Bill Dally的主题演讲结束后,NVIDIA的五位资深专家分别介绍了中国在AI、数据科学和医疗健康领域应用了多少突破性的技能 。

英伟达全球业务运营和实施副总裁杰伊·普里(Jay Puri)回应称,Arm是一家令人惊叹的公司,年销售额约为220亿个CPU,之一个启用IP的模式,产品性能非常高 。它的成功集中在移动和嵌入式领域,但涉足云数据中心和PC领域仍然非常困难,x86占据了完全的主导地位 。
英伟达在数据科学和人工智能方面拥有强大的生态 。一旦Arm成为英伟达的一部分,英伟达将专注于提高Arm在数据中心、PC和云计算方面的成功 。
针对一些公司对Arm授权限制的担忧,Jay Puri表示,对出口管制法的操作 存在一些误解 。不管Arm是属于软银还是NVIDIA,所有的贴片技巧都是在技巧发源地英国剑桥研发的 。英伟达已经承诺,收购完成后,英国剑桥未来也将是Arm skills的研发中心 。
此外,面向AI和数据科学创业者的孵化项目NVIDIA Inception邀请了12位中国创业者与会,展示他们如何基于NVIDIA技能实现不同领域的创新 。

01.
Bill Dally:英伟达在AI推理、硅光子学、GPU集群加速方面的最新研究进展

在系统介绍了NVIDIA的软硬件布局和先进技术后,NVIDIA首席科学家Bill Dally以红豆博客三个项目为例,讲述了自己带领的200人研讨会团队如何成功实现黄定律 。这条以黄仁勋为洪都博客命名的定律预测,GPU将推动AI性能逐年翻倍 。

在过去的八年里,NVIDIA将单个芯片的推理性能提升了317倍 。“如果我们真的想提高计算机的性能,黄定律是一个主要指标,在可预见的未来将永远是实用的 。”磨磨蹭蹭的说道 。
Dally曾负责NVIDIA在AI、光线追踪和高速互联方面的相关研究 。他重点分享了三个新的研究方向 。
1.超高能效加速器磁铁
推理是一个复杂的问题,涉及的不仅仅是计算 。在模拟测试中,NVIDIA MAGNet tool生成的AI推理加速器可以达到每瓦100 teraops,比目前的商用芯片高出一个数量级 。
这个工具采用了一系列新技术来协调和掌握通过设备的信息流,并更大限度地减少数据传输,从而节省能源 。本研究原型采用模块化实现,因此可以灵活扩展 。

2.光链路比电链路快
英伟达的研究团队也在讨论用更快的光链路取代现有系统中的电链路 。该团队正在与哥伦比亚大学的研究人员密切合作,探索如何在他们的核心 中应用电信提供商采用的技术,通过一根光纤传输几十个信号 。
由于自身的限制,电信号的传输距离只有1/3米,而光信号的传输距离为20-100米,因此只有单个NVLink可以连接到更广泛的系统 。
这种被称为“密集波分复用”的光学技术,有望在只有1 mm大小的芯片上实现Tb/s的数据传输,是目前互连密度的10倍以上 。
除了更高的吞吐量之外,光链路还有助于建立一个更密集的系统 。Dally展示了一个英伟达DGX架构模型的例子,未来可以通过光链路传输配备超过160个GPU 。

3.编程系统Legate的新原型
在软件方面,为了简化编程步骤,NVIDIA的研究人员开发了一个新的编程系统Legate的原型 。有了Legate,开发者可以在任何范围的系统中运行为单个GPU编写的程序,这不仅适用于Jetson Nano、单卡A100,也适用于拥有数千个GPU的巨型超级计算 。
Legate将新的编程速记集成到加速软件库和高级运行时环境军团中,目前正在美国国家实验室进行测试 。
【英伟达GTC China大会最新干货 GTC是什么会议】