对话Graphcore中国高管：新IPU性能大幅超NV A100，中短期内冲市场第二( 二 ) 芯东西（公众号：aichip001）作者|韦世

那么， IPU-M2000具体是如何支持PyTorch？
金琛谈到，在PyTorch代码里，他们引入了一个叫PopTorch的轻量级接口，通过这个接口，用户可基于当前的PyTorch模型做一个非常轻量级的封装，通过这个封装即可无缝地在IPU和CPU上运行模型。
当前的POPLAR SDK 1.4版本可同时支持模型并行和数据并行，但如果用户想做跨机柜的模型并行和数据并行，则需要等到下一版的SDK 。
文章插图
三、卢涛：英伟达是唯一挑战，中短期内要做到市场第二金琛提到，从IPU-M2000在多个大型复杂模型中的测试结果显示，其性能表现均优于市面上主流的GPU处理器。
但实际上，当下模型算法演进的速度远快于芯片性能的提升，这些主流模型测试的结果对现实落地应用的指导性意义又有多大？
卢涛认为， AI性能基准测试的结果对现实落地的指导意义还是很大的。
假设，现在要在互联网场景落地或部署NLP等相关技术， BERT-Large就是一个很大的模型，比企业自己采用的模型还要大。
另一方面，不管未来AI处理器或CPU能否满足超大规模模型或多模态模型的增长，至少目前BERT-Large是一个对工业界和研究界有价值的基准。最实际的意义是，如果一家企业的芯片通过了BERT-Large测试，那么也相当于具备了在市场落地的入场券。
不过，即便IPU-M2000性能超越了英伟达的A100及相关，但英特尔去年收购的Habana也被行业看好，尤其是Habana如果和英特尔的AI软件栈组合起来，对许多初创公司来说也是一个较大的挑战。
巨头横亘在前， Graphcore如何看待这些巨头带来的挑战？尤其当客户涉及到软硬件的迁移成本等方面， Graphcore又有多少信心在未来可以抢夺未来的市场？
卢涛首先从两个维度探讨了英特尔在AI芯片的竞争。一是从英特尔收购的历史来看， “芯片工业界和一些投资界都开玩笑说，英特尔是一个收购黑洞。 ”卢涛说。
在他看来，英特尔每收购一家公司，其内部整合并不像大家想象的那么好，不管是软件的进展还是未来的目标，都是在往后滑动的。 “基于我个人的判断， Habana的昨天就是它发展的明天。 ”他说。
二是从现实情况上看，卢涛说自己并不担心英特尔的“组合拳” 。他认为，英特尔的AI芯片发展到今天，并没有一个明确的发展策略，从CPU到FPGA再到显卡等产品上，英特尔一直缺乏核心抓手，而且目前在工业场景中，英特尔的软件栈还未真正地大规模应用。
因此在卢涛看来，当下Graphcore面临唯一的巨头挑战还是英伟达。不管是英伟达的GPU或CUDA ，还是其多年和开发者、社区共同建立起来的统一AI加速计算生态，都更具挑战性，也是Graphcore更加关注的。
“但Graphcore对未来很有信心。 ”卢涛提到，一是其处理器在不同的应用领域都体现了真正的价值，并且在主流Benchmark中也证明了自身产品的收益；二是其不少合作伙伴在GPU上难以解决的任务，反而在IPU上可以实现。
“只要我们的IPU有价值点和价值定位，始终会有客户愿意买单。 ”他说，尤其随着Graphcore和合作伙伴对SDK的不断打磨，从GPU迁移到IPU的难度将会比大家想象的低得多。
未来， Graphcore在中国市场的策略是要将互联网+云计算作为自身的第一大落地场景，到2021年，要在中国的云计算和互联网市场外再突破一到两个主流行业，例如金融、汽车、智慧医疗、智慧教育等。
与此同时，卢涛也谈到， Graphcore的中短期目标是希望在未来几年内，在数据中心AI训练和推理上的芯片发货、批量部署等方面，做到市场第二名的地位，仅次于英伟达。
结语：AI芯片市场新老玩家混战加剧作为“闯入”中国AI芯片市场的少数国外独角兽之一，仅成立四年的Graphcore可谓是成长迅速，不仅相继推出自研IPU加速在数据中心AI训练和推理领域的竞争，还与阿里巴巴、微软等企业合作，逐步构建起面向开发者的软件和开源生态。