对话Graphcore中国高管:新IPU性能大幅超NV A100,中短期内冲市场第二( 二 )


那么 , IPU-M2000具体是如何支持PyTorch?
金琛谈到 , 在PyTorch代码里 , 他们引入了一个叫PopTorch的轻量级接口 , 通过这个接口 , 用户可基于当前的PyTorch模型做一个非常轻量级的封装 , 通过这个封装即可无缝地在IPU和CPU上运行模型 。
当前的POPLAR SDK 1.4版本可同时支持模型并行和数据并行 , 但如果用户想做跨机柜的模型并行和数据并行 , 则需要等到下一版的SDK 。
对话Graphcore中国高管:新IPU性能大幅超NV A100,中短期内冲市场第二文章插图
三、卢涛:英伟达是唯一挑战 , 中短期内要做到市场第二金琛提到 , 从IPU-M2000在多个大型复杂模型中的测试结果显示 , 其性能表现均优于市面上主流的GPU处理器 。
但实际上 , 当下模型算法演进的速度远快于芯片性能的提升 , 这些主流模型测试的结果对现实落地应用的指导性意义又有多大?
卢涛认为 , AI性能基准测试的结果对现实落地的指导意义还是很大的 。
假设 , 现在要在互联网场景落地或部署NLP等相关技术 , BERT-Large就是一个很大的模型 , 比企业自己采用的模型还要大 。
另一方面 , 不管未来AI处理器或CPU能否满足超大规模模型或多模态模型的增长 , 至少目前BERT-Large是一个对工业界和研究界有价值的基准 。 最实际的意义是 , 如果一家企业的芯片通过了BERT-Large测试 , 那么也相当于具备了在市场落地的入场券 。
不过 , 即便IPU-M2000性能超越了英伟达的A100及相关 , 但英特尔去年收购的Habana也被行业看好 , 尤其是Habana如果和英特尔的AI软件栈组合起来 , 对许多初创公司来说也是一个较大的挑战 。
巨头横亘在前 , Graphcore如何看待这些巨头带来的挑战?尤其当客户涉及到软硬件的迁移成本等方面 , Graphcore又有多少信心在未来可以抢夺未来的市场?
卢涛首先从两个维度探讨了英特尔在AI芯片的竞争 。 一是从英特尔收购的历史来看 , “芯片工业界和一些投资界都开玩笑说 , 英特尔是一个收购黑洞 。 ”卢涛说 。
在他看来 , 英特尔每收购一家公司 , 其内部整合并不像大家想象的那么好 , 不管是软件的进展还是未来的目标 , 都是在往后滑动的 。 “基于我个人的判断 , Habana的昨天就是它发展的明天 。 ”他说 。
二是从现实情况上看 , 卢涛说自己并不担心英特尔的“组合拳” 。 他认为 , 英特尔的AI芯片发展到今天 , 并没有一个明确的发展策略 , 从CPU到FPGA再到显卡等产品上 , 英特尔一直缺乏核心抓手 , 而且目前在工业场景中 , 英特尔的软件栈还未真正地大规模应用 。
因此在卢涛看来 , 当下Graphcore面临唯一的巨头挑战还是英伟达 。 不管是英伟达的GPU或CUDA , 还是其多年和开发者、社区共同建立起来的统一AI加速计算生态 , 都更具挑战性 , 也是Graphcore更加关注的 。
“但Graphcore对未来很有信心 。 ”卢涛提到 , 一是其处理器在不同的应用领域都体现了真正的价值 , 并且在主流Benchmark中也证明了自身产品的收益;二是其不少合作伙伴在GPU上难以解决的任务 , 反而在IPU上可以实现 。
“只要我们的IPU有价值点和价值定位 , 始终会有客户愿意买单 。 ”他说 , 尤其随着Graphcore和合作伙伴对SDK的不断打磨 , 从GPU迁移到IPU的难度将会比大家想象的低得多 。
未来 , Graphcore在中国市场的策略是要将互联网+云计算作为自身的第一大落地场景 , 到2021年 , 要在中国的云计算和互联网市场外再突破一到两个主流行业 , 例如金融、汽车、智慧医疗、智慧教育等 。
与此同时 , 卢涛也谈到 , Graphcore的中短期目标是希望在未来几年内 , 在数据中心AI训练和推理上的芯片发货、批量部署等方面 , 做到市场第二名的地位 , 仅次于英伟达 。
结语:AI芯片市场新老玩家混战加剧作为“闯入”中国AI芯片市场的少数国外独角兽之一 , 仅成立四年的Graphcore可谓是成长迅速 , 不仅相继推出自研IPU加速在数据中心AI训练和推理领域的竞争 , 还与阿里巴巴、微软等企业合作 , 逐步构建起面向开发者的软件和开源生态 。