张亚勤:深度学习更近一步,如何突破香农、冯诺依曼和摩尔瓶颈?( 二 )


根据 Google AI 负责人Jeff dean 的观点 , 人工智能的三大要素是数据、算法和算力 , 实际上是数据加上 100 倍的算力 , 并且算力比数据更重要 100 倍 。 这个观点我不完全同意 , 但我同意在目前深度学习框架下 , 算力十分重要 。
突破香农、冯诺依曼、摩尔瓶颈 , 推动算力发展
怎么突破目前的算力?过去 60 年 , 传统计算与通讯范式有三个重要原理:香农定律、冯诺依曼架构和摩尔定律 。
香农定律 , 定义了熵、信道容量和失真情况下压缩极限 , 目前 , 我们距离这三个极限已比较接近 。 冯诺依曼架构是指五个最基本模块加上程序存储原理 , 是图灵意义下最好的一种实现 , 但它的瓶颈在于数据和计算的分离 。 在深度学习中 , 庞大数据量本身就会形成一个瓶颈 。 最后还有摩尔定律的限制 。
如何突破这三个瓶颈?
首先 , 我们需要对信息做一个重新的定义 , 制定新的计算范式 。 另外 , 进入互联网时代 , 香农理论从点对点通讯延伸到多用户信息论 , 但真正的理论框架并没有太大进步 , 所以需要更多理论层面的模型更新 , 否则深度学习就很难引入因果关系和模型 。
目前 , 图像视频编码技术的发展已经达到性能极限 , 如何用 AI 彻底、大幅度地进行改善也需要我们的思考 。
此外 , 还需要新计算体系和通讯架构 , 创新传感器类型 。 传感器能够获取各种各样的数据 , 所以非常重要 。 有观点认为 , 人用「小数据」就可以做决策 , 但我认为大数据是机器的优势 , 虽在决策方面与人相比稍有欠缺 , 但在获取各种不同数据时比人更有优势 。
同时 , 需要新模态 。 深度学习需要的 Tensor Products、线性代数、布尔代数等要素在传统的冯诺依曼架构下不易实现 , 通过研发 GPU、ASIC 等技术加速并彻底形成新架构成为了大趋势 。 除了传统的英特尔、AMD , 谷歌、百度、地平线、寒武纪等公司也在做这件事 , 在新架构产生之后 , 就会随之产生更多新算法、新模型、新型芯片 , 这将是一个非常大的机会 。
这是一个我在百度启动的项目:昆仑芯片 , 这是一个大型芯片 , 主要用于大型训练 , 已经在百度部署 。 第一代昆仑芯片能在 150 瓦的功率下实现 260 TOPS 的处理能力 。 第二代昆仑芯片采用 7nm 先进工艺 , 相对于第一代芯片而言 , 性能提高了 3 倍 。
核心基础设施「ABCD」带来智能时代的颠覆性改变
计算、通讯、新架构、新算法 , 它们给产业带来的新机遇 , 就像联想的「3S 战略」 , 在 IT 行业不断升级的背景下 , 为整个产业带来了新机遇甚至是颠覆性的改变 。
张亚勤:深度学习更近一步,如何突破香农、冯诺依曼和摩尔瓶颈?文章插图
抓住新的行业机遇 , 我们正在面临第四次工业革命 , 如果说前三次工业革命中国是旁观者 , 但在这一次 , 中国有机会在很多方面成为引领者 。
面向第四次工业革命 , 我们希望能够打造成一个国际化、智能化和产业化的智能产业研究院(AIR) 。 我们有三个方式达到这个目标:最重要的是吸引一流人才 , 特别是担任过 CTO、研究院院长的人才 , 另外还要有深厚的学术背景和丰富的企业经验;其次 , 研究院还要培养目前我们还比较缺乏的、具备深度大系统思维能力和顶层设计能力的 CTO 和顶级架构师;最后 , 我们要打造核心技术并逐步将其发展为公司 。
目前 , 我们刚刚起步 , 除我之外 , 还有两位联合合伙人 , 一位是马维英博士 , 他是电气电子工程师学会院士 , 字节跳动副总裁、人工智能实验室主任 , 也是微软亚洲研究院前常务副院长;另一位是赵峰博士 , 他也是电气电子工程师学会院士 , 还是前海尔集团 CTO、副总裁 , 全球 loT 教科书编写者 。 这两位联合合伙人非常符合我刚才的描述 , 不仅发表很多学术文章 , 同时又有丰富的产业经验 。
我们聚焦于三个研究领域:智慧交通、工业互联网、智慧医疗 。 我认为 , 智慧交通能够为整个社会和产业带来巨大的影响 , 作为未来 5-10 年最有挑战的技术 , 无人驾驶还能够通过狭义的人工智能解决自身的难题 。 我们还聚焦工业互联网、IoT、智能感知 , 因为他们是数字世界和物理世界的接口;在我们看来 , AI 在未来十年还可以深层次地改变整个医疗健康产业 , 不局限于 AI 机器人针对病人和医护人员的协助性工作 , 还包括制药、蛋白质结构预测等 , 实现以上三领域的发展都需要基础设施「ABCD」 , 即 AI、Big Data、Cloud、Device , 以及学者对基础科学研究的支持 。