吴军:追求知识而非名校光环——图灵奖得主的另类成功之路( 三 )


2013 年 , 杨立昆加入了又一个集聚了大量优秀学者的智能中心——Facebook 的研究部门 FAIR。杨立昆在 Facebook 工作期间 , 一方面构建 Facebook AI 的工程底座 , 一方面也参与和见证了 Facebook AI 给社区带来的各种成果 , 例如 ResNeXT、Detectron、 FAISS 等算法 , 以及 ONNX 业界模型标准等 。
“没有天赋“的杨立昆在追随一群聪明人的旅程中 , 孜孜不倦地追寻着人工智能的本质 , 最终自己变成了人工智能的先驱——这也不失为另一种“天赋” 。
04 追寻人工智能的本质杨立昆 8 岁的时候看过一部电影——《2001 太空漫游》 。影片里出现了他所热爱的一切:太空旅行、人类的未来以及超级计算机哈尔(HAL)的起义 。此后 , 他对人工智能的兴趣愈发强烈 。大学期间 , 杨立昆慢慢形成了自己的 AI 研究理念:以逻辑的方式无法建构真正的智能机器 , 必须赋予机器学习的能力 , 让它们能以经验为基础进行自我建构 。
通过大量的文献阅读 , 杨立昆发现科学界不止他有这种想法 , 他注意到了福岛邦彦等同道学者的研究成果 , 并开始思考提高新认知中心神经网络效率的方法 。
1989 年 , 在计算机还处于刀耕火种的年代 , 杨立昆开发的神经网络 LeNet 就已经被用在全美国的邮政系统中 , 来读取每一封信件上面的邮政编码 。
但在上世纪八十年代 , 对于那些人仍然执着于神经网络研究的学者 , 科学界把他们视为狂热的疯子 。
如今 , 在大量可用数据库和工具的推动下 , 以深度学习为代表的人工智能技术反而是最有发展前景的 。杨立昆的名字也与深度学习技术——卷积网络密不可分 。卷积网络受哺乳动物视觉皮层结构和功能的启发 , 能有效处理图像、视频、声音、语音、文本和其他类型的信号 。
杨立昆在新书《科学之路:人 , 机器与未来》中 , 放弃了艰深华丽的专业术语 , 而是选择更为直接有效的方式 , 通过真实的例证与切身体会 , 用简朴又不失雅趣的语言讲明了今天人工智能的本质:数学公式+计算能力+大量的数据 。

吴军:追求知识而非名校光环——图灵奖得主的另类成功之路

文章插图

要想弄明白人工智能的本质 , 首先 , 我们要将模式识别等问题转化成数学公式 。今天计算机的智能从实现的方式上讲完全不等同于人的智能 。但是 , 从结果上讲和人的智能等价 。你可以认为这是两种道路最终殊途同归 。杨立昆用了一些典型的模式识别的例子告诉我们人工智能是如何实现的 , 读者朋友即便对里面的公式细节不感兴趣 , 也能体会到人工智能和人的智能之间的不同 。不过 , 计算机在获得智能的方法上 , 有一点和人是相同的 , 那就是从观察到的现象中总结出规律 , 然后用规律再来预测现象 。杨立昆在书中举了伽利略研究速度的例子 , 伽利略通过观察找到了物体运动的规律并且将其变成了数学公式 , 然后再把这个公式应用于计算各种运动物体的速度 。机器学习也是如此 , 只不过机器学习的公式不那么直观 。
接下来 , 就需要获取数据 , 供计算机进行学习 。在任何人工智能的应用领域 , 原始的数据 , 比如图像本身是无法直接提供给机器学习的 , 这中间要进行一个转化 。这个转化的过程被称为特征提取 , 简单地讲 , 就是将真实世界的目标对象转化成计算机能够读懂的数据 。杨立昆博士用模式识别的例子说明了特征提取是如何进行的 。当然 , 如果读者朋友不想关心具体的步骤 , 至少需要明白一点 , 那就是计算机学习需要大量的数据 。
当数据量大了之后 , 就需要足够复杂的数学模型才能反映出大量数据之中所包含的各个细节 。虽然奥卡姆剃刀原理通常很有效 , 但是在机器学习领域并非如此 。事实上 , 过去基于人工神经网络的机器智能水平之所以不高 , 就是因为那个网络过于简单 。因此 , 杨立昆等人提出了更为庞大而复杂的深度学习人工神经网络 。于是这就有了第三个问题——计算能力的问题 。杨立昆博士对这部分内容没有做太多的论述 , 毕竟这部分工作主要是由 Google、Facebook 和亚马逊等公司工程师完成的 , 而非是科学家关注的重点 。