从Bengio演讲发散开来:探讨逻辑推理与机器学习( 三 )


最近的一些研究着眼于将逻辑与深度学习系统进行结合 , 这也正是我们这篇文章所考虑的问题 。 我们将在下面的内容中选择三篇关注于逻辑推理与深度神经网络相结合的文章进行深入分析[5][6][7] 。
2. 逻辑推理与深度学习(Logic Reasoning & DL)
2.1 Bridging Machine Learning and Logical Reasoning by Abductive Learning [5]
从Bengio演讲发散开来:探讨逻辑推理与机器学习文章插图
本文是南大周志华教授组发表在 NeurIPS 2019 中的一篇研究成果 。 感知(Perception)和推理(Reasoning)是两种具有代表性的智能能力 , 它们在人类解决问题的过程中是无缝集成的 。 然而在人工智能领域 , 这两种能力通常是分别通过机器学习和逻辑编程来实现的 , 因此 , 这两类技术在人工智能的历史上是分开发展的 。 本文提出的诱因性学习(Abductive Learning)旨在将两类人工智能方法有机地统一起来 , 即机器学习模型学习从数据中感知原始逻辑事实 , 而逻辑推理方法则是引入符号领域知识并纠正错误感知的事实 , 以改进机器学习模型 。 此外 , 作者提出了一种新的方法来联合优化机器学习模型和逻辑推理模型 。 作者证明 , 通过使用诱因性学习 , 机器可以从简单的手写方程图像中同时学习识别数字和解决未知的数学运算 。 此外 , 所学习到的模型可以推广到更长的方程组并适应不同的任务 , 这已经超出了现有的先进深度学习模型的能力 。
2.1.1 诱因性学习
为了更自然地利用学习和推理 , 了解感知和推理在单个系统中如何相互影响是至关重要的 , 本文所引入的诱因性学习则是一种有效的联合应用和分析的方法 。 诱因性学习是指根据背景知识有选择地推断出对观察结果作出最佳解释的特定事实和假设的过程 , 其中「观察」主要是感官信息 , 「知识」通常是象征性和结构性的 。
人类使用诱因问题解决方法来解决问题的一个直观例子是玛雅象形文字的破译 , 它反映了人类两个显著的智能能力:1)从象形文字中直观地感知单个数字;2)基于数学和日历的背景知识 , 象征性地进行推理 。 图 1 显示了从帕伦克十字庙发现的玛雅历法 , 它从神话中的创世日期开始 , 接着是以长计数书写的时间段 , 最后是由 Tzolk'in 和 Haab'日历编码的特定日期 。
从Bengio演讲发散开来:探讨逻辑推理与机器学习文章插图
图 1. 玛雅历法 , 其中彩色盒子和「?」对应于未知数字
图 2 描绘了查尔斯 P. 鲍迪奇(Charles P. Bowditch)破解图 1 的记录 。 他首先确认了一些已知的数字 , 并确认第一和第六个象形文字是相同的 。 然后 , Bowditch 尝试用视觉上相似的数字代替那些未知的象形文字 , 如图 2 中的「第 1 列」所示 。 同时 , 他根据自己的推测和玛雅历法中的背景知识计算出 Tzolk'in 和 Haab'的值 , 如图 2 的「第 2 列」所示 。 最后 , 通过观察其猜想与计算的一致性 , 得到了正确答案「1.18.5.4.0 , 1 Ahau 13 Mak」 。 这整个过程应用的就是诱因问题解决方法 。
从Bengio演讲发散开来:探讨逻辑推理与机器学习文章插图
图 2. 鲍迪奇对图 1 的解读(他把「Mak」写为「Mac」) 。 垂直框中的数字是他对图 1 中未知象形文字的猜测(第 1 列) 。 虚线黄色框根据其计算结果(第 2 栏)标记一致结果 。
受诱因问题解决方法的启发 , 本文提出了诱因性学习(Abductive Learning , ABL) , 一种连接机器学习和逻辑推理的新方法 。 在 ABL 中 , 机器学习模型负责将子符号数据解释为原始逻辑事实 , 逻辑模型可以根据一些一阶逻辑背景知识对解释后的事实进行推理 , 以得到最终的输出 。 这一过程中最主要的困难在于子符号模型和符号模型很难一起训练 。 更具体地说:1)它不具备训练机器学习模型的原始逻辑事实(如图 1 中的正确数字)的任何基本真理;2)没有准确的原始逻辑事实 , 推理模型很难推断出正确的输出或学习正确的逻辑理论 。