限时免费|反向增强学习基础

限时免费|反向增强学习基础

主讲人:冯  超

滴滴   专家算法工程师

毕业于中国科学院大学,滴滴专家算法工程师,曾任小猿搜题拍照搜题负责人之一。2017年独立撰写《深度学习轻松学:核心算法与视觉实践》一书,深入详细地介绍了深度学习的基本结构,模型优化和参数设置细节,视觉领域应用等内容。知乎专栏:《无痛的机器学习》作者。

限时免费|反向增强学习基础

? 主题:反向增强学习基础

? 时间:11月19日 20:00

? 形式:视频直播

? 讲座概要:

增强学习已经成为人工智能发展的一个重要方向,Alpha Zero的算法也再一次向世人展示了增强学习的强大之处。而它的孪生兄弟——反向增强学习,也同样具有很强的理论与应用价值。

本讲座主要介绍增强学习与反向增强学习的共同框架与反向增强学习的基本解法。

? 讲座提纲:

1. 增强学习与反向增强学习的基本概念

2. 线性反向增强学习问题的建模

3. 线性反向增强学习的求解

? 讲座提纲:

Ng A Y, Russell S J. Algorithms for Inverse Reinforcement Learning[C]// Seventeenth International Conference on Machine Learning. Morgan Kaufmann Publishers Inc. 2000:663-670.

Sutton R S, Barto A G. Reinforcement learning : an introduction[J]. Machine Learning, 1998, 8(3-4):225-227.

? 如何报名:

扫描二维码即可报名限时免费|反向增强学习基础

限时免费|反向增强学习基础