资源 | 台大李宏毅教授最新课程,深度强化学习有国语版啦!

资源 | 台大李宏毅教授最新课程,深度强化学习有国语版啦!


大数据文摘出品



入坑深度学习的同学肯定都听过台湾大学的李宏毅教授,或者是他那本非常受欢迎的课程——《1天搞懂深度学习》。这门课程的讲义PPT总共有286页,深入浅出的介绍了深度学习的概念、框架及展望。



课程内容通俗易懂,适合深度学习初学者及相关从业人员,在大数据文摘后台回复

“深度学习”

可下载课程讲义。



文摘菌今天要给大家推荐的是李老师最近更新的课程:深度强化学习(deep reinforcement learning),目前这门课程在youtobe上更新了4个视频,分别是策略梯度算法(Policy Gradient)、近端策略优化(Proximal Policy Optimization,PPO)、Q-learning算法基本概念和Q-learning算法高级技巧。

资源 | 台大李宏毅教授最新课程,深度强化学习有国语版啦!
资源 | 台大李宏毅教授最新课程,深度强化学习有国语版啦!



每个视频大约40分钟左右,PPT内容为英文,讲授语言为中文。课程内容主打强化学习,涉及理论和论文解读,需要一定的强化学习的基础,感兴趣的小伙伴可以学起来啦!



深度强化学习youtube链接:

http://www.youtube.com/watch?v=z95ZYgPgXOY

深度强化学习B站链接:

http://www.bilibili.com/video/av24724071



文摘菌对视频内容做了简单介绍,供大家参考。



策略梯度算法:

  • 策略梯度算法理论

  • 算法实现

  • 实用建议

  • 近端策略优化:

  • 采样问题

  • PPO算法理论

  • 对论文结果的解读

  • Q-learning算法基本概念:

  • 蒙特卡洛方法

  • Actor-Critic算法

  • Q-learning理论

  • Q-learning算法高级技巧:

  • Double DQN

  • Dueling DQN

  • 高级技巧



  • 目前课程在连载状态,感兴趣的同学可以关注李宏毅的youtube主页:

    http://www.youtube.com/channel/UC2ggjtuuWvxrHHHiaDH1dlQ/videos



    此外,李老师在youtube还有《机器学习》和《深度学习》两门课程的视频讲解,这两门课程也获得了不错的口碑,课程链接如下:



    机器学习youtube链接:

    http://www.youtube.com/watch?v=CXgbekl66jc&list=PLJV_el3uVTsPy9oCRY30oBPNLCo89yu49



    机器学习B站链接:

    http://www.bilibili.com/video/av19144978



    深度学习youtube链接:

    http://www.youtube.com/watch?v=KKT2VkTdFyc



    深度学习B站链接:

    http://www.bilibili.com/video/av20961661



    李宏毅老师简介:主要研究领域为机器学习(特别是深度学习)、口语语义理解和语音识别。

  • 2012年从台北 National Taiwan University (NTU) 博士毕业。

  • 2012年9月—2013年8月,在 Sinica Academia 的 Research Center for Information Technology Innovation 做博士后。

  • 2013年9月—2014年7月,在 MIT Computer Science and ArtificialIntelligence Laboratory (CSAIL) 的 Spoken Language Systems Group 做访问学者。

  • 现任 Department of Electrical Engineering of National TaiwanUniversity 副教授。

  • 今日机器学习概念】

    Have a Great Definition

    资源 | 台大李宏毅教授最新课程,深度强化学习有国语版啦!
    资源 | 台大李宏毅教授最新课程,深度强化学习有国语版啦!
    资源 | 台大李宏毅教授最新课程,深度强化学习有国语版啦!
    资源 | 台大李宏毅教授最新课程,深度强化学习有国语版啦!