实例|开源巨献:27个深度强化学习算法的实例项目( 二 )


CartPole与不同模型的混合<ahelp_4" name="help_4">

  • CartPole, Policy Based Methods, Hill Climbing
  • CartPole, Policy Gradient Methods, REINFORCE
  • Cartpole with Deep Q-Learning
  • Cartpole with Doouble Deep Q-Learning
更多链接<ahelp_4" name="help_4">
  • 有关Policy-Gradient Methods策略梯度方法,参见 1, 2, 3.
  • 有关 REINFORCE,参见 1, 2, 3.
  • 有关 PPO,参见 1, 2, 3, 4, 5.
  • 有关 DDPG,参见 1, 2.
  • 有关 Actor-Critic MethodsA3C,参见 1, 2, 3, 4.
  • 有关 TD3,参见 1, 2, 3
  • 有关 SAC,参见 1, 2, 3, 4, 5
  • 有关 A2C,参见 1, 2, 3, 4, 5
TowardsDataScience网站上的文章贝尔曼方程式在深度强化学习中如何工作?
深度Q网络中一对相互关联的神经网络
深度强化学习的三个方面:噪声,高估和探索
我在上述项目中开发的相关视频<ahelp_5" name="help_5">
  • Four BipedalWalker Gaits
  • BipedalWalker by Training Stages
  • CarRacing by Training Stages
  • Lucky Hopper
  • Martian Ant
  • Lunar Armada
  • Wooden Snake
  • Walking through the chess fields
  • Artificial snake on the way
  • Learned Long Snake
  • Such a fast cheetah
  • Four stages of Minitaur training
AI研习社是AI学术青年和AI开发者技术交流的在线社区。我们与高校、学术机构和产业界合作,通过提供学习、实战和求职服务,为AI学术青年和开发者的交流互助和职业发展打造一站式平台,致力成为中国最大的科技创新人才聚集地。
如果,你也是位热爱分享的AI爱好者。欢迎与译站一起,学习新知,分享成长。
实例|开源巨献:27个深度强化学习算法的实例项目
文章插图