回到课程

强化学习

机器学习的关键技术速成班。

本课程由Tessa van der Heiden编写,她是宝马公司自动驾驶算法的研究员和开发者。

在本课程中,您将学习强化学习的数学基础,强化学习是一种基本的机器学习技术,通过试错来训练代理(或算法)。通过奖励良好结果的代理,它可以“学习”最优策略,这可以应用于机器人、量化交易和博弈论等领域的问题。

互动
教训

6

概念和
练习

50 +
  1. 1

    简介

    1. 简介

  2. 2

    基金会

    1. 包含在
      才华横溢的溢价

      价值函数

    2. 包含在
      才华横溢的溢价

      动态规划

    3. 包含在
      才华横溢的溢价

      蒙特卡罗

  3. 3.

    扩展

    1. 包含在
      才华横溢的溢价

      学习时态的区别

    2. 包含在
      才华横溢的溢价

      策略梯度方法