回到课程
本课程由Tessa van der Heiden编写,她是宝马公司自动驾驶算法的研究员和开发者。
在本课程中,您将学习强化学习的数学基础,强化学习是一种基本的机器学习技术,通过试错来训练代理(或算法)。通过奖励良好结果的代理,它可以“学习”最优策略,这可以应用于机器人、量化交易和博弈论等领域的问题。
了解为什么神经网络是灵活的学习工具。
快速潜入前沿的计算学习方法。