RL: 强化学习(RL)是受行为主义心理学启发的机器学习领域[引证需要],关注软件代理应如何在环境中采取行动以最大化一些累积奖励的概念。