实验项目

实验内容摘要

实验类别

学时数

DQN算法

DQN算法的基本原理与代码实现

综合

2

DQN改进算法

Double DQN和Dueling DQN算法的基本原理与代码实现

综合

2

REINFORCE算法

REINFORCE算法的基本原理与代码实现

综合

2

Actor-Critic算法

Actor-Critic算法的基本原理与代码实现

综合

2

TRPO算法

TRPO算法的基本原理与代码实现

综合

2

PPO算法

PPO算法的基本原理与代码实现

综合

2

DDPG算法

DDPG算法的基本原理与代码实现

综合

2

SAC算法

SAC算法的基本原理与代码实现

综合

2