实验项目 | 实验内容摘要 | 实验类别 | 学时数 |
DQN算法 | DQN算法的基本原理与代码实现 | 综合 | 2 |
DQN改进算法 | Double DQN和Dueling DQN算法的基本原理与代码实现 | 综合 | 2 |
REINFORCE算法 | REINFORCE算法的基本原理与代码实现 | 综合 | 2 |
Actor-Critic算法 | Actor-Critic算法的基本原理与代码实现 | 综合 | 2 |
TRPO算法 | TRPO算法的基本原理与代码实现 | 综合 | 2 |
PPO算法 | PPO算法的基本原理与代码实现 | 综合 | 2 |
DDPG算法 | DDPG算法的基本原理与代码实现 | 综合 | 2 |
SAC算法 | SAC算法的基本原理与代码实现 | 综合 | 2 |