Academic Projects Links About 🚇

Back

Tags: #rl

May 1, 2025

强化学习算法程序实践（2）：DQN 及其改进

从 Q-table 走向深度强化学习

12 min read
- rl
May 1, 2025

强化学习算法程序实践（3）：策略梯度与 Actor-Critic

策略分布（Softmax / Gaussian）设计，回报累积与并行采样。

11 min read
- rl
May 1, 2025

强化学习算法程序实践（4）：连续控制（DDPG / TD3 / SAC）

Actor/Critic 输入输出、Replay Buffer、探索噪声、以及各自 update 的关键差异

11 min read
- rl