项目简介
本项目运用深度强化学习算法(DQN和DDPG)解决MountainCar问题。在MountainCar问题里,小车初始处于山谷谷底,需积累足够动量驶向山顶。项目分别用DQN算法处理离散动作的MountainCar问题,用DDPG算法应对连续动作的MountainCarContinuous问题,以此探究不同算法在此问题上的应用效果。
项目的主要特性和功能
- DQN算法应用:针对离散动作的MountainCar问题,借助经验回放和目标网络技术,使智能体根据当前状态选最优动作,实现驶向山顶的目标。
- DDPG算法应用:用于解决连续动作的MountainCarContinuous问题,结合深度神经网络与确定性策略梯度算法,让智能体连续控制引擎力,以最佳方式驶向山顶。
- 经验回放机制:两种算法都采用该技术,将智能体与环境交互的经验存于经验池,随机抽样训练,打破数据相关性,提升训练效率。
- 目标网络稳定学习:DQN和DDPG算法用目标网络计算目标Q值,通过软更新策略使目标网络逐步跟随主网络参数更新,稳定学习过程。
- 模型训练与评估:提供完整的模型训练流程,涵盖模型构建、训练配置、训练和评估环节,可输出训练过程的奖励得分及测试时的平均、最大和最小奖励得分,便于评估模型性能。
安装使用步骤
- 安装依赖:确保系统已安装Python、PyTorch和gym库。
- 运行代码:在命令行中执行
python main.py
命令,启动智能体训练,训练过程会显示奖励得分。 - 测试模型:主程序训练结束后,使用
python main.py --test
命令测试训练好的模型在MountainCar任务中的表现。 - 结果分析:查看训练过程的奖励得分曲线图以及测试时的各项奖励得分,评估模型性能。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】