项目简介
本项目借助深度强化学习算法(DDPG和DQN)来训练智能体,主要用于解决连续动作空间的强化学习任务。利用Unity环境模拟一个具有两个关节的机械臂,让智能体学习控制机械臂,使其尽可能长时间地保持在目标位置。通过调整参数和环境设置,该项目可应用于不同任务和环境。
项目的主要特性和功能
- 深度强化学习算法:实现了DDPG(Deep Deterministic Policy Gradient)和DQN(Deep Q-Network)两种算法,分别适用于连续和离散动作空间的强化学习任务。
- Unity环境模拟:运用Unity环境模拟机械臂控制任务,智能体与环境交互学习最优策略。
- 参数调整:用户可通过
parameters.py
和train_agent_dqn.py
文件灵活调整训练参数,满足不同任务需求。 - 训练与监控:提供
train_agent.py
和train_agent_dqn.py
训练脚本,方便用户训练智能体并监控训练表现。 - 结果可视化:训练结果和智能体表现可通过生成的图像和GIF文件可视化,便于分析评估。
安装使用步骤
1. 创建Python环境
首先,创建一个Python 3.6的环境,并激活该环境:
bash
conda create --name reacherproject python=3.6
conda activate reacherproject
2. 复制项目并安装依赖
复制项目仓库并安装所需的依赖包:
bash
cd ReacherProject
pip install -r requirements.txt
conda install pytorch=0.4.1 cuda92 -c pytorch
3. 下载Unity环境
根据操作系统下载对应的Unity环境文件: - Version 1: One (1) Agent(训练) - Linux: 下载链接 - Mac OSX: 下载链接 - Windows (32-bit): 下载链接 - Windows (64-bit): 下载链接 - Version 2: Twenty (20) Agents(推荐) - Linux: 下载链接 - Mac OSX: 下载链接 - Windows (32-bit): 下载链接 - Windows (64-bit): 下载链接
4. 训练智能体
使用以下命令训练智能体:
- 使用DDPG算法训练:
bash
python train_agent.py
- 使用DQN算法训练:
bash
python train_agent_dqn.py
5. 查看训练结果
训练完成后,权重和训练结果将保存在output/
目录中,用户可以通过生成的图像和GIF文件查看智能体的表现。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】