项目简介
本项目是基于Regularized Nash Dynamics(R - NaD)算法开发的军棋AI。R - NaD算法融合了策略迭代和优势分布的思想,借助内在奖励和优势分布函数,在策略迭代时更新策略以获得最优策略。此AI能在4x2或10x2的迷你军棋环境里与随机玩家对战,胜率约达82%。
项目的主要特性和功能
- R - NaD算法实现:实现R - NaD算法来求解军棋游戏的策略问题。
- 游戏环境搭建:基于OpenSpiel框架搭建军棋游戏环境,支持不同大小棋盘和多种棋子类型。
- 神经网络模型:利用神经网络处理游戏状态,生成策略、价值函数和优势函数。
- 训练与评估:提供训练脚本和评估函数,可在命令行环境运行R - NaD算法并评估性能。
- 结果可视化:提供绘制损失曲线图的工具,便于用户了解模型训练过程中的性能变化。
安装使用步骤
环境准备
- 安装Ubuntu 22.04或20.04操作系统。
- 安装必要的依赖项:
bash pip install open - spiel - junqi==1.4.2 jax dm - haiku
代码复制
bash
cd RNaD - JunQi
环境配置
- 进入
game
文件夹,运行copy.sh
替换文件:bash cd game sh copy.sh
- (可选)检查机器CPU数量,根据机器CPU数量调整
config.py
中的_NUM_ACTORS
变量:bash lscpu
开始训练
bash
sh train.sh
评估与测试
使用提供的测试脚本评估训练好的模型性能。
注意:该项目可能需要一定的计算资源,特别是GPU资源,以进行神经网络的训练。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】