littlebot
Published on 2025-04-10 / 15 Visits
0

【源码】基于Regularized Nash Dynamics的军棋AI

项目简介

本项目是基于Regularized Nash Dynamics(R - NaD)算法开发的军棋AI。R - NaD算法融合了策略迭代和优势分布的思想,借助内在奖励和优势分布函数,在策略迭代时更新策略以获得最优策略。此AI能在4x2或10x2的迷你军棋环境里与随机玩家对战,胜率约达82%。

项目的主要特性和功能

  1. R - NaD算法实现:实现R - NaD算法来求解军棋游戏的策略问题。
  2. 游戏环境搭建:基于OpenSpiel框架搭建军棋游戏环境,支持不同大小棋盘和多种棋子类型。
  3. 神经网络模型:利用神经网络处理游戏状态,生成策略、价值函数和优势函数。
  4. 训练与评估:提供训练脚本和评估函数,可在命令行环境运行R - NaD算法并评估性能。
  5. 结果可视化:提供绘制损失曲线图的工具,便于用户了解模型训练过程中的性能变化。

安装使用步骤

环境准备

  • 安装Ubuntu 22.04或20.04操作系统。
  • 安装必要的依赖项: bash pip install open - spiel - junqi==1.4.2 jax dm - haiku

代码复制

bash cd RNaD - JunQi

环境配置

  • 进入game文件夹,运行copy.sh替换文件: bash cd game sh copy.sh
  • (可选)检查机器CPU数量,根据机器CPU数量调整config.py中的_NUM_ACTORS变量: bash lscpu

开始训练

bash sh train.sh

评估与测试

使用提供的测试脚本评估训练好的模型性能。

注意:该项目可能需要一定的计算资源,特别是GPU资源,以进行神经网络的训练。

下载地址

点击下载 【提取码: 4003】【解压密码: www.makuang.net】