littlebot

Published on 2025-04-10 / 74 Visits

0

【源码】基于Regularized Nash Dynamics的军棋AI

项目简介

本项目是基于Regularized Nash Dynamics（R - NaD）算法开发的军棋AI。R - NaD算法融合了策略迭代和优势分布的思想，借助内在奖励和优势分布函数，在策略迭代时更新策略以获得最优策略。此AI能在4x2或10x2的迷你军棋环境里与随机玩家对战，胜率约达82%。

项目的主要特性和功能

R - NaD算法实现：实现R - NaD算法来求解军棋游戏的策略问题。
游戏环境搭建：基于OpenSpiel框架搭建军棋游戏环境，支持不同大小棋盘和多种棋子类型。
神经网络模型：利用神经网络处理游戏状态，生成策略、价值函数和优势函数。
训练与评估：提供训练脚本和评估函数，可在命令行环境运行R - NaD算法并评估性能。
结果可视化：提供绘制损失曲线图的工具，便于用户了解模型训练过程中的性能变化。

安装使用步骤

环境准备

安装Ubuntu 22.04或20.04操作系统。
安装必要的依赖项： bash pip install open - spiel - junqi==1.4.2 jax dm - haiku

代码复制

bash cd RNaD - JunQi

环境配置

进入game文件夹，运行copy.sh替换文件： bash cd game sh copy.sh
（可选）检查机器CPU数量，根据机器CPU数量调整config.py中的_NUM_ACTORS变量： bash lscpu

开始训练

bash sh train.sh

评估与测试

使用提供的测试脚本评估训练好的模型性能。

注意：该项目可能需要一定的计算资源，特别是GPU资源，以进行神经网络的训练。

下载地址

点击下载 【提取码: 4003】【解压密码: www.makuang.net】