项目简介
本项目基于Python实现了一个德州扑克AI系统,借助深度强化学习算法(尤其是Double DQN算法)在德州扑克游戏环境中开展决策与学习。系统运用蒙特卡洛模拟和精确计算来估算手牌胜率,同时通过训练强化学习模型优化机器人的决策策略。
项目的主要特性和功能
- 采用Double DQN强化学习算法,通过与环境交互优化机器人决策策略。
- 利用蒙特卡洛模拟和精确计算估算给定手牌胜率,助力机器人做出更优决策。
- 定义了德州扑克游戏环境,涵盖手牌、桌面牌和玩家动作等。
- 支持用户配置超参数,如学习率、记忆大小、动作空间等,以调整模型训练过程。
- 提供训练和测试两种模式,用户可按需选择使用预训练模型或训练新模型。
- 直接运行
truth_holdem.py
,能在终端进行德州扑克游戏测试,观察机器人决策过程。
安装使用步骤
- 确保已安装Python以及numpy、tensorflow、gym等相关库。
- 在终端或Python解释器中运行
truth_holdem.py
文件,按提示输入动作,观察机器人决策过程。 - 若要修改游戏回合次数,可在
truth_holdem.py
文件中修改steps
变量。 - 若需训练新模型,运行
run_holdem.py
文件进行强化学习算法训练。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】