项目简介
本项目是用于评估对话管理系统性能的Python工具,支持多种对话管理系统分析,涵盖基于规则的对话管理系统(DAMD)和基于端到端模型(如GPT - 2)的对话代理(SimpleTod)。通过构建模拟对话、计算性能指标以及生成详细报告,为研究人员和开发者评估对话系统性能提供有效手段。
项目的主要特性和功能
- 模拟对话生成:可生成模拟对话,调用对话系统响应函数模拟用户与系统交互。
- 性能指标计算:收集对话数据,计算成功率、精确度、召回率和F1分数等多个性能指标评估对话系统性能。
- 报告生成:生成包含对话系统性能指标的详细报告,以HTML格式保存,方便用户查看分析。
- 多系统支持:支持对基于规则的DAMD和基于GPT - 2的SimpleTod等不同类型对话管理系统进行评估。
安装使用步骤
环境准备
- 确保已安装Python环境,推荐使用Python 3.7。
- 安装必要的库,如PyTorch(用于DAMD模型)和Transformers(用于GPT - 2模型),使用以下命令安装:
bash pip install -r requirements.txt
数据准备
- 下载并提供对话管理系统的数据,包括词汇表、数据库和预训练模型,从百度盘下载:链接: https://pan.baidu.com/s/13vIXu59iT5SdSKVFyAzqrw 提取码: 9d22
- 解压后,确保数据和模型文件位于项目根目录下。
运行代码
运行提供的Python脚本,如eval/damd.py
、eval/simpletod.py
等,按提示设置数据路径和模型路径,示例如下:
bash
python eval/damd.py
python eval/simpletod.py
分析报告
根据生成的报告分析对话系统性能,依据性能指标进行调优和改进。报告以HTML格式保存,可在浏览器中打开查看。
注意:以上步骤基于用户已下载本项目源码文件,且具备运行Python代码和安装相关库的能力。实际使用时,用户可能需根据情况调整安装步骤和代码设置。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】