项目简介
本项目致力于研究并实现一个基于大语言模型的金融财报数据查询系统。借助自然语言处理技术,用户无需掌握复杂的 SQL 语法,就能使用自然语言对金融数据库进行查询。同时,项目构建了金融财报领域的基准测试数据集,设计多种改进的 Prompt 方法,大幅提高查询准确性。
项目的主要特性和功能
- 自然语言查询:用户输入自然语言即可查询金融数据库,系统自动转换为 SQL 语句。
- 多类型查询支持:涵盖单步查询、多步查询、多表查询、表操作和模糊查询等多种类型。
- 改进的 Prompt 方法:运用上下文提示、少量示例学习和思维链提示等,提升查询准确性。
- 基准测试数据集:构建的数据集覆盖 2022 年所有 A 股上市公司的资产负债表、利润表和现金流量表。
- 性能评估:提供评估文件,可评估模型性能并保存结果。
安装使用步骤
- 项目源码文件已下载。
- 配置环境:依据
config.py
文件中的配置信息,设置数据库连接信息和模型参数。 - 数据加载:运行
dataloader.py
或dataloader_for_structgpt_for_text2sql.py
,将源数据加载并转换为模型所需格式。 - 运行系统:执行
main.py
文件,启动系统。 - 输入查询:按系统提示输入自然语言查询。
- 获取结果:系统自动将查询转换为 SQL 语句并执行,返回查询结果。
- 评估性能:运行
evaluate.py
文件,评估模型性能并查看结果。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】