项目简介
本项目旨在构建一个基于深度学习的图书问答系统,借助参与Kaggle竞赛获取数据来训练模型,实现对图书相关问题的自动回答。项目运用了LLaMA模型和LoRA技术,结合Kaggle竞赛提供的数据集进行训练与优化。
项目的主要特性和功能
- 数据预处理:对原始数据集进行预处理和格式化,为模型训练做准备。
- 模型训练:以LLaMA模型为基础,结合LoRA技术进行微调训练,适配图书问答任务。
- 指令跟随:模型可接收自然语言指令并生成对应回复。
- Web界面:提供Web界面,方便用户输入问题获取模型回复。
安装使用步骤
假设用户已经下载了本项目的源码文件。
1. 复制项目仓库并下载所需数据:
下载Kaggle竞赛数据集,并将lora - alpaca
文件夹中的内容移动到alpaca - lora/
目录下。
2. 安装项目所需的环境和依赖:
bash
cd alpaca-lora
conda activate llama
conda create --name llama python=3.9
conda install cudatoolkit
pip install -r requirements.txt
pip install scipy
3. 运行数据预处理脚本:
bash
cd deep_learning_HW3/
python train_set_process.py
python test_set_process.py
将生成的data.json
和answr.json
文件分别移动到alpaca - lora/train_data/
和alpaca - lora/
目录下。
4. 运行模型训练脚本:
bash
cd alpaca-lora/
bash train.sh
5. 运行生成回复的脚本或Web界面:
bash
python generate.py --load_8bit --base_model 'decapoda-research/llama-7b-hf' --lora_weights './lora-alpaca'
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】