项目简介
本项目是基于Python和PyTorch框架构建的自然语言处理(NLP)系统,聚焦于实现检索增强生成(RAG)功能。借助预训练模型、向量数据库和大型语言模型(LLM),系统可高效检索并生成自然语言回答,提供智能问答服务。
项目的主要特性和功能
- 支持对预训练模型(如OPT - 1.3b)进行量化,并在量化后的模型上开展推理。
- 利用本地知识图谱和向量数据库进行文档检索,支持OpenAI、智谱AI等多种嵌入模型。
- 通过LangChain框架把检索到的文档内容嵌入对话,生成智能回答。
- 提供基于Gradio的Web界面,用户能通过浏览器与系统交互。
安装使用步骤
安装步骤
- 将项目复制到本地或服务器。
- 在项目根目录下运行以下命令安装依赖:
bash pip install -r requirements.txt
- 将模型文件放置在指定目录(如
RyzenAI - SW/example/transformers/models/opt/
)。 - 进入
src
目录,运行测试脚本:bash cd RyzenAI_RAG/src python test.py --task RAG --target aie --model_name opt - 1.3b
- 测试完成后,打开浏览器并访问
http://127.0.0.1:7860
,通过Web界面与系统交互。
运行主系统
- 运行
RAG.py
脚本以启动RAG系统:bash python RAG.py
- 通过
webui.py
脚本启动Web界面:bash python webui.py
注意事项
- 使用OpenAI或其他嵌入模型时,需提供相应的API密钥。
- 量化模型和推理过程对硬件有一定要求,建议在具备GPU的环境下运行。
- 处理敏感数据时,请确保遵守相关隐私和安全规定。
许可证
本项目采用开源许可证,具体信息请参考LICENSE
文件。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】