【源码】基于PyTorch和TurboMind的本地LLM部署系统

项目简介

本项目是基于PyTorch和TurboMind构建的高效本地大语言模型（LLM）部署系统。借助lmdeploy工具，用户能够便捷地把Huggingface上的模型转换为TurboMind格式，并在本地实现高效的推理与对话。

确保环境中已安装所有必要的依赖库，通过以下命令安装主要依赖： bash pip install torch transformers lmdeploy

使用lmdeploy直接读取Huggingface模型权重进行在线转化： bash lmdeploy chat turbomind internlm/internlm-chat-20b-4bit --model-name internlm-chat-20b

先将模型转为lmdeploy TurboMind的格式： bash lmdeploy convert internlm2-chat-7b /path

通过命令行直接执行TurboMind进行本地对话： bash lmdeploy chat turbomind ./workspace

启动API服务并通过API进行交互： bash lmdeploy serve api_server ./workspace --server-name 0.0.0.0 --server-port ${server_port} --tp 1 详细内容请参考文档。

点击下载 【提取码: 4003】【解压密码: www.makuang.net】