项目简介
这是一个基于Python的智能家庭助手系统,具备本地化语音识别、文本转语音和自然语言理解等功能,还计划添加多种个性化功能,能为用户提供高度定制化的智能家庭助手服务。
项目的主要特性和功能
- 本地化语音识别(ASR):支持自定义离线唤醒词,增强隐私保护。
- 本地化文本转语音(TTS):计划训练个人声音合成器,实现个性化语音输出。
- 本地化自然语言理解(NLU):计划接入本地化NLU服务以提升响应速度和隐私保护,已接入ChatGLM2提供高效本地聊天服务。
- 个性化功能:计划实现声纹识别以区分不同说话对象,还计划实现更优雅的天气播报、定时任务以及赛事播报等个性化任务。
安装使用步骤
环境准备
确保本地服务器具备足够的性能(推荐13900KF + 4090),安装Python 3.x,并确保pip可用。
安装依赖
使用pip安装必要的Python库:
shell
pip install espnet vits-simple-api chatglm2-6B
配置服务
无详细配置信息,可根据后续需求进行补充。
启动服务
- 启动vits - simple - api服务:
shell python vits-simple-api/run.py
- 启动espnet服务:
shell python espnet/run.py
- 启动ChatGLM2服务:
shell python ChatGLM2-6B/open_api.py
测试与使用
通过麦克风与系统进行语音交互,测试语音识别、文本转语音和聊天功能。根据需要调整配置和模型,优化系统性能。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】