项目简介
笔声语音识别系统(ASR)是为企业提供高性价比语音识别服务的解决方案。该系统支持实时语音识别、录音文件识别、语音合成和声纹识别等多种功能,适用于录音质检、会议实时转写、同声传译、语音输入法和直播监管等多个场景。
项目的主要特性和功能
实时语音识别
- 对实时音频流进行识别,实现“边说边出文字”效果,可用于语音输入、电话机器人、同声传译等实时音频流场景。
录音文件识别
- 对录音文件进行识别,适用于字幕生成、录音资料转写、视频监管等场景。
语音合成
- 支持多种声音效果,包括男女声、中英文、粤语、闽南语等,适用于小说、客服、导航、通知等多种应用场景。
声纹识别
- 通过提取用户注册的声纹文件,可快速搜索定位用户在海量语音库中的声纹标签,还能配合ASR实现多人语音分离等功能。
安装使用步骤
前提条件
- 已下载本项目的源码文件。
- 安装Java和Python的运行环境。
步骤
- 配置环境变量:设置Java和Python的环境变量,确保系统能够识别并使用这些工具。
- 导入项目:使用IDE(如IntelliJ IDEA或Eclipse)导入Java项目;使用Python IDE(如PyCharm)导入Python项目。
- 配置应用ID和密钥:在Java项目中,找到
Cons.java
文件,配置APP_ID
和APP_SECRETE
;在Python项目中,配置app_id
和app_secret
。 - 运行Demo:在Java项目中,运行
ASRDemo.java
或VoiceDemo.java
以测试语音识别和声纹识别功能;在Python项目中,运行demo_asr_long_offline.py
以测试长语音离线下识别功能。 - 启动Spring Boot应用:在Java项目中,运行
SpringDemoApplication.java
以启动Spring Boot应用,测试语音合成和实时语音识别功能。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】