项目简介
本项目基于Spring Boot框架构建,借助讯飞语音SDK实现文字转语音(TTS)和语音识别(ASR)功能。系统不仅支持批量处理文本转语音任务,还提供了用户友好的图形界面,方便用户进行配置和操作。
项目的主要特性和功能
- 文字转语音(TTS)
- 可将输入文本转换为语音并播放。
- 能设置多种语音参数,如发音人、语速、音量等。
- 支持多线程并发批量处理文本转语音任务。
- 语音识别(ASR)
- 支持实时语音识别,将语音转换为文本。
- 提供多种识别参数设置,如引擎类型、采样率等。
- 支持多线程并发批量处理语音识别任务。
- 图形用户界面(GUI)
- 提供直观界面,便于用户配置和操作语音合成与识别。
- 具备多种功能按钮,如开始识别、停止识别、上传语法文件等。
- 音频文件处理
- 支持PCM格式和MP3格式的音频文件转换。
- 提供音频文件的缩放和分割工具。
安装使用步骤
环境准备
- 确保已安装Java开发环境(JDK 8或更高版本)。
- 确保已安装Maven构建工具。
导入项目
使用IDE(如IntelliJ IDEA或Eclipse)导入下载的项目源码。
配置讯飞SDK
在src/main/resources
目录下创建配置文件,配置讯飞语音SDK的AppID、SecretKey等参数。
运行项目
- 在IDE中运行
DemoApplication.java
文件,启动Spring Boot应用。 - 打开浏览器,访问
http://localhost:8080
,进入图形用户界面。
使用功能
- 在图形界面中,选择相应的功能按钮进行语音合成或语音识别操作。
- 根据需要配置语音参数,如发音人、语速、音量等。
- 上传音频文件或输入文本,开始语音合成或识别任务。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】