项目简介
本项目是用于戏曲音频处理的Python脚本集合,涵盖音频获取、格式转换、去除静音、切割片段、人声和伴奏分离等步骤。借助Spleeter工具进行人声和伴奏分离,提供自动化处理流程,方便快速处理戏曲音频数据。
项目的主要特性和功能
- 音频格式转换:可将非wav格式音频文件转为wav格式,便于后续处理。
- 去除静音:运用ffmpeg工具或Python自定义函数去除音频中的静音部分。
- 音频切割:把音频切割成固定长度片段,用于后续分析和建模。
- 人声和伴奏分离:利用Spleeter工具进行音频的人声和伴奏分离,支持2、4和5轨道分离。
- 可视化:提供波形图、频谱图和光谱图的绘制功能,用于音频信号的分析和展示。
安装使用步骤
环境准备
- 安装Anaconda并创建Python 3.7版本的虚拟环境。
- 激活虚拟环境,安装
librosa
、soundfile
、numpy
、scipy
、matplotlib
等必要依赖包。 - 安装ffmpeg工具并将其加入环境变量。
数据获取
从百度网盘下载戏曲音频数据,并进行命名规范化。
音频处理
- 格式转换:使用
Adapter/converter.py
将音频格式转换为wav格式。 - 去除静音:使用
Mute_remove/removeMute.py
去除音频中的静音部分。 - 音频切割:使用
Spliter/cut_audio.py
将音频切割成固定长度的片段。 - 人声和伴奏分离:使用Spleeter工具进行音频的人声和伴奏分离,使用
Spleeter/separate.py
进行分离操作。
结果查看
通过提供的可视化脚本查看音频信号的可视化结果。
注意事项
- 确保安装了Anaconda和ffmpeg工具,并正确设置环境变量。
- 处理前保证音频文件是有效的wav格式且命名规范。
- 按项目处理流程执行操作,注意参数设置和文件路径的正确性。
- 根据需要查看和保存波形图、频谱图和光谱图。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】