项目简介
本项目是基于TensorFlow的中文短文本分类系统,借助字符级CNN和RNN模型对中文短文本分类。实现了从数据预处理、模型训练、评估到预测的全流程,还提供Web API接口,便于集成到其他系统。
项目的主要特性和功能
- 数据预处理:涵盖读取文件数据、构建词汇表、将文本转换为ID序列等操作。
- 模型训练:采用字符级CNN模型训练,支持命令行调用进行训练与测试。
- 模型评估:在测试集上评估模型,保证准确性与稳定性。
- 模型预测:提供预测脚本,方便对新文本分类预测。
- 模型固化:可将训练好的模型固化为独立pb文件,便于生产环境部署。
- Web API:利用Flask框架搭建微型Web API,通过HTTP请求实现文本分类。
安装使用步骤
假设用户已下载本项目的源码文件,以下是使用步骤:
1. 复制项目:
bash
cd TextClassification
2. 安装依赖:
bash
pip install -r requirements.txt
3. 数据预处理:
- 将数据集放于指定目录。
- 运行预处理脚本:
bash
python data_load/load.py
4. 模型训练:
bash
python run_cnn.py train
5. 模型测试:
bash
python run_cnn.py test
6. 模型预测:
bash
python predict.py --text "你的短文本内容"
7. 模型固化:
bash
python frozen.py
8. 启动Web API:
bash
python web_test.py
访问 http://localhost:5000
进行文本分类。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】