项目简介
本项目使用TensorFlow 2.3.1构建了一个CRNN(卷积循环神经网络)+CTC(连接时序分类)的文字识别模型,可识别图像中的不定长文字。该模型支持多种网络结构(如ResNet18或VGGNet),还能通过TensorFlow内嵌的TensorRT进行加速。
项目的主要特性和功能
- 不定长文字训练和识别
- TensorFlow内嵌TensorRT加速
- 批量数据文字识别(待更新)
安装使用步骤
假设用户已经下载了本项目的源码文件:
1. 配置参数:在config.py
文件中设置项目的路径、训练/测试标注文件路径、图片根目录、模型保存路径等。
2. 准备数据:确保数据格式正确,即图片路径和标签内容。
3. 训练模型:运行main.py
,选择--type train
进行模型训练。
4. 测试模型:运行main.py
,选择--type test
进行模型测试。
5. 模型演示:运行main.py
,选择--model_file
指定模型文件路径,以及--img_path
指定图片路径进行模型演示。
6. 使用预训练模型:可以直接下载已训练好的中文通用文字识别模型,修改demo.py
中的模型路径,即可使用该模型进行文字识别。
注意:请确保在使用模型前,数据格式、参数配置等符合项目要求,并检查系统环境是否支持TensorFlow和TensorRT。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】