项目简介
本项目是基于Python和TensorFlow框架构建的文本检测模型,用于识别和定位图像中的文本区域。
项目的主要特性和功能
- 使用CTPN进行文本检测,可识别和定位图像中的文本区域。
- 对输入图像进行预处理,通过缩放、裁剪等操作使其适应模型输入要求。
- 提供模型训练与测试的基本框架和工具。
- 能将单个的文本区域组合成文本行,提供更完整和有意义的检测结果。
- 具备简单的可视化工具,可展示检测结果。
安装使用步骤
环境配置
- 创建环境:
sh conda create --name python3 python=3.7 conda activate python3
- 升级pip并设置源:
sh python -m pip install -i https://mirrors.huaweicloud.com/repository/pypi/simple pip --upgrade pip config set global.index-url https://mirrors.huaweicloud.com/repository/pypi/simple
- 安装依赖:
sh pip install opencv-python tensorflow-gpu==1.13.1 numpy Cython flask requests
- 编译bbox和nms工具:
- Linux:
sh cd utils/bbox chmod +x make.sh ./make.sh
- Windows:
bat cd utils/bbox make.bat
配置模型
从百度云盘下载ckpt文件,解压后将checkpoints_mlt/
放到源码根目录下。
运行demo
- 普通demo:
sh python demo/demo.py
- web demo:
sh python main/web.py --host=0.0.0.0 --port=20000 --homeDir=./tmp/ --ctpnDebug=True
开发
```python from main.ctpn import CTPN
ctpn = CTPN() ctpn.addWorker('demo/img/001.jpg') ctpn.start() ```
参考
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】