项目简介
本项目基于Python和PyTorch框架,结合YOLOv5实例分割和PP-LCNet表格方向分类,打造出一个高效的表格检测与方向分类系统。它能自动识别图像中的表格区域并判断表格方向,适用于多种文档处理场景。
项目的主要特性和功能
- 运用YOLOv5最新版本(v7.0)进行实时实例分割,高效检测图像表格区域。
- 采用PP-LCNet模型进行表格方向分类,准确判断表格方向。
- 提供数据预处理脚本,包含图像边缘补零、数据集生成等,保障数据质量。
- 支持YOLOv5模型的训练,并能将其转换为Paddle模型,方便后续部署使用。
- 提供模型评估方法,探讨多种优化策略,如模型调优、超参数调整等。
安装使用步骤
环境配置
- 安装Python 3.x。
- 安装PyTorch及相关依赖库。
- 下载并配置YOLOv5和PP-LCNet的预训练模型。
数据预处理
- 运行
segment/data_process.py
中的paddle2yolo()
方法,生成训练数据集。 - 确保数据集路径正确配置。
模型训练
- 运行
python segment/train.py
进行YOLOv5模型的训练。 - 训练完成后,模型文件将保存在
runs
目录下。
模型转换
- 运行
python export-seg.py
将YOLOv5模型转换为Paddle模型。 - 生成的Paddle模型文件将保存在
best-seg_paddle_model
目录下。
表格方向分类训练
- 下载训练数据集并解压。
- 修改
PPLCNet/code/configs/config_base.py
中的数据集路径。 - 运行
python train_base.py
进行PP-LCNet模型的训练。
模型提交
- 进入
submit_files
目录,运行zip -r submit_yolov5seg.zip ./
打包所有文件进行提交。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】