项目简介
本项目是用于从技能等级赛题库PDF文件中导出题目的工具,可将题库导出为Excel或Word格式,便于在考试宝软件中导入使用。通过Python脚本实现,有灵活配置选项与多种解析方式,能满足不同场景需求。
项目的主要特性和功能
- PDF解析:支持用
pymupdf
(fitz
)和tika
两种库解析PDF文件,分别适用于带图片和不带图片的题库文件。 - 导出格式:支持将题库导出为Excel和Word格式,对应考试宝软件的两种导入模板。
- 灵活配置:可通过JSON配置文件自定义解析规则和导出选项,支持多种题型(单选、多选、判断、计算等)。
- 在线转换:提供在线转换服务,用户能通过网页上传PDF文件并获取导出结果。
- 题型处理:支持对题目进行过滤和格式化修正,保证导出结果准确。
安装使用步骤
1. 安装依赖
在项目根目录下运行以下命令安装所需的Python依赖:
bash
python -m pip install -r requirements.txt
2. 修改配置文件
- 打开
main.py
文件,找到TARGET_CONFIG
项,将其修改为config
文件夹下的配置文件名(不带.json
后缀)。 - 修改
OUTPUT_TYPE
项,选择导出文件的格式。目前支持以下两种格式: OutputExcel2KaoShiBao
:导出为Excel格式,解析准确但不支持图片。OutputWord2KaoShiBao
:导出为Word格式,支持图片但可能需要手动调整。
3. 运行脚本
在项目根目录下运行以下命令,开始导出题库:
bash
python main.py
导出的文件将保存在output
文件夹下,并以配置文件中title
项命名。
4. 在线使用
您也可以通过访问在线转换页面直接上传PDF文件并获取导出结果。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】