项目简介
本项目是基于Python和PyQt5框架构建的NLP(自然语言处理)工具集,涵盖语料标注工具、TensorFlow 2模型转换工具以及Excel辅助工具。其中语料标注工具功能成熟,具备详细的标注功能与使用教程,适用于NLP领域的语料处理任务。
项目的主要特性和功能
语料标注工具
- 支持对文本文件进行标注,有多种标签和颜色可供选择。
- 支持正则表达式匹配,能自动为匹配文本打标签。
- 具备快捷键标注、隐名替换、导出标注结果等功能。
- 支持标注结果的编辑和撤回操作。
- 提供日志输出,记录标注过程操作。
模型转换工具
支持将TensorFlow 2模型转换为其他格式,如ONNX。
Excel辅助工具
提供Excel文件的读取、处理和生成功能。
安装使用步骤
环境准备
确保已安装Python 3.x环境。
安装依赖
bash
pip install -r requirements.txt
启动工具
使用Python解释器启动
bash
python main.py
使用可执行文件启动(Windows)
bash
<your folder>/corpuser/dist/v1/nlp_tools.exe
使用语料标注工具
- 将要标注的文本文件拖拽至工具的数据目录输入框。
- 设置导出目录,标注结果将保存到指定文件夹。
- 使用标签、颜色和快捷键进行标注,支持正则表达式匹配。
- 标注完成后,导出标注结果。
模型转换和Excel处理
根据项目提供的教程,使用模型转换工具和Excel辅助工具进行相关操作。
注意事项
- 工具目前仅支持
.txt
格式的文本文件。 - 标注时请确保标签和颜色的唯一性,避免重复设置。
- 导出目录需提前创建,工具不会自动生成文件夹。
- 使用正则表达式时,确保正则表达式与标签匹配,否则无法正确标注。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】