littlebot
Published on 2025-04-09 / 2 Visits
0

【源码】基于PythonPyQt5框架的NLP语料标注工具

项目简介

本项目是基于Python和PyQt5框架构建的NLP(自然语言处理)工具集,涵盖语料标注工具、TensorFlow 2模型转换工具以及Excel辅助工具。其中语料标注工具功能成熟,具备详细的标注功能与使用教程,适用于NLP领域的语料处理任务。

项目的主要特性和功能

语料标注工具

  • 支持对文本文件进行标注,有多种标签和颜色可供选择。
  • 支持正则表达式匹配,能自动为匹配文本打标签。
  • 具备快捷键标注、隐名替换、导出标注结果等功能。
  • 支持标注结果的编辑和撤回操作。
  • 提供日志输出,记录标注过程操作。

模型转换工具

支持将TensorFlow 2模型转换为其他格式,如ONNX。

Excel辅助工具

提供Excel文件的读取、处理和生成功能。

安装使用步骤

环境准备

确保已安装Python 3.x环境。

安装依赖

bash pip install -r requirements.txt

启动工具

使用Python解释器启动

bash python main.py

使用可执行文件启动(Windows)

bash <your folder>/corpuser/dist/v1/nlp_tools.exe

使用语料标注工具

  • 将要标注的文本文件拖拽至工具的数据目录输入框。
  • 设置导出目录,标注结果将保存到指定文件夹。
  • 使用标签、颜色和快捷键进行标注,支持正则表达式匹配。
  • 标注完成后,导出标注结果。

模型转换和Excel处理

根据项目提供的教程,使用模型转换工具和Excel辅助工具进行相关操作。

注意事项

  • 工具目前仅支持.txt格式的文本文件。
  • 标注时请确保标签和颜色的唯一性,避免重复设置。
  • 导出目录需提前创建,工具不会自动生成文件夹。
  • 使用正则表达式时,确保正则表达式与标签匹配,否则无法正确标注。

下载地址

点击下载 【提取码: 4003】【解压密码: www.makuang.net】