littlebot
Published on 2025-04-09 / 4 Visits
0

【源码】基于Python和LLaVA大语言模型的伪标签创建与调整系统

项目简介

本项目专注于图像问答领域,借助LLaVA大语言模型初步创建伪标签,并利用labelme工具对伪标签进行调整。旨在提高模型对图像的理解能力,为开发者提供高效创建和调整模型训练数据的工具,从而提升模型训练效果。

项目的主要特性和功能

  1. 伪标签创建:基于LLaVA大语言模型,导入图像和问题文本,生成对应答案作为伪标签。
  2. 标签调整:使用labelme工具,用户可手动调整初步生成的伪标签,提升标签准确性与质量。
  3. 数据格式支持:支持JSONL等常见数据格式的输入与输出,便于和其他数据处理工具集成。
  4. 操作简便:通过简单的命令行操作,即可完成伪标签的创建与调整。

安装使用步骤

假设用户已下载本项目的源码文件,可按以下步骤操作: 1. 安装必要的库和环境:安装Python以及相关库(如Pillow、json等)。 2. 下载模型和工具:依照项目提供的链接,下载LLaVA模型和labelme工具。 3. 生成问题集:运行python generate_q.py生成对应的问题集文件。 4. 创建伪标签:运行python model_vqa1.py --model-path./checkpoints/LLaVA-13B-v0 --question-file playground/data/coco2014_val_qa_eval/qa90_questions.jsonl --image-folder /path/to/coco2014_val --answers-file /path/to/answer-file-our.jsonl,利用LLaVA模型生成初步的伪标签。 5. 调整标签格式:运行python label.py,将初步生成的伪标签转换为labelme可接受的格式。 6. 手动调整标签:使用labelme path/to/images --output path/to/output --flags xxx.txt --nodata命令,通过labelme工具手动调整伪标签。

下载地址

点击下载 【提取码: 4003】【解压密码: www.makuang.net】