项目简介
本项目专注于图像问答领域,借助LLaVA大语言模型初步创建伪标签,并利用labelme工具对伪标签进行调整。旨在提高模型对图像的理解能力,为开发者提供高效创建和调整模型训练数据的工具,从而提升模型训练效果。
项目的主要特性和功能
- 伪标签创建:基于LLaVA大语言模型,导入图像和问题文本,生成对应答案作为伪标签。
- 标签调整:使用labelme工具,用户可手动调整初步生成的伪标签,提升标签准确性与质量。
- 数据格式支持:支持JSONL等常见数据格式的输入与输出,便于和其他数据处理工具集成。
- 操作简便:通过简单的命令行操作,即可完成伪标签的创建与调整。
安装使用步骤
假设用户已下载本项目的源码文件,可按以下步骤操作:
1. 安装必要的库和环境:安装Python以及相关库(如Pillow、json等)。
2. 下载模型和工具:依照项目提供的链接,下载LLaVA模型和labelme工具。
3. 生成问题集:运行python generate_q.py
生成对应的问题集文件。
4. 创建伪标签:运行python model_vqa1.py --model-path./checkpoints/LLaVA-13B-v0 --question-file playground/data/coco2014_val_qa_eval/qa90_questions.jsonl --image-folder /path/to/coco2014_val --answers-file /path/to/answer-file-our.jsonl
,利用LLaVA模型生成初步的伪标签。
5. 调整标签格式:运行python label.py
,将初步生成的伪标签转换为labelme可接受的格式。
6. 手动调整标签:使用labelme path/to/images --output path/to/output --flags xxx.txt --nodata
命令,通过labelme工具手动调整伪标签。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】