【源码】基于Python和LLaVA大语言模型的伪标签创建与调整系统

项目简介

本项目专注于图像问答领域，借助LLaVA大语言模型初步创建伪标签，并利用labelme工具对伪标签进行调整。旨在提高模型对图像的理解能力，为开发者提供高效创建和调整模型训练数据的工具，从而提升模型训练效果。

项目的主要特性和功能

伪标签创建：基于LLaVA大语言模型，导入图像和问题文本，生成对应答案作为伪标签。
标签调整：使用labelme工具，用户可手动调整初步生成的伪标签，提升标签准确性与质量。
数据格式支持：支持JSONL等常见数据格式的输入与输出，便于和其他数据处理工具集成。
操作简便：通过简单的命令行操作，即可完成伪标签的创建与调整。

安装使用步骤

假设用户已下载本项目的源码文件，可按以下步骤操作： 1. 安装必要的库和环境：安装Python以及相关库（如Pillow、json等）。 2. 下载模型和工具：依照项目提供的链接，下载LLaVA模型和labelme工具。 3. 生成问题集：运行python generate_q.py生成对应的问题集文件。 4. 创建伪标签：运行python model_vqa1.py --model-path./checkpoints/LLaVA-13B-v0 --question-file playground/data/coco2014_val_qa_eval/qa90_questions.jsonl --image-folder /path/to/coco2014_val --answers-file /path/to/answer-file-our.jsonl，利用LLaVA模型生成初步的伪标签。 5. 调整标签格式：运行python label.py，将初步生成的伪标签转换为labelme可接受的格式。 6. 手动调整标签：使用labelme path/to/images --output path/to/output --flags xxx.txt --nodata命令，通过labelme工具手动调整伪标签。

下载地址

点击下载 【提取码: 4003】【解压密码: www.makuang.net】

Menu

Share

【源码】基于Python和LLaVA大语言模型的伪标签创建与调整系统

项目简介

项目的主要特性和功能

安装使用步骤

下载地址

【源码】基于Python的猫眼电影票房数据分析系统

【源码】基于Python的云运动一键跑步脚本

【源码】基于ROS和MoveIt的双臂机器人控制系统

【源码】基于Node.js的B站动态抽奖自动化脚本

【源码】基于Spring Boot和Vue的苍穹外卖管理系统

【源码】基于Arduino的易经随机卦象生成器

【源码】基于ROS框架的UR5机器人视觉伺服仿真系统

【源码】基于Java的超星学习通PDF下载工具

【源码】基于思源笔记的插件开发示例

【源码】基于Arduino的智能花盆控制系统