返回项目列表

research / completed

UAVP

Uncertainty-Aware Vision Prompting for Low-Light Surface Defect Multimodal Analysis

概述

面向低光照工业表面缺陷分析场景,构建由 YOLO11n 缺陷检测与 Qwen2.5-VL-7B-Instruct 视觉语言模型组成的轻量级多模态分析流程,通过复合不确定性评分将检测置信度、缺陷区域信息转化为动态视觉提示,提升低光缺陷结构化报告的准确性与一致性。

核心特性

  • 低光表面缺陷多模态分析
  • YOLO11n 缺陷定位与类别识别
  • 复合不确定性评分 CUS
  • 不确定性感知动态提示词构建
  • 结构化 JSON 缺陷报告生成

个人贡献

  • 设计 YOLO 检测结果到 VLM 分析报告的端到端工程流程
  • 构建 CUS 评分机制,将检测置信度与缺陷面积占比转化为语言级提示约束
  • 完成 Baseline、BBox Prompt 与 UAVP 的对比实验和结构化评估