概述
面向低光照工业表面缺陷分析场景,构建由 YOLO11n 缺陷检测与 Qwen2.5-VL-7B-Instruct 视觉语言模型组成的轻量级多模态分析流程,通过复合不确定性评分将检测置信度、缺陷区域信息转化为动态视觉提示,提升低光缺陷结构化报告的准确性与一致性。
Bruce Zhao BZ Lab research / completed
Uncertainty-Aware Vision Prompting for Low-Light Surface Defect Multimodal Analysis

面向低光照工业表面缺陷分析场景,构建由 YOLO11n 缺陷检测与 Qwen2.5-VL-7B-Instruct 视觉语言模型组成的轻量级多模态分析流程,通过复合不确定性评分将检测置信度、缺陷区域信息转化为动态视觉提示,提升低光缺陷结构化报告的准确性与一致性。