V2.1 YOLO-World:实时探测开放词汇目标的最新技术
浏览次数:25次 发布时间:2025-03-07
YOLO-World 是下一代 YOLO 检测器,具有强大的开放词汇检测能力和定位能力。
YOLO-World 提出了一种先提示后检测的范式,用于高效的用户词汇推理,将词汇嵌入作为参数重新参数化到模型中,实现了更快的推理速度。您可以在我们的在线演示中尝试导出您自己的检测模型,无需额外训练或微调!
零样本评估预训练模型的结果:
以零样本的方式在 LVIS、LVIS-mini 和 COCO 上评估所有 YOLO-World-V2.1 模型,并与上一版本(改进之处用上标标注)进行比较
Model Card 模型卡片:
Notes: 备注:
PT: Pre-training, CPT: continuing pre-training
PT:预训练,CPT:持续预训练
CC-LiteV2: the newly-annotated CC3M subset, including 250k images.
CC-LiteV2:新标注的 CC3M 子集,包括 250k 张图片。
微调 YOLO-World:
YOLO-World 支持零样本推理,并支持三种微调方案:(1)正常微调,(2)提示微调,和(3)重新参数化微调。
三种微调方式,项目中有详细文档说明。参照执行即可。
模型位置:
演示:
YOLO-World V2.1 发布: 包含新的预训练权重和图像提示的训练代码。
YOLO-World V2.1下载地址:https://github.com/AILab-CVC/YOLO-World