A blog byOwen计算机视觉 · 深度学习☾ 试试关灯,星河更明 NSWE Vision · Geometry · LearningABOUT聚焦于基于深度学习的二维与三维视觉,包括分割、检测、追踪与三维重建,后续会涉及多模态与 World Model。研究兴趣集中在模型内部算法与结构。LATEST 01 2026年05月27日 · 2d-vision …ResNet详解——残差结构的思考当“深度瓶颈”的难题摆在世人面前,ResNet如何通过残差解决这一问题,残差结构在深度学习领域到底有多重要?→02 2026年05月23日 · multimodal …如何使用Google Colab进行视觉-语言模型微调零基础实现VLM模型的微调demo→03 2026年05月12日 · 2d-vision …详解 RF-DETR作为2025年实时检测的 SOTA,RF-DETR是如何做到的?→04 2026年05月11日 · 2d-vision …详解 RT-DETR从原理上分析RT-DETR的结构特点,以及简短的使用说明→05 2026年05月10日 · notes …YOLO的前世今生(下)系列完结篇,介绍了Ultralytic时代YOLOv8到YOLO26的发展→显示更多 →