跳过正文
Owen

A blog by

Owen

计算机视觉 · 深度学习

试试关灯,星河更明

ABOUT

聚焦于基于深度学习的二维与三维视觉,包括分割、检测、追踪与三维重建,后续会涉及多模态与 World Model。研究兴趣集中在模型内部算法与结构。

LATEST
  1. 01 · 2d-vision
    ResNet详解——残差结构的思考

    当“深度瓶颈”的难题摆在世人面前,ResNet如何通过残差解决这一问题,残差结构在深度学习领域到底有多重要?

  2. 02 · multimodal
    如何使用Google Colab进行视觉-语言模型微调

    零基础实现VLM模型的微调demo

  3. 03 · 2d-vision
    详解 RF-DETR

    作为2025年实时检测的 SOTA,RF-DETR是如何做到的?

  4. 04 · 2d-vision
    详解 RT-DETR

    从原理上分析RT-DETR的结构特点,以及简短的使用说明

  5. 05 · notes
    YOLO的前世今生(下)

    系列完结篇,介绍了Ultralytic时代YOLOv8到YOLO26的发展

好友 Anawaert 的博客