2021年3月

目标检测YOLOv5笔记 (1)

YOLOv5虽然貌似没有得到作者的认同,网络结构上创新似乎也不多,网上对其是否配上这个名称更是一直有非议,但我们在一些应用场景中测试YOLOv5的检测效果,比起V3,V4还是有推理速度更快,检测框更贴合目标的特点。
而且YOLOv5还在继续迭代,所以还是有学习意义的。

网络由四个主要部分组成:

  1. Input 输入层需要对图形进行处理,在训练时需要对数据集计算初始设定长宽的锚框。
  2. Backbone 在不同图像细粒度上聚合并形成图像特征的卷积神经网络。
  3. Neck 一系列混合和组合图像特征的网络层,并将图像特征传递到预测层。
  4. Output 对图像特征进行预测,生成边界框和并预测类别。

对于YOLOV5,无论是s,m,l还是x 这四部分都是一致。唯一的区别在与模型的深度和宽度设置。

- 阅读剩余部分 -