目标检测YOLOv5笔记 (1)
YOLOv5虽然貌似没有得到作者的认同,网络结构上创新似乎也不多,网上对其是否配上这个名称更是一直有非议,但我们在一些应用场景中测试YOLOv5的检测效果,比起V3,V4还是有推理速度更快,检测框更贴合目标的特点。
而且YOLOv5还在继续迭代,所以还是有学习意义的。
网络由四个主要部分组成:
- Input 输入层需要对图形进行处理,在训练时需要对数据集计算初始设定长宽的锚框。
- Backbone 在不同图像细粒度上聚合并形成图像特征的卷积神经网络。
- Neck 一系列混合和组合图像特征的网络层,并将图像特征传递到预测层。
- Output 对图像特征进行预测,生成边界框和并预测类别。
对于YOLOV5,无论是s,m,l还是x 这四部分都是一致。唯一的区别在与模型的深度和宽度设置。