nex3z's blog | learn, build, evaluate

[Reading] YOLOv4: Optimal Speed and Accuracy of Object Detection

Author: nex3z 2021-06-27

YOLOv4: Optimal Speed and Accuracy of Object Detection (2020/4) 1. 概述文章的主要贡献有：提出了一种高效且强大的目标检测器，称为 YOLOv4。YOLOv4 兼顾速度和准确率（Figure 1），且只需单个 GPU 就可以训练。验证了各种目标检测技巧的效果，从中选择了 WRC（Weighted-Resi…
Read more

Paper Reading

YOLOv4

[Reading] Mask R-CNN

Author: nex3z 2021-04-01

Mask R-CNN (2017/3) 1. 概述文章的主要贡献有：提出了一种实例分割的简单方法：在 Faster R-CNN 上添加了一个平行于边界框预测、用于预测目标 mask 的分支，在每个 RoI（Region of Interest）上使用 FCN（Fully Convolutional Network）来预测 mask，如 Figure 1 所示。同时对 m…
Read more

Paper Reading

Mask R-CNN

[Reading] EfficientDet: Scalable and Efficient Object Detection

Author: nex3z 2021-03-25

EfficientDet: Scalable and Efficient Object Detection (2019/11) 1. 概述文章的主要贡献有：提出了一种加权双向特征金字塔（weighted Bi-directional Feature Pyramid Network，BiFPN），可以简单快速地进行多尺度特征的融合。提出了一种组合缩放方法，可以对主干网络…
Read more

Paper Reading

BiFPN, EfficientDet

[Reading] Objects as Points

Author: nex3z 2021-03-20

Objects as Points (2019/4) 1. 概述文章的主要贡献有：提出了一种用点来表示目标的方法，将目标检测问题转化为关键点估计问题。提出了 CenterNet 目标检测算法，将目标看成是一个点，即边界框的中心，通过对关键点的估计找到目标中心，再通过归回得到目标的尺寸、3D 位置、方向、姿态等其他属性，具有很强的泛用性。CenterNet 端到端可微，…
Read more

Paper Reading

CenterNet

[Reading] YOLOv3: An Incremental Improvement

Author: nex3z 2021-03-15

YOLOv3: An Incremental Improvement (2018/4) 1. 概述文章进一步对 YOLO 进行了改进，提出的 YOLOv3 稍微增大了模型体积，让模型更加准确，同时保证了速度。 Figure 1 2. 改进 2.1. 边界框预测 YOLOv3 的边界框预测方法和 YOLO9000 相同，使用维度聚类找到了一系列锚点框…
Read more

Paper Reading

YOLOv3

[Reading] Focal Loss for Dense Object Detection

Author: nex3z 2021-03-10

Focal Loss for Dense Object Detection (2017/8) 1. 概述文章的主要贡献有：提出了 focal loss 损失函数，通过降低容易分类的样本的权重，应对目标检测任务中正负样本数量不平衡的问题。设计了 RetinaNet 目标检测网络来验证 focal loss 的效果，使用 focal loss 训练时，RetinaNet …
Read more

Paper Reading

focal loss, RetinaNet

[Reading] YOLO9000: Better, Faster, Stronger

Author: nex3z 2021-03-05

YOLO9000: Better, Faster, Stronger (2016/12) 1. 概述文章的主要贡献有：使用一系列方法对 YOLO 进行了改进，提出了名为 YOLOv2 的模型，在获得高 mAP 的同时速度也非常快，并能适应不同分辨率的图像，可以在速度和准确率之间进行取舍。提出了一种联合目标检测和图像分类的训练的方法，通过同时使用 COCO 检测数据集和…
Read more

Paper Reading

YOLO9000, YOLOv2

[Reading] Feature Pyramid Networks for Object Detection

Author: nex3z 2021-02-28

Feature Pyramid Networks for Object Detection (2016/12) 1. 概述文章的主要贡献有：提出了一种自顶向下、带有横向连接（lateral connection）的网络架构，可以在多个尺度上构建包含高级语义的特征图，称为特征金字塔网络（Feature Pyramid Network，FPN），显著提高了通用特征的提取能力…
Read more

Paper Reading

FPN

[Reading] SSD: Single Shot MultiBox Detector

Author: nex3z 2021-02-23

SSD: Single Shot MultiBox Detector (2015/12) 1. 概述文章的主要贡献有：提出了一种快速的单次（single-shot）目标检测器，称为 Single Shot Detector（SSD）。SSD 使用单个网络进行目标检测的方法，方法简单，易于训练，速度很快，同时也具有相当的准确度。通过在多个特征图上输出多尺度的边界框，实现…
Read more

Paper Reading

SSD

[Reading] You Only Look Once: Unified, Real-Time Object Detection

Author: nex3z 2021-02-18

You Only Look Once: Unified, Real-Time Object Detection (2015/6) 1. 概述文章的主要贡献有：将目标检测问题看成是对边界框和类别概率的回归问题，提出了可以同时对边界框和类别概率进行预测的网络架构，称为 YOLO（You Only Look Once）。由于整个流水线只有单个网络，可以端到端地进行优化，且预测…
Read more

Paper Reading

YOLO

2024年 4月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30