在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
RCNNRCNN(Regions with Convolutional Neural Network Features)算法思想来自于2014年国际计算机视觉与模式识别会议(CVPR)上的经典paper《Rich feature hierarchies for Accurate Object Detection and Segmentation》,其在物体检测领域达到国际最先进水平(state-of-art)。 RCNN的算法流程
Selective Search算法候选框搜索使用的是传统文献《search for object recognition》的算法,其算法过程如下图。 1.获得一些初始化的区域R={r1,….rn} 图片的缩放在进行CNN特征提取的时候,由于CNN对于输入图片的大小是固定的,所以需要对候选框中的图片进行缩放。 (1)各向异性缩放 (2)各向同性缩放 图中第1、3行就是结合了padding=0,第2、4行结果图采用padding=16的结果。论文证明采用各向异性缩放、padding=16的精度最高。 IOU在物体检测中,用IOU来作为定位精度的评价公式。 IOU=(A∩B)/(A∪B) 就是矩形框A、B的重叠面积占A、B并集的面积比例: SI=A∩B IOU=SI/(SA+SB-SI) 非极大值抑制候选框搜索会得到很多预选框,CNN提取特征后,使用SVM进行分类会得到物体类别的概率值,也就是打分score,这时就需要使用非极大值抑制(Non-maximum suppression, NMS)来排除没用的、不需要的框。 (1)从score最高的矩形框F开始,分别判断A~E与F的重叠度IOU是否大于某个设定的阈值; (2)假设B、D与F的重叠度超过阈值,那么就扔掉B、D;并标记第一个矩形框F,是我们保留下来的。 (3)从剩下的矩形框A、C、E中,选择score最大的E,然后判断E与A、C的重叠度,重叠度大于一定的阈值,那么就扔掉;并标记E是保留下来的第二个矩形框。 就这样一直重复,找到所有被保留下来的矩形框。 最后排除score低于阈值的矩形框,即为最后检测到的目标。 特别说明:本文为本人学习所做笔记。 |
2023-10-27
2022-08-15
2022-08-17
2022-09-23
2022-08-13
请发表评论