RNN和CTC 论文 rcnn论文原文

关注 mob64ca141a2a87

文章目录

前言
R-CNN
模型设计
确定候选框（RP）
提取特征（ALexNet）
分类（SVM）
回归（Bounding-Box regression）

RNN和CTC 论文 rcnn论文原文

转载

mob64ca141a2a87 2024-04-28 17:18:15

文章标签 RNN和CTC 论文目标检测计算机视觉深度学习偏移量 文章分类 机器学习人工智能

前言

RCNN是目标检测的经典论文，后面有许多算法也是借鉴里面的思想，所以有必要好好研究一下。

R-CNN

论文用CNN提取出Region Proposals中的featues，然后进行SVM分类与bbox的回归。

RNN和CTC 论文 rcnn论文原文_计算机视觉

模型设计

确定候选框（RP）

Region proposals. A variety of recent papers offer methods for generating category-independent region proposals.
Examples include: objectness [1], selective search [39], category-independent object proposals [14], constrained parametric min-cuts (CPMC) [5], multi-scale combinatorial grouping [3], and Cires¸an et al. [6], who detect mitotic cells by applying a CNN to regularly-spaced square crops, which are a special case of region proposals. While R-CNN is agnostic to the particular region proposal method, we use selective search to enable a controlled comparison with prior detection work (e.g., [39, 41]).
论文中使用selective search方法确定候选区域。
通过selective search（SS）算法生成1k-2k个候选框。
使用opencv模拟了一把

im = cv2.imread("./test.jpg")

ss = cv2.ximgproc.segmentation.createSelectiveSearchSegmentation()

ss.setBaseImage(im)
ss.switchToSelectiveSearchQuality()

rects = ss.process()

RNN和CTC 论文 rcnn论文原文_深度学习_02

RNN和CTC 论文 rcnn论文原文_计算机视觉_03

提取特征（ALexNet）

使用CNN进行特征提取

产生的候选框强制缩放成227*227，并同ALexNet模型进行特征提取，提取成一个4096的特征向量，并用SVM分类器进行分类。

RNN和CTC 论文 rcnn论文原文_计算机视觉_04

分类（SVM）

使用SVM进行目标分类，并进行打分，就是相似度。

RNN和CTC 论文 rcnn论文原文_目标检测_05

假如有2000个候选框提取的4096特征向量，和svm的权重矩阵相乘，要对其打分分类：

RNN和CTC 论文 rcnn论文原文_深度学习_06

为了减少计算量，得到分数后，就是使用nms算法，剔除不合格的候选框

RNN和CTC 论文 rcnn论文原文_计算机视觉_07

大致的过程是：

获取iou大于某个值的重叠区域
在这些区域中，只要分数最高的区域，其他的全部删除

通过这样的过程，可以淘汰不少候选框，减少后回归的计算压力。

回归（Bounding-Box regression）

大致过程：进行校验回归，修正目标框

RNN和CTC 论文 rcnn论文原文_深度学习_08

引入数量N的训练对 $RNN和CTC 论文 rcnn论文原文_偏移量_09$

$RNN和CTC 论文 rcnn论文原文_RNN和CTC 论文_10$

P代表预测框，G代表真实框

目标是训练一种”转换“，这样”转换“是将预测框P映射到真实框G

RNN和CTC 论文 rcnn论文原文_计算机视觉_11

RNN和CTC 论文 rcnn论文原文_偏移量_12

$RNN和CTC 论文 rcnn论文原文_目标检测_13$

所有有公式：

先做平移

$RNN和CTC 论文 rcnn论文原文_目标检测_14$

再做尺度缩放

$RNN和CTC 论文 rcnn论文原文_计算机视觉_15$

RNN和CTC 论文 rcnn论文原文_偏移量_16

RNN和CTC 论文 rcnn论文原文_目标检测_17

$RNN和CTC 论文 rcnn论文原文_RNN和CTC 论文_18$

$RNN和CTC 论文 rcnn论文原文_RNN和CTC 论文_19$

$RNN和CTC 论文 rcnn论文原文_RNN和CTC 论文_20$

$RNN和CTC 论文 rcnn论文原文_RNN和CTC 论文_21$

RNN和CTC 论文 rcnn论文原文_计算机视觉_22

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：nginx 多个网站重定向405错误码到200 nginx 301重定向

下一篇：emacs 和ctags冲突 emacs与vim

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册