liosam有回环模块吗回环模型视频

转载

小咪咪 2024-08-04 11:51:49

文章标签 liosam有回环模块吗机器学习人工智能 SLAM linux 文章分类 iOS 移动开发

"见人细过掩匿盖覆”

1. 意义
2. 做法

2.1 词袋模型和字典

2.1.2 感知偏差和感知变异
2.1.2 词袋
2.1.3 字典

2.2 匹配(相似度)计算

3. 提升

前言： 前端提取数据，后端优化数据，但误差会累计，需要回环检测构建全局一致的地图；

1. 意义

通俗的讲，机器人两次经过同一个场景，为了检测是同一个场景，这就是回环检测。它可以用来构建全局一致的地图。有了时隔更加久远的约束，一定程度消除累计飘移。形象的想弹簧，就是把原来已经优化好的，拉的更贴近真实位置。
回环检测还可以做重定位，在跟踪丢失的时候。

2. 做法

以下是几种做法：

取当前图像和历史所有图像一一进行特征提取并比对，通过匹配的数量确定。O( $liosam有回环模块吗回环模型视频_liosam有回环模块吗$ )，缺点资源；
还是上边的方法，但不一一匹配，随机抽取，可检测到的帧少很多；
里程计配合给一个大致位置，这里的进行回环检测，缺点里程计自带误差，只能小范围；
基于外观，主流，其中一种就是词袋模型。

2.1 词袋模型和字典

2.1.2 感知偏差和感知变异

感知偏差(假阳性)，感知变异(假阴性)

liosam有回环模块吗回环模型视频_人工智能_02

准确率(检测正确的数量 / 检测的总数量): $liosam有回环模块吗回环模型视频_机器学习_03$
召回率(实际检测出来的数量 / 理应检测出来的数量): $liosam有回环模块吗回环模型视频_SLAM_04$

一般这两个数据呈矛盾，不取极端，只说在recall为多少，pre为多少时候效果最好，一般我们对P的要求更高。这是回环检测的严格性导致的。

2.1.2 词袋

字典实际就是对所有图片中的特征进行提取，比如"人"，"车"等，它们是单词，对全部图像特征提取所有单词(特征)后构成一个字典。
词袋说的是一帧图像中，能够提取出来的单词。

比如现在有一本4个特征的字典： $liosam有回环模块吗回环模型视频_人工智能_05$
而我们有两个 $liosam有回环模块吗回环模型视频_liosam有回环模块吗_06$ 一个 $liosam有回环模块吗回环模型视频_liosam有回环模块吗_07$ 特征的图像，那用词袋可以记为：
$liosam有回环模块吗回环模型视频_人工智能_08$
它的向量就是
$liosam有回环模块吗回环模型视频_linux_09$

那么检测两个图像，则举例可以用

$liosam有回环模块吗回环模型视频_人工智能_10$

L1范数，各元素绝对值之和，向量完全一样则得到1，是回环。

2.1.3 字典

字典里的单词是某一类特征的组合，类似于一个聚类问题，UML(无监督学习常见问题)。

假设要做 $liosam有回环模块吗回环模型视频_linux_11$ 个单词的字典，可以用K-means，K-means++等实现，这里以K-means(均值)为例：

字典规模大，要在字典中查找单词属于哪个，逐个查找复杂度 $liosam有回环模块吗回环模型视频_liosam有回环模块吗_12$ ，参考数据结构，这里有很多优化方法，这里以最简单的K叉树为例去优化字典结构：

liosam有回环模块吗回环模型视频_linux_13

又很像K-D树，聚类类中类，聚中聚哈哈。一棵深度为 $liosam有回环模块吗回环模型视频_人工智能_14$ ，分支为 $liosam有回环模块吗回环模型视频_liosam有回环模块吗_15$ 的树，可以容纳， $liosam有回环模块吗回环模型视频_人工智能_16$

2.2 匹配(相似度)计算

两个概念：

TF(Term Frequency)译频率：某单词在一副图像中经常出现，它的区分度就高；
IDF（Inverse Document Frequency)逆文档频率：某单词在字典中出现的频率低，它的区分度就高；

在做字典时候，用IDF，假设所有特征总数为 $liosam有回环模块吗回环模型视频_SLAM_17$ ，当前要统计的单词特征 $liosam有回环模块吗回环模型视频_liosam有回环模块吗_18$ 的数量为 $liosam有回环模块吗回环模型视频_人工智能_19$ ，则此单词的IDF为：
$liosam有回环模块吗回环模型视频_人工智能_20$
对一副图像而言，假设特征/单词 $liosam有回环模块吗回环模型视频_liosam有回环模块吗_18$ 出现了 $liosam有回环模块吗回环模型视频_人工智能_19$ 次，而这幅图一共出现的单词数量为 $liosam有回环模块吗回环模型视频_SLAM_17$ ，则TF为：
$liosam有回环模块吗回环模型视频_liosam有回环模块吗_24$
基于以上知识，一个图像的特征点可以对应到很多单词，则它的词袋（BOW）为：
$liosam有回环模块吗回环模型视频_linux_25$
词袋中有很多0值，因为它不能包含字典中所有词。
计算两图词袋的差异(匹配度)，给出一种方式(一范数)，还有很多：
$liosam有回环模块吗回环模型视频_liosam有回环模块吗_26$