"见人细过 掩匿盖覆”

  • 1. 意义
  • 2. 做法
  • 2.1 词袋模型和字典
  • 2.1.2 感知偏差和感知变异
  • 2.1.2 词袋
  • 2.1.3 字典
  • 2.2 匹配(相似度)计算
  • 3. 提升


前言: 前端提取数据,后端优化数据,但误差会累计,需要回环检测构建全局一致的地图;

1. 意义

  • 通俗的讲,机器人两次经过同一个场景,为了检测是同一个场景,这就是回环检测。它可以用来构建全局一致的地图。有了时隔更加久远的约束,一定程度消除累计飘移。形象的想弹簧,就是把原来已经优化好的,拉的更贴近真实位置。
  • 回环检测还可以做重定位,在跟踪丢失的时候。

2. 做法

以下是几种做法:

  • 取当前图像和历史所有图像一一进行特征提取并比对,通过匹配的数量确定。O(liosam有回环模块吗 回环模型视频_liosam有回环模块吗),缺点资源;
  • 还是上边的方法,但不一一匹配,随机抽取,可检测到的帧少很多;
  • 里程计配合给一个大致位置,这里的进行回环检测,缺点里程计自带误差,只能小范围;
  • 基于外观,主流,其中一种就是词袋模型。

2.1 词袋模型和字典

2.1.2 感知偏差和感知变异

感知偏差(假阳性),感知变异(假阴性)

liosam有回环模块吗 回环模型视频_人工智能_02

  • 准确率(检测正确的数量 / 检测的总数量):liosam有回环模块吗 回环模型视频_机器学习_03
  • 召回率(实际检测出来的数量 / 理应检测出来的数量):liosam有回环模块吗 回环模型视频_SLAM_04

一般这两个数据呈矛盾,不取极端,只说在recall为多少,pre为多少时候效果最好,一般我们对P的要求更高。这是回环检测的严格性导致的。

2.1.2 词袋

  • 字典实际就是对所有图片中的特征进行提取,比如"人","车"等,它们是单词,对全部图像特征提取所有单词(特征)后构成一个字典。
  • 词袋说的是一帧图像中,能够提取出来的单词。

比如现在有一本4个特征的字典:liosam有回环模块吗 回环模型视频_人工智能_05
而我们有两个 liosam有回环模块吗 回环模型视频_liosam有回环模块吗_06 一个 liosam有回环模块吗 回环模型视频_liosam有回环模块吗_07 特征的图像,那用词袋可以记为:
liosam有回环模块吗 回环模型视频_人工智能_08
它的向量就是
liosam有回环模块吗 回环模型视频_linux_09

那么检测两个图像,则举例可以用

liosam有回环模块吗 回环模型视频_人工智能_10

L1范数,各元素绝对值之和,向量完全一样则得到1,是回环。

2.1.3 字典

字典里的单词是某一类特征的组合,类似于一个聚类问题,UML(无监督学习常见问题)。

  • 假设要做 liosam有回环模块吗 回环模型视频_linux_11 个单词的字典,可以用K-means,K-means++等实现,这里以K-means(均值)为例:

字典规模大,要在字典中查找单词属于哪个,逐个查找复杂度 liosam有回环模块吗 回环模型视频_liosam有回环模块吗_12,参考数据结构,这里有很多优化方法,这里以最简单的K叉树为例去优化字典结构:

liosam有回环模块吗 回环模型视频_linux_13


又很像K-D树,聚类类中类,聚中聚哈哈。一棵深度为 liosam有回环模块吗 回环模型视频_人工智能_14 , 分支为 liosam有回环模块吗 回环模型视频_liosam有回环模块吗_15 的树,可以容纳, liosam有回环模块吗 回环模型视频_人工智能_16

2.2 匹配(相似度)计算

两个概念:

  • TF(Term Frequency)译频率: 某单词在一副图像中经常出现,它的区分度就高;
  • IDF(Inverse Document Frequency)逆文档频率: 某单词在字典中出现的频率低,它的区分度就高;
  1. 在做字典时候,用IDF,假设所有特征总数为 liosam有回环模块吗 回环模型视频_SLAM_17, 当前要统计的单词特征 liosam有回环模块吗 回环模型视频_liosam有回环模块吗_18 的数量为 liosam有回环模块吗 回环模型视频_人工智能_19, 则此单词的IDF为:
    liosam有回环模块吗 回环模型视频_人工智能_20
  2. 对一副图像而言,假设特征/单词 liosam有回环模块吗 回环模型视频_liosam有回环模块吗_18 出现了 liosam有回环模块吗 回环模型视频_人工智能_19 次,而这幅图一共出现的单词数量为 liosam有回环模块吗 回环模型视频_SLAM_17,则TF为:
    liosam有回环模块吗 回环模型视频_liosam有回环模块吗_24
  3. 基于以上知识,一个图像的特征点可以对应到很多单词,则它的词袋(BOW)为:
    liosam有回环模块吗 回环模型视频_linux_25
    词袋中有很多0值,因为它不能包含字典中所有词。
  4. 计算两图词袋的差异(匹配度),给出一种方式(一范数),还有很多:
    liosam有回环模块吗 回环模型视频_liosam有回环模块吗_26

3. 提升

对于回环检测,有几点可以提升的部分:

  1. 增加字典规模
  2. 相似性评分处理

对于环境外观相似,比如教室同款椅子很多,利用先验的相似度(某时刻关键帧图像与上一时刻关键帧的相似性)进行归一化:
liosam有回环模块吗 回环模型视频_机器学习_27

  1. 关键帧处理
  1. 相邻帧肯定满足回环检测条件,因为变化太小,所以回环检测的帧一般稀疏;
  2. 检测到的回环相邻帧意义不大,一帧就可以优化轨迹,因此会把相近的回环聚类成一类,使算法不会反复检测同一类。
  1. 验证

词袋没有顺序,相机颠倒也是回环,如何验证?
回环缓存机制是一种,单词检测到的回环不足以构成约束,在一段时间内一直检测到的回环才是正确的回环(时间上的一致性检测)

  1. 机器学习应用于类别

图像连续变化产生不同类别,甚至可以认为是连续的;
图像间相似性可以利用深度学习方法;
词袋方法的物体识别能力不如神经网络,回环检测类似。