这篇文章是在学习罗浩老师发布在bilibili上的课程后进行的,对于那些准备进入行人重识别领域的小白来说,在这里推荐一下罗浩老师的课程。虽说发布时间已经是几年前了,有些框架或者知识已经更新,但仍是不可多得的入门材料。

定义
行人重识别(Person re-identification)也称行人再识别, 被广泛认为是一个图像检索的子问题, 是利用计算机视觉技术判断图像或者视频中是否存在特定行人的技术, 即给定一个监控行人图像检索跨设备下的该行人图像。行人重识别技术可以弥补目前固定摄像头的视觉局限, 并可与行人检测、行人跟踪技术相结合, 应用于视频监控、智能安防等领域。

行人重识别系统

识别行人 机器学习 行人重识别技术_人工智能

一个完整的行人重识别系统包括以下几个部分:
1.数据

原始视频帧
就是我们通过摄像设备获取的正常视频图像。举个栗子,假如是警察在追查犯罪嫌疑人的逃跑路径,那么原始视频帧就是犯罪现场周围的所有监控视频。
带检索行人图像
指的就是我们所要查找的行人的图片,作为Probe输入。还是上面那个栗子的话,带检索行人图像就是嫌犯的图像。
2.行人重识别系统

行人检测

主要用于检测视频中出现的人像,作为一个行人重识别首先要做到的就是能够将图片中的行人识别出来,称为Gallery输入。当然,在学术研究领域,行人重识别主要还是关注的下面这个部分,而对于行人检测这部分多选择采用目前已经设计好的框架。

行人重识别

这一部分就是对上面的Probe以及Gallery进行特征提取,当然提取的方式可以是手工提取,也可以使用卷积神经网络进行提取。然后呢,就是对图片的相似度进行度量,根据相似图进行排序。

识别行人 机器学习 行人重识别技术_人工智能_02

 针对行人重识别系统从细节来说,包括下面几个部分:
特征提取(feature Extraction):学习能够应对在不同摄像头下行人变化的特征。
度量学习(Metric Learning) :将学习到的特征映射到新的空间使相同的人更近不同的人更远。
图像检索(Matching):根据图片特征之间的距离进行排序,返回检索结果。