人脸识别架构是什么人脸识别框架

转载

mob64ca140d96d9 2023-12-19 11:31:50

文章标签 人脸识别架构是什么计算机视觉深度学习 opencv 人脸识别 文章分类 架构后端开发

简介

基于深度卷积网络的人脸识别，流程基本上一致，如下图所示，可以看做是一个基本框架：

人脸识别架构是什么人脸识别框架_计算机视觉

图1 人脸识别基本框架

由上图，可以看到，人脸识别分为以下几个主要步骤：

输入图像：可以做一些图像前处理操作，比如：调整亮度、去噪等
人脸检测：检测人脸位置，可以加入一些活体检测之类的算法
人脸对齐：实际场景中，人脸一般都是歪的，需要基于人脸关键点进行对齐
人脸裁剪：将对齐后人脸抠出，作为后续深度特征网络的输入
人脸特征提取：通过DCNN网络，对人脸图进行建模，得到人脸特征
人脸特征比对：使用比对算法，比对不同人脸特征，比如：余弦距离、欧氏距离等

详细介绍

Input Image -> Detect

输入：原始的可能含有人脸的图像

输出：活体人脸位置的bounding box

这一步称之为“人脸检测”（Face Detection），可以使用dlib、OpenCV现有的人脸检测方法，比如传统计算机视觉中的方法（Hog、Haar等特征）、深度学习YOLO等。

对人脸检测这一步感兴趣的可以参考下列资料：
dlib的实现： dlib C++ Library: Dlib 18.6 released: Make your own object detector!
openCV的实现：Face Detection using Haar Cascades

在金融等高安全场景，对检测到的人脸，还需判断是否为照片和视频等非活体人脸，需要将检测到的人脸输入活体分类网络，筛选出活体人脸。

另外，一般在进行该步骤之前，会进行图像预处理操作，这部分工作可能很多很复杂，比如：减少图像中的噪声干扰、提高清晰度，还有包括图像滤波、变换、转码、模数转化等，如下图所示，原始图像人脸太暗，需要先提个亮度，然后发现噪点太多，再做个降噪.....一顿操作后，感觉效果可以了，然后再进行之后流程：

图2 图像预处理

Detect -> Transform -> Crop

输入：原始图像 + 人脸位置bounding box

输出：“校准”过的只含有人脸的图像

对于输入的原始图像 + bounding box，这一步要做的事情就是要检测人脸中的关键点，然后根据这些关键点对人脸做对齐校准。所谓关键点（landmark），就是下图所示的绿色的点，通常是眼角的位置、鼻子的位置、脸的轮廓点等等，关键点个数有很多类型，可以参考资料（点击查看）。有了这些关键点后，我们就可以把人脸“校准”，或者说是“对齐”。解释一下：就是原先人脸可能比较歪，这里根据关键点，使用仿射变换将人脸统一“摆正”，尽量去消除姿势不同带来的误差。这一步我们一般叫Face Alignment（人脸对齐）。人脸对齐后，就可以进行人脸图扣取了。

人脸识别架构是什么人脸识别框架_计算机视觉_02

图3 人脸对齐

对于人脸对齐感兴趣的，可以参考如下传统方法，特点是比较快，对应的论文是：
https://www.semanticscholar.org/paper/One-millisecond-face-alignment-with-an-ensemble-of-Kazemi-Sullivan/d78b6a5b0dcaa81b1faea5fb0000045a62513567?p2df
人脸关键点：
人脸关键点检测的数据集与核心方法发展综述 - 极市社区