王伟, 马建光. 人脸识别常用方法及其发展现状[J]. 兵工自动化, 2002, 21(1).
这是一篇很老的文章,姑且准许我这么说,因为科技发展实在太快了。不过还是非常值得一看的。下面开始正题。
一个自动识别人脸的工作可以分为4部分。
1、人脸检测与分割,也就是我们现在说的人脸对齐,从一个景物图片中,切割出来人脸。
2、人脸的规范化,矫正人脸尺寸,光照和旋转。
3、人脸的表征,就是提取人脸的特征。集合特征,代数特征,特征脸,固定特征模板。
4、人脸识别,通过特征来识别。
下面都是我复制论文的内容说实话,用现代的眼光来看没什么有代表性的东西,不过在当时来说非常不错。
三种正脸识别方法
几何人脸,人脸的五官是由集合关系的,包括识别过程通过椭圆形来判断是不是人脸aam算法。通过这些特定的关系来识别人脸。
这 类 识 别 方 法 首 先 将 人 脸 用 一 个 几 何 特 征矢 量 表 示 , 用 模 式 识 别 中 的 层 次 聚 类 思 想 设 计
分 类 器 来 对 人 脸 进 行 识 别 。 它 要 求 该 矢 量 具 有一 定 独 特 性 , 可 以 反 映 不 同 人 面 部 特 征 的 差 别 。
由 于 该 方 法 对 脸 部 朝 向 的 改 变 非 常 敏 感 , 要 求有 一 定 的 弹 性 , 以 消 除 时 间 跨 度 和 光 照 的 影 响 。
识 别 工 作 的 流 程 大 体 如 下 : 首 先 检 测 出 面 部 特征 点 , 通 过 测 量 这 些 关 键 点 之 间 的 相 对 距 离 ,
得 到 描 述 每 个 脸 的 特 征 矢 量 , 比 如 眼 睛 、 鼻 子和 嘴 的 位 置 和 宽 度 , 眉 毛 的 厚 度 和 弯 曲 程 度 等 ,
以 及 这 些 特 征 之 间 的 关 系 。 用 这 些 特 征 来 表 示人 脸 。 比 较 未 知 脸 和 库 中 已 知 脸 中 的 这 些 特 征
矢 量 , 来 决 定 最 佳 匹 配 。 基 于 几 何 特 征 的 方 法内 存 要 求 少 , 识 别 速 度 要 比 基 于 模 板 的 方 法 高 ,
它 的 缺 点 是 这 些 特 征 的 准 确 提 取 是 较 难 实 现的 。 到 目 前 为 止 , 这 种 方 法 在 实 践 中 尚 没 有 成
功 的 应 用 。
代 数 特 征,就是线性代数矩阵的方法,通过提取图片脸的特征值作为标准,来识别人脸。这个也是以后深度学习用来标准脸的方法。
基 于 代 数 特 征 的 人 脸 识 别 方 法这 类 识 别 方 法 也 是 用 特 征 矢 量 来 表 征 人脸 , 但 使 用 的 是 代 数 特 征 矢 量 , 其 中 比 较 经 典的 方 法 是 本 征 脸 ( Eigenface) 方 法 [1] [3]。 该 方法 的 主 要 思 想 是 , 对 于 一 副 由 N 个 象 素 组 成 的
图 像 , 可 以 看 作 是 一 个 N 维 矢 量 , 或 是 一 个 N维 空 间 中 的 一 点 [1] [3]。 Eigenface 方 法 假 设 人 脸
图 像 只 占 据 这 个 高 维 图 像 空 间 的 一 个 很 小 的 子区 域 , 因 此 可 以 利 用 PCA ( Principle
Components Analysis) 原 理 来 得 到 一 个 人 脸 图像 的 优 化 坐 标 系 统 。 即 是 对 这 个 人 脸 子 区 域 的
坐 标 进 行 降 维 , 使 得 每 个 人 脸 图 像 可 以 用 很 少几 个 参 数 来 表 示 , 这 就 大 大 地 降 低 了 人 脸 识 别
的 计 算 复 杂 度 。 下 面 将 识 别 方 法 详 细 介 绍 。假 设 一 副 人 脸 图 像 由 N 个 象 素 组 成 , 则 它
可 以 表 示 成 一 个 N 维 的 矢 量 Г 。设{ Г i∣ i= 1, … , M} 是 人 脸 图 像 的 训 练 集
合 。 这 M 个 图 像 的 平 均 人 脸 可 表 示 成 :
å=
Y = G
M i
i
M 1
1
则 每 个 人 脸 Г i 与 平 均 人 脸 Ψ 的 脸 差 Φ i 为 :
Φ i= Г i- Ψ ; i = 1,… , M
训 练 图 像 集 的 协 方 差 矩 阵 可 按 如 下 建 立 :
C= AAT
其 中 : A= [ Φ 1,… ,Φ M]
协 方 差 矩 阵 C 的 正 交 特 征 矢 量 就 是 人 脸 空
间 的 基 本 矢 量 , 称 作 本 征 脸 ( Eigenface)。
一 般 大 小 的 图 像 , 直 接 计 算 N× N 矩 阵 C
的 特 征 矢 量 非 常 困 难 , 所 以 需 要 一 种 简 化 方 法 。
因 为 训 练 图 像 的 数 目 通 常 要 比 图 像 的 象 素 数 要
少 得 多 , 只 有 M- 1 个 ( 而 不 是 N 个 ) 有 意 义 的
特 征 矢 量 。 所 以 首 先 通 过 计 算 M× M 的 矩 阵 L
的 特 征 矢 量 ν l( l= 1,… , M) 来 计 算 本 征 脸 。
L= ATA
矩 阵 C 的 特 征 向 量 u l( l= 1,… , M), 可 以
表 示 为 差 脸 Φ i( i= 1,… , M)以 ν l( l= 1,… , M)
为 权 值 的 线 性 组 合 。
U= [ u l,… ,u M]=
[ Φ 1,… ,Φ M][ ν l,… , ν M]= A· V
在 实 际 的 识 别 情 况 ,更 少 的 本 征 脸 数 M
ˊ( Mˊ< M) 就 足 够 了 。
基 于 本 征 脸 的 人 脸 识 别 方 法 由 2 部 分 组 成 :
训 练 阶 段 和 识 别 阶 段 。
在 训 练 阶 段 , 每 个 已 知 个 体 的 人 脸 Г k 投 影
到 人 脸 空 间 , 可 得 到 一 个 Mˊ维 的 矢 量 Ω k:
Ω k= UT (Г k- Ψ ); k= 1,… , NC
其 中 NC 是 人 脸 类 的 数 目 。
现 有 2 种 方 法 描 述 人 脸 空 间 中 的 人 脸 类 :
【 Turk 和 Pentland】 第 一 种 平 均 表 示 法 ,
将 对 应 于 某 一 个 人 的 训 练 图 像 的 投 影 矢 量 的 平
均 值 作 为 这 类 人 脸 的 矢 量 。
【 Murase 和 Nayar】 第 二 种 点 集 表 示 法 ,
用 对 应 于 某 一 个 人 的 训 练 图 像 的 投 影 矢 量 的 集
合 来 描 述 这 类 人 脸 。
将 任 何 2 个 人 脸 类 之 间 的 最 大 距 离 的 一 半
定 义 为 表 示 到 人 脸 类 , 即 人 脸 空 间 的 最 大 许 可
距 离 的 距 离 阈 值 θ C:
j k c
q c = 2 1 max j,k { W - W }; j, k = 1,..., N
在 识 别 阶 段 , 待 识 别 图 像 Г 被 投 影 到 人 脸
空 间 , 得 矢 量 Ω 。 Ω 到 各 人 脸 类 的 距 离 定 义 为 :
e k2 = W j - Wk 2; k = 1,L, N
为 了 区 分 人 脸 图 像 和 非 人 脸 图 像 , 原 始 图
像 Г 到 其 从 本 征 脸 空 间 重 建 图 像 Г f 之 间 的 距 离
ε 也 被 计 算 出 来 :
2
2
e = G - Gf ; G f = U × W + Y
求 得 的 距 离 同 阈 值 比 较 ,输 入 图 像 可 以 按 以
下 规 则 进 行 分 类 :
① 如 果 ε ≥ θ C, 则 认 为 输 入 图 像 不 是 人
脸 图 像 。
② 如 果 ε < θ C 并 且 " k, ε k≥ θ C, 则 认
为 输 入 图 像 包 含 一 个 未 知 人 脸 。
③ 如 果 ε<θ C 并 且 ε k*= mink{ε k}<θ C,则
认 为 输 入 图 像 包 含 个 体 k*的 人 脸 。
基 于 代 数 特 征 的 识 别 方 法 ,特 别 是 本 征 脸 方
法 在 应 用 中 是 比 较 成 功 的 。 由 于 代 数 特 征 具 有
一 定 的 稳 定 性 , 所 以 识 别 系 统 对 于 不 同 的 角 度
和 不 同 的 表 情 具 有 一 定 的 鲁 棒 性 。 该 方 法 也 存
在 一 定 的 弊 病 , 例 如 在 光 照 、 角 度 的 干 扰 下 识
别 率 会 急 剧 下 降 , 对 表 情 的 表 述 不 够 充 分 , 所
以 难 于 进 行 表 情 分 析 [1] [5]。
基 于 神 经 网 络 的 方 法,很多网络deepid facenet facebox openface等等。
基 于 神 经 网 络 的 方 法 是 最 近 几 年 比 较 活 跃
的 一 个 研 究 方 向 。 应 用 神 经 网 络 进 行 人 脸 的 特
征 提 取 和 分 类 器 的 设 计 , 有 比 较 成 熟 的 人 脸 特
征 提 取 方 法 , 如 多 主 分 量 提 取 算 法 — — 自 适 应
主 分 量 神 经 网 络 提 取 算 法 。 研 究 人 员 还 应 用 传
统 方 法 和 神 经 网 络 设 计 了 组 合 分 类 器 , 取 得 了
比 较 满 意 的 效 果 , 识 别 率 和 本 征 脸 方 法 相 当 。
该 方 法 在 编 码 压 缩 和 信 息 处 理 方 面 有 独 特 的 优
点 , 但 神 经 元 数 目 多 , 训 练 时 间 长 [7]。
















