1. 概述

 

1.1. 编写目的

编写本测试方案的主要目的是为了保证近日正在准备的“宁波市公安局人脸识别技术性能测试”工作的顺利实施。本方案将明确本次测试的测试数据、计算环境、软硬件配置等方面的要求,明确双方在测试前期的一些准备工作,为测试的顺利进行提供一个书面性的指导方案。

1.2. 项目背景

为提高公安刑侦办案效率,宁波市公安局考虑利用人体生物特征的不可变更性,采用最新的人脸识别技术来辅助公安刑侦工作。但考虑到人脸识别技术在复杂的真实环境中是否有效,效果如何等问题,所以近日准备模拟真实环境,将宁波市400万的暂住人口库与39万的逃犯库利用人脸识别技术进行比对,以检测该技术在实战环境中的应用效果,为下一步的实际应用提供可量度的依据。

1.3. 测试目标

按宁波市公安局的要求,为检测人脸识别技术在实战中的应用效果,希望进行实战的人脸识别的产品性能试验。

经讨论,测试的目标锁定为:将400万宁波市的暂住人口库的照片建库,用来与39万的逃犯库的样本照片(当中含10多张已知身份的逃犯照片) 进行比对,让系统自动搜寻,并将可能匹配结果显示,并发出警报,以便执法人员进行目测审查,同时来评估人脸识别技术采用的照片搜寻器DBScan在实战中的应用效能。

2. 测试配置要求 2.1. 测试数据

根据我们以往的测试经验,整个测试环境的瓶颈在于Oracle数据库的出库与入库时间,所以为了提高整个测试工作的效率,节省测试时间,我们建议减小比对库的大小;另外,为了不影响测试结果的真实性,我们建议采用从400万暂住人口库中随机抽取200万暂住人口数据与逃犯库进行比对的方法。

因此,具体的数据要求为:从暂住人口库中随机抽取的200万宁波市的暂住人口库(包括已经抓获的逃×××员信息),以及39万的逃犯库(包括已经抓获的逃×××员信息)的Oracle 数据汇出档,暂住人口库的数据项包括暂住证号、姓名、性别、照片及人员编号,照片以JPEG BLOB 的形式存储在数据库 (不是在从数据库取出的图档) ;逃犯库的数据项包括:×××号、姓名、性别、照片和人员编号。一人一笔记录。一切涉密信息的栏位,请不要包含在汇出档内。并将档案拷到数据库服务器的硬盘内备用。

2.2. 计算架构 2.2.1. 计算架构逻辑图

系统逻辑图(宁波人脸识别)

2.2.2. 计算架构拓扑图

计算机架构图(宁波人脸识别)

注:

1. Database Server主要用于存储200万宁波市的暂住人口库和39万的逃犯库的Oracle 数据汇出档,以及比对结果记录集和比对过程中产生的数据库日志文件。

2. Cluster Controller主要用于DBscan(人脸识别产品)集群计算的控制。

3. Computation node0,1,2主要用于并行比对计算。

4. Switch为100MB 普通交换机。

5. Client主要用于比对结果显示。

本次测试的计算环境采用普通的以太网TCP/IP协议通讯,物理接口均采用标准的RJ45,通讯介质为普通5类双绞线,为提高通讯效率最好设置为独立网段。

2.3. 硬件需求

根据以上计算架构,本次测试需要硬件产品如下:

1. 数据库服务器(1台):Intel Pentium-4 3.0GHz,2GB 内存,320GB 硬盘,100M以太网,Windows XP或Windows 2003 server。

2. DBScan 比对服务器群集(共4 台): Intel Pentium-4 3.0GHz,2GB 内存,40GB 硬盘,100M以太网,Windows XP或Windows 2003 server。

3. 普通100M交换机(1台),普通网线若干。

4. 普通PC机一台。

注:以上所列硬件产品配置均为最低要求,可根据实际选择更高配置但不应低于以上所列配置要求。

2.4. 软件需求

1. 操作系统:所有机器,均为Windows XP或Windows 2003 server。

2. 数据库系统:Oracle 数据库9i以上

3. 人脸识别系统:Cognitec DBScan 4.1.3 或以上

3. 双方准备工作

为了做好本次实战测试工作,在测试之前双方应做好如下准备工作:

一、宁波局方:

1、根据以上测试配置要求中的说明,需提供相应的网络环境、硬件设备、以及相应系统软件平台(操作系统及Oracle数据库)。

2、根据测试数据要求,协调省厅科通局、局信息通信处获取暂住人口数据和在逃人员数据。

3、安排测试场地,以便厂方的3名工程人员进行无干扰的工作。

4、与公司方一起完成测试数据的比对工作。

5、对测试结果进行评估。

二、公司方:

1、协助局方完成相关测试环境的搭建。

2、协助局方进行测试数据的获取和整理。

3、完成测试软件的编写。

4、进行软件的安装及调试。

5、实施实际比对工作,并将结果总汇,提供报告予局方评估。

6、与局方共同完成评估工作。

4. 比对流程

在测试环境搭建完成以后,利用局方所提供的汇出档,首先建立人员数据库,然后对逃犯库390,000条信息进行特征提取并建立特征模板库。

由于目前DBscan的数据登录速度为8张/秒,根据2,000,000张÷8张/秒÷60÷60÷24=2.89天的计算结果,200 万人次的数据登录大概需要三天时间。

在建模和数据登录完成以后,开始执行“数据库比对”的功能,自动将390,000的逃犯库内的样本和2,000,000的暂住人口库,进行390,000次的1:200万的人脸识别比对,

对于比对结果的获取,我们建议,将比对结果的首50名,比对相似值高于0.3 者,写入特定的Oracle 的比对结果表单内,以便生成统一数据及报表,该表单将有不多于1,950万笔的记录,记录每一逃犯和暂住人口库中由首名到第50名的比对结果队列,含人员编号,名次及分值。根据比对结果表单内的数据,可生成各类报表,以及总结比对结果。

5. 测试结果评估

用户可以通过设定不同的阀值,从测试结果中获取满足阀值的人员信息,局方可以通过目视方式对结果进行确认。

局方根据事先放入的已抓获逃×××员,从比对结果中察看这些人员的分值,原则上分值在70分以上的,列入前50名的,可以认为是比中。

局方根据以上比对结果,对测试进行评估。

6. 例外情况

对于参与比对的照片,我们认为理想的照片应满足如下规范:

  • l 正面居中,整张脸清晰可见
  • l 对焦正确,没有迷焦及失焦
  • l 免冠
  • l 双眼正常张开,而不是故意瞪目
  • l 不得戴上太阳镜、以及粗镜框的眼镜
  • l 脸上没有下垂的头发遮盖
  • l 中性的脸部表情
  • l 如有笑容,以不露齿为限
  • l 正确曝光,面部照明均匀,没有明显的阴影
  • l 没有各类的讯噪、例如粗微粒、因交错视频输入所产生的水平纹及马赛克
  • l 240x320像素或以上, 8位元256灰阶或全彩
  • l 使用远摄镜拍摄(以35mm摄影而言,镜头焦距在90mm至130mm间)

如果在逃犯库的照片中,遇有以下情况,厂家建议将该等照片的结果剔出,并不作为测试结果评估的对象

  • l 配对用的一对照片中的任何一张,严重偏离上述“理想的照片”当中的要求
  • l 照片解析度不足,即是双瞳距低于60像素者
  • l 相片有杂讯、或有局部的斑块
  • l 照片曝光不正确
  • l 用上较广角的镜头拍摄
  • l 面部有其他遮盖(头发、大面积的胡须或其他伪装)
  • l 一对照片的当中的年龄跨度较大,例如十年以上者
  • l 十岁以下儿童识别较为困难
  • l 以下病患的识别亦较为困难:白化病、 没有眼眉者、象人、遭毁容者
7. 进度计划安排

1、3月20日-4月5日,完成测试方案的确认。

2、4月6日-4月20,完成软、硬件设备的准备、协调相关部门获取测试数据,完成测试软件的编写。

3、4月21日-4月25日,完成测试环境的搭建、测试软件的安装调试、测试数据的建模工作。

4、4月26日-30日,完成测试,并对测试进行评估。