作者:吴欣
在最近公布的国际权威人脸识别供应商测试 FRVT(Face Recognition Vendor Test)结果中,中国公司依图科技获得了四项测试的第一名,超过了俄罗斯公司 Vocord(Vocord 是国际老牌安防厂商,长久以来超越 Google 等公司盘踞人脸识别算法第一名)。
FRVT 是由美国国家标准技术局 NIST(National Institute of Standards and Technology) 组织的人脸识别供应商测试,作为美国国家采购的官方指导,其测试的权威性是全球工业界实际应用的黄金标准。
FRVT 的人脸识别测试集合来自美国国土安全局的真实业务场景,例如出入境、刑侦过程中收集的大量照片。与时下热门的由学术机构举办的 LFW、MegaFace 测试相比,FRVT 更贴近实战,测试规模更大,不仅拥有百万量级测试数据,同时这些测试数据均不公开,有效避免算法过拟合甚至是作弊手段。
表一:主流的人脸识别测试场景、测试集、指标比较
表二: 在三个测试集上代表厂商成绩比较。安防厂商海康威视未发布公开测试成绩。
LFW 是由美国马萨诸塞大学发布并维护的公开人脸数据集,测试数据规模为万,国内多个团队例如百度、腾讯、大华、旷视、商汤都曾获得了 99.5% 以上的成绩。
MegaFace 是由美国华盛顿大学发布并维护的公开人脸数据集,测试规模比 LFW 大 100 倍,更能区分各个算法的性能差异。第一名是创立于 1999 年的老牌俄罗斯公司 Vocord,获得 91.7% 的成绩,比第二名腾讯优图高出 8%。
在顶级的竞争中,数据和计算的优势并不能保证输出最优秀的算法性能。
由美国国家标准技术局(NIST)主持的 FRVT,除了主持机构的权威性外,测试结果的权威性还来自其评测的严谨和全面性:
1、数据均来自真实业务场景,测试结果好则代表该技术可以在实战场景中直接应用。
2、数据规模是通过对百亿对样本采样,达到百万量级。如此大规模的测试集可以稳定评估算法性能,详细区分不同算法的优劣。
3、测试数据不公开 (盲测),这保证了测试的公正性。因为参赛的算法团队无法利用测试数据做模型训练,可以有效避免过拟合或直接作弊等手段,因此相对于 LFW、MegaFace 而言,FRVT 则更能体现测试的公正性。
4、科学专业性,FRVT 对不同实战场景、人种、年龄、性别,做了详细分解下的识别性能比较,并在模型速度、特征库大小、比对阈值等做了详细评估。
据官方最新发布的报告,FRVT 的第一名是中国公司依图科技,在千万分之一误报下(采样百亿对样本)的准确率为 95.5%,比第二名俄罗斯公司Vocord 93.5%的准确率高出 2%。这是目前为止全球公开的、最大规模测试集、最权威测试指标下的最好成绩,比2014年参与同样测试的第一名日本公司NEC在准确率上有大幅提高。
N