1、ICS 13.310 CCS A 91 DB4403 深圳市 地 方 标 准 DB4403/T 165 2021 人脸特征比对检索距离函数技术规范 Technical specification of comparision and retrieval distance function for face feature 2021-05-27 发布 2021-07-01 实施 深圳市市场监督管理局 发布 DB4403/T 165 2021 I 目 次 前言 . II 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 符号 . 2 5 基本 要求 . 2 6 技术要求 .
2、 3 DB4403/T 165 2021 II 前 言 本文件按照 GB/T 1.1 2020标准化工作导则 第 1部分:标准化文件的结构和起草规则的规定 起草。 本 文件 由深圳市公安局视频警察支队提出。 本 文件 由深圳市公安局安全技术防范管理办公室归口。 本 文件 起草单位 : 深圳市公安局视频警察支队、 深圳市智慧安防行业协会、深圳市中安测标准技术 有限公司 、 华为技术有限公司、深圳市商汤科技有限公司、 深圳云天励飞技术股份有限公司 、 平安科技 (深圳)有限公司、杭州海康威视数字技术股份有限公司、浙江大华技术股份有限公司、深圳市捷顺科 技实业股份有限公司、 深圳市广电信义科技有限公
3、司 、盛视科技股份有限公司、厦门瑞为信息技术有限 公司。 本 文件 主要起草人: 赵琨、温妙洋、 李石华、李胜锋、 黄立 、 赵瑞 、 程冰、景发俊、 董晓波、雷秋 菊、 刘杰、张泽琳、刘华、蔡昊然、刘聪、关庆佳、贾宝芝 、麦祺、庄珊珊 。 DB4403/T 165 2021 1 人 脸特征比对检索距离函数技术规范 1 范围 本 文件 规定了人脸特征比对检索距离函数的 基本 要求和技术要求。 本 文件 适用于人脸特征比对系统。 2 规范性引用文件 本文件没有规范性引用文件。 3 术语和定义 下列术语和定义适用于本 文件 。 3.1 特征向量 feature vector 由人脸识别算法从对应的
4、人脸图片中计算提取得到 一 个多维用于表示人脸特征的向量 。 3.2 特征向量类型 data type of feature vector 人脸特征向量中每个数值在计算机中存储、计算时所采用的数据类型。 注: 常见的数据类型有 : 双精度浮点型( fp64)、 单精度浮点型( fp32)、半精度浮点型( fp16)、单字节整型( int8) 等。 3.3 特征向量维度 dimension of feature vector 人脸特征向量中数值的个数。 3.4 特征向量规范化 standardization of feature vector 对特征向量进行某种变换,使得特征向量满足某种给定的条
5、件 。 注: 特征向量中所有数值的平方和等于某个给定的常数。 3.5 特征距离函数 distance function of feature 用于计算特征向量两两之间距离的数学函数。 注: 同一个 人的人脸特征向量之间的距离较小,不同人的人脸特征向量之间的距离较大。 DB4403/T 165 2021 2 3.6 乘项标量 multiplicative-item scalar 用于对计算出的特征距离进行修正的标量,该标量采用乘法方式对特征距离进行缩放。 3.7 偏置项标量 offset-item scalar 用于对计算出的特征距离进行修正的标量,该标量采用加法方式对特征距离进行平移。 4 符
6、号 下列符号适用于本文件。 b: 字节 d:特征向量维度 fp16:半精度浮点型 fp32:单精度浮点型 fp64:双精度浮点型 int8:单字节整型 5 基 本 要求 5.1 规范化特征距离函数应用 的 基本框架示意图见图 1,并符合以下要求: a) 规范化特征向量和特征距离函数应能实现规范化管理和特征汇聚比对; b) 不同企业应按规范格式特征编码输出,经过规范化特征距离函数比对检索计算,输出检索结 果,汇聚到系统平台进行人脸核验、比对、布控、检索等。 DB4403/T 165 2021 3 图 1 规范化特征距离函数应用基本框架示意图 5.2 每张人脸图片采用 d 维的特征向量表示,支持的
7、特征向量维度有 d=128, d=256, d=512, d=1024; 并符合以下要求: a) d 是固定的; b) 对应 特征向量维度为 d=128 或 d=256 或 d=512 或 d=1024,即当 0d 128 时, d 用 128 表示; 当 128d 256 时, d 用 256 表示;当 256d 512 时, d 用 512 表示;当 512d 1024 时, d 用 1024 表示。 5.3 特征向量类型为可配置,支持的类型有 fp64、 fp32、 fp16、 int8; 每个维度特征采用对应类型数 据表示,每个特征数据占 b 字节 ; fp64 占 b=8 个字节,
8、fp32 占 b=4 个字节, fp16 占 b=2 个字节, int8 占 b=1 个字节,整个特征向量为 d b 字节。 int8 应 备用 存储一个或两个 fp32 的标量 来 复原 特征向量。 6 技术要求 6.1 人脸特征比对检索距离函数 6.1.1 特征向量规范化可采用 L2 范数归一化 , 见公式( 1) 和( 2) ; 要求 采用 L2 范数归一化后的特 征向量 中所有数值的平方和等于 1, 见公式( 3)。 2x xx ( 1) di ix1 22x ( 2) 企业 1 前端 子系统 企业 n 前端 子系统 企业 1 的特征 向量底库 企业 n 的特征 向量底库 图片 /视
9、频流 图片 /视 频流 比对检索计算 规范化特征 距离函数 规范 格式特征 编码 规范 格式特征 编码 企业 1 检 索结果 企业 n 检 索结果 系统平台 业务应用 本 文件 规范范围 比对检索计算 规范化特征 距离函数 DB4403/T 165 2021 4 1x 2 ( 3) 式中: x 采用 L2范数归一化后的特征向量; x 特征向量; ix 特征向量中第 i 个特征数值 。 6.1.2 特征距离采用向量夹角的余弦 距离 或欧氏距离进行定义, 见公式( 4)公式( 6) 。 212221 2121c o s xx1xx xx1x,x D ( 4) 22121 xxx,x eu dD (
10、 5) 22121 xxx,x eu dD ( 6) 式中: 21cos x,xD 特征向量之间的余弦距离; 1x , 2x 特征向量; 1x , 2x 采用 L2 范数归一化后的特征向量; 21 x,xeudD 特征向量之间的欧氏距离。 6.1.3 对于不同 d, 公式 ( 1) 公式 ( 6)均可适用,图 1 中特征比对检索 计算 应保证支持指定维度 的计算。 6.1.4 对于不同数据类型的特征向量,距离 1)的计算应 按 公式( 7)公式( 9) 进行。 21212121c o s x,xxxx,x1x,x CSD ( 7) 212212121 x,xxxx,xx,x CSD e u d
11、 ( 8) 212212121 x,xxxx,xx,x CSD e u d ( 9) 式中: 1x , 2x 特征向量; 21 x,xS 乘项标量 ; 21 x,xC 偏置项标量 。 注 1: 1x , 2x 符合 5.3 规定的特征向量类型 ( fp64, fp32, fp16, int8)。 1) 包括余弦距离和欧氏距离 。 DB4403/T 165 2021 5 注 2: 21 x,xS 用于恢复结果到浮点类型,根据企业采用的不同量化方式由企业随特征一并提供,未对特征进行 量化时, 21 x,xS 可设置为常数 1。 注 3: 21 x,xC 用于恢复结果到浮点类型,根据 企业 采用 的
12、 不同量化方式由 企业 随特征一并提供,未对特征进行 量化时, 21 x,xC 可设置为常数 0。 6.2 特征距离输出 人脸比对接口输入为两个需要比对的特征向量,输出为特征距离,见图 2;人脸检索接口输入为查 询特征向量和待查询 特征向量 , 输出 为 特征距离最短的前 K 个人脸以及对应的特征距离,见图 3。 图 2 人脸比对接口示意图 图 3 人脸检索接口示意图 _ 人脸检索 特征距离函数计算 查询特征向量 A1 待查询特征向量 B1 特征距离最短的前 K 个人脸以及对应 的特征距离 输入 输入 输出 特征距离排序 待查询特征向量 Bn 查询特征向量 An 人脸比对 特征距离函数 计算 特征向量 A 特征向量 B 特征距离 输入 输入 输出