GB T 29268.2-2012 信息技术 生物特征识别性能测试和报告 第2部分:技术与场景评价的测试方法.pdf
《GB T 29268.2-2012 信息技术 生物特征识别性能测试和报告 第2部分:技术与场景评价的测试方法.pdf》由会员分享,可在线阅读,更多相关《GB T 29268.2-2012 信息技术 生物特征识别性能测试和报告 第2部分:技术与场景评价的测试方法.pdf(44页珍藏版)》请在麦多课文档分享上搜索。
1、道昌ICS 35.040 L 71 和国国家标准圭K.,.、中华人民GB/T 29268.2一2012月SO/IEC19795-2: 2007 生物特征识别性能测试和报告信息技术第2部分:技术与场景评价的测试方法Information technology-Biometric performance testing and reporting Part 2: Testing methodologies for technology and scenario evaluation (lSO/IEC 19795-2: 2007 ,IDT) 2013-06-01实施20 12 12-31发布发布中华
2、人民共和国国家质量监督检验检菇总局中国国家标准化管理委员会向14乱问川)四川E护2路JRgGB/T 29268.2-2012/ISO/IEC 19795-2: 2007 目次前言E引言.凹1 范围2 符合性.3 规范性引用文件.4 术语和定义.4. 1 生物特征数据.2 4.2 生物特征识别系统组件.2 4.3 生物特征识别系统中的人机交互.2 4.4 性能指标.3 5 技术评价和场景评价概述.3 6 技术评价.5 6.1 测试设计.5 6.2 构建合适的测试库.7 6.3 性能指标.9 6.4 报告127 场景评价.14 7.1 测试设计.147.2 测试群体.,.187.3 性能指标.19
3、 7.4 报告.20 8 技术和场景评价中的其他问题.22 8. 1 测试参与方.22 8.2 公平性.22 8.3 测试系统纳人依据.23 8.4 FAQ的使用.23 8.5 法律问题.23 8.6 测试源码发布.238. 7 供应商对测试报告的评论n附录A(资料性附录)主要技术测试类型的阶段和活动.24附录B(资料性附录)呈现、尝试和事务之间的关系.32 附录C(资料性附录)努力等级报告33附录D(资料性附录客户端-服务端测试. 35 附录E(资料性附录)多系统测试中系统间的交叉对比结果.37 I GB/T 29268.2-2012月SO/IEC19795-2: 2007 前GB/T 29
4、268(信息技术生物特征识别性能测试和报告分为下列7个部分z第1部分:原则与框架p一一第2部分E技术与场景评价的测试方法z一一第3部分z摸态特定性测试z一一第4部分z互操作性性能测试P一一第5部分z生物特征识别门禁系统的场景评价E一一第6部分z性能评价的测试方法p第7部分z卡上生物特征识别比对算法测试。本部分为GB/T29268的第2部分。本部分按照GB/T1. 1-2009给出的规则起草。本部分使用翻译法等同采用国际标准ISO/IEC19795-2:2007(信息技术生物特征识别性能测试和报告第2部分z技术与场景评价的测试方法儿请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这
5、些专利的责任。与本部分中规范性引用的国际文件有一致性对应关系的我国文件如下z一-GB/T26237.2-2011 信息技术生物特征识别数据交换格式第2部分z指纹细节点数据(lSO/IEC 19794-2:2004,NEQ) 本部分由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。本部分起草单位z中国电子技术标准化研究院、中国科学院自动化研究所。本部分主要起草人z袁理、冯敬、霍红文、耿力、李子青、陈水仙、金情、乔申杰、王里晴、郑小援、刘文莉。皿GB/T 29268.2-2012/ISO/IEC 19795-2: 2007 百I本部分涉及两类具体的生物特征识别性能测试方法z技术与场景评
6、价。生物特征识别中的大部分测试都可以归结为这两类。技术评价使用已经建立好的数据库来评价注册和比对算法,而场景评价则通过实时采集的方式同时评价传感器和算法。前者的目的是通过获取大量的比对分数和候选列表来得知算法的区分能力,后者用于测试待测系统在模拟环境中的性能,也包括系统的协作能力回本部分基于GB/T29268. 1-2012中的原则、框架和具体需求而提出,但是其中的理论和原则可以应用于更广泛的测试环境。本部分旨在为生物特征识别系统开发人员、部暑人员和用户提供套标准的测试方法,包括z生物特征识别性能测试设计、执行和报告。通过这套方法,可以获取各种技术在不同的使用场景和环撞下的基准性能。N GB/
7、T 29268.2-2012/ISO/IEC 19795-2: 2007 1 范围信息技术生物特征识别性能测试和报告第2部分:技术与场景评价的测试方法GB/T 29268的本部分规定了以下两个方面的要求z一一开发和详细地描述技术评价、场景评价的协议z一-执行和报告能反映生物特征识别相关参数的评价方法。本部分适用于生物特征识别系统和算法性能测试中的数据采集要求和建议、性能评价分析与报告。两种主要的性能评价类型为z技术评价和场景评价。2 符合性任何测试需遵守本部分中关于技术评价或场景评价的条款。在技术测试和场景测试中,同一词语的意思可能存在差异,所指范围会有所不同。此外,对于识别系统和验证系统,这
8、些词语同样存在差异。为了更清楚地表达此标准,这些词语在各章所指代的具体意思如表1所示。表1评价方法和比对类型在各章所服从的规则评价方法比对类型作用范围技术或场景识别或验证第5章和第8章技术识别第6章,除6.3.3之外技术验证第6章,除6.3.4之外场景识别第7章,除7.3.4之外场景验证第7章,除7.3.5之外3 规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本包括所有的修改单)适用于本文件。GB/T 29268. 1-2012信息技术生物特征识别性能测试和报告第1部分z原则与框架(lSO/IEC 1979
9、5-1:2006 ,IDT) ISO/IEC 19794-2 :2004信息技术生物特征识别数据交换格式第2部分z指纹细节点数据(lnformation technology-Biometric data interchange formats-Part 2 : Finger minutiae data ) 4 术语和定义GB/T 29268. 1-2012界定的以及下列术语和定义适用于本文件。1 GB/T 29268.2-2012/ISO/IEC 19795-2: 2007 4. 1 生物特征数据4. 1. 1 生物特征参考biometric reference 模板模型从用户的注册样本中提
10、取出特征,以一定形式存储的特征。4.2 生物特征识别系统组件4.2. 1 特征提取器feature extractor 用于从样本中提取特征的组件。4.2.2 生物特征参考生成器biometric reference generator 用于从样本中生成生物特征模板的组件。4.3 生物特征识别系统中的人机交互4.3. 1 适应性acclhnatization 在测试过程中,随着时间的增长,生物特征的某些特点可能会影响传感器处理样本的能力。4.3.2 努力等级effort level 在生物特征识别系统中,成功注册或民配所需的呈现、尝试和过程的次数。4.3.3 注册尝试cnrohrrent at
11、tempt 提交某测试人员的-.个或多个生物样本用于注册。注1:多个注册尝试组成一个注册事务,一个注册尝试包含多个注册呈现。注2:关于注册呈现、注册尝试、注册事务的关系,参见附录Bo4.3.4 注册尝试限制enr咀mentattempt Iimit 注册尝试的最大次数或最大时长。测试人员允许在注册事务终止之前进行注册。4.3.5 注册呈现enrolment presentation 提交某测试人员的一个生物特征用于注册。注z多个注册呈现可以构成一次注册尝试,一个注册呈现可能导致也可能不会导致一次注册尝试.4.3.6 注册呈现限制enrolment pr臼entationIimit 注册呈现的最
12、大次数或最大时长。测试人员允许在注册尝试终止之前进行注册。4.3.7 指南guidance 测试人员在注册或识别过程中,由管理员提供的指导。注z指南不包括在注册或识到过程中生物特征识别系统或设备绘出的反馈,比如z声音、视觉提示.2 GB/T 29268.2-2012/ISO/IEC 19795-2: 2007 4.3.8 熟练度habituation 测试人员对设备的熟悉程度。注z当测试人员对某个生物特征识别设备非常了解时,该人员称为熟练测试人员。4.3.9 比对尝试comparison attempt 提交某测试人员的一个或多个生物样本用于比对。4.3. 10 比对尝试限制compariso
13、n attempt Iimit 在比对尝试终止前允许的最大尝试次数或最大时长。4.3.11 比对呈现comparison presentation 提交某测试人员的一个生物特征用于比对。注2多个比对呈现可以构成一次比对尝试,一个比对呈现可能导致也可能不会导致一次比对尝试。4.3.12 比对呈现限制comparison presentation Iimit 比对呈现的最大次数或最大时长。测试人员允许在比对尝试终止前进行识别。4.4 性能指标4.4.1 无效样本的比率Cailure at source rate 在技术评价之前,手动或者自动对原始数据进行筛选,被丢弃的样本数占总样本的比例。示例s在
14、一批采集的人脸数据库中,那些不包含人脸的数据将被丢弃。5 技术评价和场景评价概述本部分涉及两种类型的评价方法z技术评价和场景评价。测试报告应说明其结果属于技术评价还是场景评价,或者既包含技术评价也包含场景评价。技术评价是指针对某种生物模态,采用事先准备好的原始样本对生物特征识别算法进行离线的评价。技术评价的作用在于,将用户行为、传感器和识别过程与识别算法评价进行分离,其优点为z一一能进行完全的交叉比对测试。在技术评价中,整个测试集合中的所有样本都能被测试到(比如,假冒测试),这样错误匹配率的基数可以达到附而不是N;能进行研究性的测试。由于技术评价没有实时性的要求,因此非常适合于研究和开发工作。
15、例如z在技术评价中得到的关于不同参数、设置、不同数据库的测量结果,根据这些结果来调整算法可以逐步提升性能p一一能进行多种实例和算法测试。采用同样测试流程、接口和指标,技术评价可以适用于多种实例测试(例如,三种人脸角度、多种算法测试(例如,多家厂商提供的算法)和多种组合测试F一一通过提供合适的测试样本,技术评价能测试人与传感器交互之后的所有模块,包括=质量控制、反馈模块、信号处理模块、图像层融合模块对于多模态或多实例生物特征识别技术)、特征提取及归一化模块、特征层融合模块、比对和分数层融合,分数J3一化模块s一一人与传感器交互的不确定性会使得测试具有不可重复性,为产品之间的对比测试带来复杂性。消
16、除这种人机交互因素,可以使得测试具有可重复性,而且离线的技术评价可以复现z3 GB/T 29268.2-2012月SO/IEC19795-2: 2007 一一若数据可用,对于经过数年采集得到的海量测试样本,技术评价也能够顺利实施。注1,以离线的方式建立注册数据库,可以更好地控制哪些样本用于哪次识别.注2,在技术评价中,总是首先将数据样本进行存储,然后离线进行处理。在场景评价中,对测试者来说交互过程应该是简单的,系统最好也对数据样本进行存储,但不是必须的.场景评价是指针对某种典型或模拟应用对系统进行整体地在线评价。场景评价的作用在于,整体评价整个系统的性能,包括人与传感器之间的交互、注册过程和识
17、别过程,其优点为z二一能度量额外的尝试和事务对系统注册和识别性能的影响z在收集注册和识别结果的同时,能测试系统的呈现生成和样本采集时间。注3,在线评价过程中,为了与实际应用保持一致,实验者可以减少样本采集数量以减少存储量。然而,最好保存在线测试中的数据,以便事后对结果进行离线分析。注4,测试生物特征识别系统应先采集图像或数据,基于这些数据才能生成模板和比对得分。这些数据可以用于在线的注册尝试、验证或识别,也可以用于离线注册、验证和识别.技术评价和场景评价的不同之处如表2所示。表2技术评价和场景评价的不同点技术评价场景评价测试内容生物特征识别组件(例如,比对、特征提生物特征识别系统取算法测试目标
18、在标准测试数据上测量算法的性能以模拟应用的方式测量系统的整体性能已知数据样本和样本源之间的关联,受排除数据采集错误和测试者的不合理行真实结果数据采集错误和被合并的数据集的交叉为之外,已知注册样本和系统决策之间点影响的关联测试过程元需测试者参与z测试者的行为是否受实验者的控制如果在生物特征数据采集过程受控,则受控(除非系统与测试者的行为元关认为受控,否则,认为非受控测试者是否能立即收到关于注册和元有识别的反馈结果再现住可再现部分可再现(当测试环境和人的因素完全可控时,可再现物理环挠的控制由生物特征数据采集环境决定可控测试者交互行为记录测试过程无需测试者参与记录在生物特征数据采集过程中可能被记录生
19、物特征识别组件的相对鲁棒性例如,生物特征识别系统的相对鲁棒性z报告的典型结果比对、特征提取算法),确定重要的性能指标z确定重要的性能指标整体模拟性能各种错误率z点到点的预计吞吐量z典型指标而不是整体性能z错误匹配率,错误不匹配率z大规模识别的适应性s采集失败率,注册失败率p大规模数据下的系统性能广义错误接受率,广义错误拒绝率约束合适的测试数据库,例如,使用多个传感可操作性,装配好的系统器采集,样本的标号可能是已知或未知的全体测试人员按测试褂议参与现场参与注5,表中是主要的不同点,在某些情况下会有少许出入.4 6 技术评价6. 1 测试设计6. 1. 1 目标GB/T 29268.2-2012月
20、SO/IEC19795-2: 2007 测试设计需要对系统的多个方面进行测试,包括z注册、采集、匹配功能。6. 1.2 系统实现若要测试某应用或某项操作的性能,应尽量精简地设计该测试中的所有功能从输入到输出)和过程(注册或验证。示例=若注册事务在实际应用中需要采集多张图像,则在技术评价中应该采用类似的过程。为了达到测试的目的,被测系统应该尽可能地返回每次比对尝试的得分。6. 1. 3 性能指标确定除了6.3中指定的指标外,实验者需要确定在评价中采用哪些额外的性能指标。设计时需要确定所有应生成的指标。实验者需要确定技术测试中所关注的比对类型,可以指定为下面列表中一种或多种za) 验证Fb) 开集
21、识别zc) 闭集识别。选定技术评价中采取何种比对方式之后,需要报告其理由。比对类型要适用于待测算法,只有这样具有某种具体比对类型的系统例如,监视列表识别系统),才能产生合适的结果类型。注2关于错误率公式,参见GB/T29268.1-2012中的第8章。6. 1. 4 实现的首要原则测试场景不应限制生物特征识别系统的实现方式,各供应商按各自的方式实现其功能,注z明确区分待测系统需要做什么?和待测系统如何做7这两个问题是离线测试的关键。明确测试人员和供应商的职责是首要的问题。对测试人员而言,应该将待测系统看作黑盒子,它的主要功能就是从输入图像产生决策,在任何情况下,其内部细节与测试人员都是不相干的
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 29268.2 2012 信息技术 生物 特征 识别 性能 测试 报告 部分 技术 场景 评价 方法

链接地址:http://www.mydoc123.com/p-210537.html