JR T 0221-2021 人工智能算法金融应用评价规范.pdf
《JR T 0221-2021 人工智能算法金融应用评价规范.pdf》由会员分享,可在线阅读,更多相关《JR T 0221-2021 人工智能算法金融应用评价规范.pdf(28页珍藏版)》请在麦多课文档分享上搜索。
1、 ICS 35.240.40 CCS A 11 中华人民共和国金融行业标准 JR/T 0221 2021 人工智能 算法 金融应用 评价 规范 Evaluation specification of artificial intelligence algorithm in financial application 2021 - 03 - 26 发布 2021 - 03 - 26 实施 中国人民银行 发布 JR JR/T 02212021 I 目 次 前言 . II 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 缩略语 . 3 5 总则 . 3 5.1 评价框架 .
2、 3 5.2 评价方法 . 4 6 安全性评价 . 4 6.1 目标函数 . 4 6.2 常见攻击防范 . 5 6.3 算法依赖库 . 9 6.4 算法可追溯性 . 9 6.5 算法内控 . 11 7 可解释性评价 . 12 7.1 可解释性评价维度 . 12 7.2 建模准备 . 12 7.3 建模过程 . 14 7.4 建模应用 . 17 8 精准性 评价 . 18 8.1 精准性评价维度 . 18 8.2 建模过程 . 18 8.3 建模应用 . 19 9 性能评价 . 20 9.1 性能评价维度 . 20 9.2 建模过程 . 20 9.3 建模应用 . 20 附录 (资料性)金融行业
3、 AI 精准性的相关指标定义 . 21 参考文献 . 24 JR/T 02212021 II 前 言 本文件按照 GB/T 1.1 2020标准化工作导则 第 1部分:标准化文件的结构和起草规则的规定 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由中国人民银行提出。 本文件由全国金融标准化技术委员会( SAC/TC 180)归口。 JR/T 02212021 1 人工智能 算法 金融应用评价规范 1 范围 本文件规定了人工智能算法在金融领域应用的基本要求、评价方法、判定准则。 本文件适用于开展人工智能算法金融应用的金融机构、算法提供商、 第三方安全
4、评估机构等 。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 JR/T 0171-2020 个人金融信息保护技术规范 JR/T 0199-2020 金融科技创新安全通用规范 3 术语和定义 下列术语和定义适用于本文件。 3.1 深度学习 deep learning 通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据分布式特征表示的一种 学习方法。 3.2 部分依赖图 partial dependency plot; P
5、DP 一种以可视化形式展示 一个 或两个特征对机器学 习模型预测结果的边际效应 的方法。 3.3 个 体 条件期望 individual conditional expectation; ICE 用于显示对于每一个样本实例而言当改变某一个特征值时人工智能算法预测结果如何改变的一种 可视化方法。 3.4 全 局 代理 模型 global surrogate model 一 种通过训练全局样本 对黑盒算法 预测的可解释方法。 注: 通过解释代理模型 得出 有关黑盒 模型的 具有可解释意义的结论。 JR/T 02212021 2 3.5 代表性样本 prototype 能全面反映真实数据样本的一个数
6、据实例。 3.6 非代表性样本 criticism 不能很好地由代表性样本表示的数据实例。 3.7 有影响力的样本 influential instance 对模型参数或预测值影响程度最大的样本。 3.8 对抗样本攻击 adversarial attack 通过在正常样本上添加难以察觉的微小扰动误导人工智能算法的攻击方法。 3.9 物理对抗攻击 physical adversarial attack 通过物理手段在真实世界构建对抗样本攻击人工智能算法的方法。 3.10 回归算法 regression algorithm 研究因变量和自变量之间关系的预测性建模技术。 3.11 决策 树算法 de
7、cision tree algorithm 在已知各种情况发生概率的基础上,通过构成决策树来求取目标值的期望值不小于零的概率的一 种算法。 注: 常用的有 ID3、 C4.5和 C5.0等。 3.12 图算法 graph algorithm 由节点表示随机变量、边表示变量之间依赖关系的图结构算法。 3.13 集成学习算法 ensemble learning algorithm 通过构建并结合多个基学习器 完成学习任务的算法。 注: 一般分为 bagging、 boosting和 stacking等类别,代表性算法有随机森林、 GBDT、 XGBoost、 LightGBM等。 3.14 模型无
8、关可解释 model-agnostic method JR/T 02212021 3 将人工智能算法解释和模型分离,能够应用于任何模型并可实现模型灵活性、解释灵活性和表示方 式灵活性的一种方法。 4 缩略语 下列缩略语适用于本文件。 AI:人工智能( Artificial Intelligence) AUC: ROC曲线下方面积( Area under the Curve of ROC) C&W: Carlini和 Wagner攻击( Carlini and Wagners Attack) ETL:数据抽取、转换、装载( Extract-Transform-Load) FGSM: 快速梯度下降
9、法 ( Fast Gradient Sign Method) FPR: 假阳率( False Positive Rate) GBDT: 梯度提升决策树 ( Gradient Boosting Decision Tree) IoU:交并比 (Intersection over Union) IV:信息量 (Information Value) JSMA: 基于雅可比矩阵的显着性图攻击 ( Jacobian-based Saliency Map Attack) mAP:平均 精准 率( mean Average Precision) MAE: 平均绝对误差 ( mean absolute erro
10、r) MSE: 均方 误差 ( Mean Square Error) QPS:每秒查询率( Queries-per-second) RMSE: 均方根误差 ( Root Mean Square Error) 2:决定系数( R-Square) RSD:相对标准偏差( Relative Standard Deviation) TPR: 真阳率( True Positive Rate) TPS:每秒处理的事务数( Transactions Per Second) XGBoost: 极端梯度提升 ( Extreme Gradient Boosting) 5 总则 5.1 评价框架 本文件从安全性、可
11、解释性、精准性和性能方面开展 AI算法评价,适用对象分为资金类场景和非资 金类场景。 AI算法 安全性 为算法在 金融 行业 应用 提供安全保障, 是 决定 AI算法是否可用 的 基础 ,只有 在 满足安 全性要求 的前提下才能在金融领域开展应用 。 AI算法安全性评价主要从目标函数安全性、算法攻击防范 能力、算法依赖库安全性、算法可追溯性、算法内控等方面提出基本要求、评价方法与 判定 准则等。 AI算法 可解释性是 判断算法是否适用的重要依据, 可解释性越高 算法内在逻辑、技术实现路径、决 策过程、预期目标越明晰,算法更易于被理解、匹配、应用和管理 。 AI算法 可解释性 评价从算法建模准
12、备、建模过程、建模应用三个阶段提出基本要求、评价方法与 判定 准则等。 JR/T 02212021 4 AI算法 精准性和 性能 是评价算法 应用效果及目 标预期 的主要 因素 , 一般而言 精准性和 性能越高算 法应用效果越好 。 AI算法 精准性和 性能评价从算法建模过程、建模应用两个阶段提出基本要求、评价方 法与 判定 准则等。 AI算法评价内容框架见 下 图。 图 AI 算法 评价内容框架图 5.2 评价方法 评价方法及说明如下: a) 查阅材料:查阅审计报告、自查报告、外部评估报告、设计文档、开发文档、用户文档、管理 文档、产品检测报告等相关材料。 b) 查看系统:查看系统日志、配置
13、文件、参数设置、产品版本、网络配置等。 c) 访谈人员:与被测系统或产品有关人员进行交流、讨论等活动,获取相关证据,了解有关信 息。 d) 系统测试:利用专业工具,通过对目标系统的扫描、探测等操作,使其产生特定的响应等活动, 通过分析响应结果,获取证据以证明信息系统的基本要求、性能、安全性是否得以有效实施。 e) 攻击测试:利用专业攻击方 法 ,对 AI 算法进行攻击 ,分析 攻击 结果,获取证据以证明系统的 安全性是否得以有效实施。 f) 算法测试:基于业务样本数据,通过模型对目标变量进行预测,将预测出的结果和目标变量真 实值进行比对并计算相应的 AI算法评估指标。 g) 查看算法:查看代码
14、、样本数据、训练数据等。 6 安全性评价 6.1 目标函数 人工智能算法金融应用 目标函数评价内容见表 1。 JR/T 02212021 5 表 1 目标函数评价内容 序号 基本要求 评价方法 判定准则 备注 1 目标函数不应存在偏见歧 视 查阅材料 设计文档有目标函数的说明,目标函数设计上不 存在肤色、性别、国籍、年龄、健康等偏见歧视。 资金类场景、 非资金类场 景全部适用 2 算法表达能力应充分 1) 查阅材料 设计文档对算法表达能力进行明确要求,能够适 用于不同于训练阶段的全新使用情况。 2) 系统测试 经测试,系统中算法表达能力与设计文档一致。 3 目标函数运算成本应符合 实施要求 1
15、) 查阅材料 设计文档对目标函数运算成本进行了分析,提出 了明确要求。 2) 查看系统 1.系统中未采用某种低计算成本的替代函数。 2.目标函数的运算成本符合 JR/T 0199-2020的 相关要求。 6.2 常见攻击防范 6.2.1 窃取攻击防范 人工智能算法金融应用 窃取攻击防范评价内容见表 2。 表 2 窃取攻击防范评价内容 序号 基本要求 评价方法 判定准则 备注 1 应防止训练数据在传输、 存储环节被窃取或篡改 1) 查阅材料 管理文档对训练数据传输、存储环节制 定 了明确 的安全管理要求。 资金类场景 全部适用,非 资金类场景 适用第 1、 2、 3、 4 项要求 2) 查看系统
16、 系统在数据传输、存储方面采取的安全措施与管 理文档要求一致。 2 应防止模型在传输、存储 环节被窃取或篡改 1) 查阅材料 管理文档中有对模型传输和存储环节的安全管 理说明。 2) 系统测试 系统中算法模型在传输和存储环节不会被窃取 或篡改。 3 应保障训练数据隐私,避 免用户敏感信息泄露 1) 查阅材料 设计文档制定了安全防护措施,如差分隐私加噪 等。 2) 系统测试 1.系统采取与设计文档一致的安全防护措施,保 障训练数据安全,防止用户敏感信息泄露。 2.训练数据的安全与隐私性符合 JR/T 0171 2020的相关要求 。 4 应保障 AI算法训练步骤安 全 1) 查阅材料 规划方案和
17、实施方案中制定了 AI算法训练过程 安全保障措施。 2) 查看系统 系统具有相应 AI算法训练过程安全防护的配置, 并有审计日志,保障训练步骤安全,防范训练过 程被窃取,避免训练信息泄露。 JR/T 02212021 6 序号 基本要求 评价方法 判定准则 备注 5 AI算法应具有辨识度 1) 查阅材料 规划方案和实施方案中制定技术保障措施,保证 具有对恶意模仿算法的辨识度,如算法模型添加 水印等方法。 资金类场景 全部适用,非 资金类场景 适用第 1、 2、 3、 4项要求 2) 系统测试 系统能区分 AI算法与恶意模仿的攻击算法。 6.2.2 药饵攻击防范 人工智能算法金融应用 药饵攻击防
18、范 评价 内容见表 3。 表 3 药饵攻击防范评价内容 序号 基本要求 评价方法 判定准则 备注 1 训练数据来源应可信、可 靠 查阅材料 设计文档中有对训练数据来源的说明,明确训练 数据不包含标签错误、记录造假等恶意伪造的药 饵数据。 资金类场景、 非资金类场 景全部适用 2 应防止数据存储、使用等 环节被投放药饵数据 1) 查阅材料 设计文档或管理文档中有对训练数据存储、使用 等环节的安全管理说明,防范训练数据被攻击或 被投放药饵数据。 2) 查看系统 系统中数据存储、使用等环节的安全管理与设计 文档或管理文档的要求一致。 3 训练数据分布应合理 1) 查阅材料 设计文档或管理文档明确训练
19、数据分布的具体 说明,防止药饵攻击数据点混入,造成模型倾斜 等错误状况。 2) 查看系统 系统中训练数据分布与设计文档或管理文档的 要求一致。 4 宜具备检测数据集并过滤 噪声和异常值的能力 1) 查阅材料 规划方案或实施方案中明确采用回归分析等方 法检测数据集,过滤其中的噪声和异常值。 2) 系统测试 系统采取了与规划方案或实施方案一致的方法, 能有效检测并过滤数据集中的噪声和异常值。 5 宜具备通过综合多个独立 子模型训练结果的方式增 强 AI算法抗药饵攻击的能 力 1) 查阅材料 规划方案或实施方案中采用集成分析等方式来 提升 AI算法抗药饵攻击能力。 2) 查看系统 系统中有多个子模型
20、,将多个子模型的综合结果 作为最终结果。 6.2.3 闪避攻击防范 6.2.3.1 对抗样本攻击防范 人工智能算法金融应用 对抗 样本 攻击防范评价内容见表 4。 JR/T 02212021 7 表 4 对抗样本攻击防范评价内容 序号 基本要求 评价方法 判定准则 备注 1 算法应有效防御对抗样本 攻击 攻击测试 开发文档或设计文档中根据业务应用场景需求 制定了对抗样板攻击最低容忍成功率,经专家评 估满足业务需求。 攻击测试时, 基于 FGSM、 迷惑深度学习分类模型 ( DeepFool)、 C&W、 JSMA等算法生成对抗样本进 行攻击测试, |测试攻击的最大成功率 -设计的最 低容忍成功
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- JR 0221-2021 人工智能算法金融应用评价规范 0221 2021 人工智能 算法 金融 应用 评价 规范
