欢迎来到麦多课文档分享! | 帮助中心 海量文档,免费浏览,给你所需,享你所想!
麦多课文档分享
全部分类
  • 标准规范>
  • 教学课件>
  • 考试资料>
  • 办公文档>
  • 学术论文>
  • 行业资料>
  • 易语言源码>
  • ImageVerifierCode 换一换
    首页 麦多课文档分享 > 资源分类 > PDF文档下载
    分享到微信 分享到微博 分享到QQ空间

    DB37 T 3523.2-2019 公共数据开放 第2部分:数据脱敏指南.pdf

    • 资源ID:1483311       资源大小:582.51KB        全文页数:8页
    • 资源格式: PDF        下载积分:5000积分
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    二维码
    微信扫一扫登录
    下载资源需要5000积分(如需开发票,请勿充值!)
    邮箱/手机:
    温馨提示:
    如需开发票,请勿充值!快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如需开发票,请勿充值!如填写123,账号就是123,密码也是123。
    支付方式: 支付宝扫码支付    微信扫码支付   
    验证码:   换一换

    加入VIP,交流精品资源
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    DB37 T 3523.2-2019 公共数据开放 第2部分:数据脱敏指南.pdf

    1、ICS 35.240 L 72 DB37 山东省地方标准 DB 37/T 3523.22019 公共数据开放 第2部分:数据脱敏指南 Public data opennessPart 2:Data desensitization guidelines 2019 - 03 - 21发布 2019 - 04 - 21实施 山东省市场监督管理局 发布 DB37/T 3523.22019 I 目 次 前言 . II 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 基本原则 . 1 4.1 有效 . 1 4.2 真实 . 1 4.3 高效 . 2 4.4 稳定 . 2 4.5

    2、可配置 . 2 5 脱敏规划 . 2 6 脱敏流程 . 2 6.1 识别敏感数据 . 2 6.2 标识敏感数据 . 3 6.3 确定脱敏场景 . 3 6.4 选择脱敏方法 . 3 6.5 定义脱敏规则 . 3 6.6 执行脱敏操作 . 3 6.7 评估脱敏效果 . 3 附 录 A (资料性附录) 数据脱敏方法 . 4 参考文献 . 5 DB37/T 3523.22019 II 前 言 DB37/T 3523公共数据开放分为如下部分: 第1部分:基本要求; 第2部分:数据脱敏指南; 第3部分:开放评价指标体系; 第4部分: 本部分为DB37/T 3523的第2部分。 本部分按GB/T 1.1 2

    3、009给出的规则起草。 本部分由山东省大数据局提出、归口并监督实施。 本部分起草单位:山东省大数据局、山东省公安厅、山东省计算中心(国家超级计算济南中心)、 山东省大数据中心、山东省标准化研究院。 本部分主要起草人:柯林森、赵一新、李明、闫雷、赵硕、史丛丛、王洪儒、张媛、逄锦山、綦琳、 陈洪波、李学民、刘晓飞、李刚、周鸣乐。 DB37/T 3523.22019 1 公共数据开放 第2部分:数据脱敏指南 1 范围 本部分提供了公共数据开放中数据脱敏的指导和建议,并给出了基本原则、脱敏规划、脱敏流程等 方面需考虑的要点信息。 本部分适用于山东省公共数据开放的数据脱敏工作。 2 规范性引用文件 下列

    4、文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文 件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 35273 信息安全技术 个人信息安全规范 3 术语和定义 下列术语和定义适用于本文件。 3.1 数据脱敏 data desensitization 按照一定规则对原始数据进行处理,达到屏蔽敏感信息的一种数据保护方法。 3.2 个人敏感信息 personal sensitive information 一旦泄露、非法提供或滥用可能危害人身和财产安全,极易导致个人名誉、身心健康受到损害或歧 视性待遇等的个人信息。 注:个人信息包括

    5、身份证件号码、个人生物识别信息、银行账号、通信记录和内容、财产信息、征信信息、行踪轨 迹、住宿信息、健康生理信息、交易信息、14周岁以下(含)儿童的个人信息等。 GB/T 35273,定义3.2 4 基本原则 4.1 有效 数据脱敏宜确保脱敏工作的有效性,去除数据中的敏感信息,保证数据安全,经数据脱敏处理后, 原始信息中包含的敏感信息已被移除,无法通过处理后的数据得到敏感信息,并防止使用非敏感数据推 断、重建敏感原始数据。 4.2 真实 DB37/T 3523.22019 2 数据脱敏宜确保脱敏工作的真实性,脱敏后的数据应尽可能真实地体现原始数据的特征,且应尽可 能多保留原始数据中的有意义信息

    6、。在开展数据脱敏工作时,一般情况下宜注意以下方面: a) 保持原数据的格式; b) 保持原数据的类型; c) 保持原数据间的依存关系; d) 保持语义完整性; e) 保持引用完整性; f) 保持数据的统计、聚合等特征; g) 保持频率分布; h) 保持唯一性。 4.3 高效 数据脱敏宜确保脱敏工作的高效性,宜通过程序自动化实现,并可重复执行。在不影响有效性的前 提下,需注意平衡脱敏的力度与所花费的代价,将数据脱敏的工作控制在一定的时间和经济成本内。 4.4 稳定 数据脱敏宜确保脱敏工作的稳定性,需保证对相同的原始数据,在各输入条件一致的前提下,无论 脱敏多少次,其最终结果相同。 4.5 可配置

    7、 数据脱敏宜确保脱敏工作的可配置性,按照输入条件不同生成不同的脱敏结果,从而可按数据使用 场景等因素为不同的最终用户提供不同的脱敏数据。 5 脱敏规划 宜对数据脱敏工作进行总体规划,制定完备的数据脱敏工作方案,并对可能接触到脱敏数据的相关 方进行数据脱敏规程的培训,并定期评估和维护数据脱敏规程内容。在制定数据脱敏工作方案时,宜考 虑以下因素: a) 明确敏感数据管理部门,以及其安全责任和义务; b) 建立敏感数据的分类分级、脱敏工具运维管理等制度,并定期维护更新; c) 建立数据安全管控机制,如代码安全、审计安全、安全管理等; d) 定期对数据脱敏工作的相关方开展培训工作; e) 制定完备的敏

    8、感数据使用审批流程,确保敏感数据的使用安全合规; f) 明确数据脱敏流程,包括发现敏感数据、标识敏感数据、确定脱敏方法等。 6 脱敏流程 6.1 识别敏感数据 宜完整地梳理数据中包含的信息,明确其中敏感信息,识别敏感数据包括但不限于: a) 明确数据脱敏工作范围; b) 对工作范围内数据进行梳理和分类; c) 建立敏感数据位置和关系库,以保存敏感数据的位置,以及敏感数据与原数据之间的关联关系; DB37/T 3523.22019 3 d) 根据业务需要选择人工或自动等识别方式,并考虑识别方式与主流数据库系统、数据仓库系统、 文件系统、云计算环境下新型存储系统等的适用性; e) 选择数据发现工具

    9、,并考虑其扩展性,可根据业务需要自定义敏感数据的发现逻辑; f) 明确敏感信息的字段名称、字段类型、字段长度、赋值规范等内容; g) 利用反关联方法,查找可能由某些非敏感字段推断出另一敏感字段的映射,并对这些非敏感字 段进行识别,例如:由出生日期可以推断出身份证号码的场景,需对出生日期进行识别。 6.2 标识敏感数据 识别出敏感数据后,宜尽早对敏感数据的格式、位置等信息进行标识,标识方法的选择宜考虑以下 因素: a) 敏感数据标识信息能够随敏感数据一起流动; b) 敏感数据标识信息不易被恶意攻击者删除和篡改; c) 需考虑便捷性和安全性,使标识后的数据容易被识别; d) 需支持不同数据类型(如

    10、静态数据和动态数据)的敏感标识; e) 对所有可能生成敏感数据的非敏感字段同样进行标识,例如:在病人诊治记录中为隐藏姓名与 病情的对应关系,将“姓名”作为敏感字段进行变换,但是如果能够凭借某“住址”的唯一性 导出“姓名”,则需要将“住址”进行标识并脱敏。 6.3 确定脱敏场景 在标识敏感数据基础上,确定脱敏场景,脱敏场景包括但不限于: a) 静态脱敏:对原始数据进行一次脱敏后,脱敏后的结果数据可以多次使用; b) 动态脱敏:针对不同用户需求,对数据进行屏蔽处理的数据脱敏方式,要求系统有安全措施确 保用户不能够绕过数据脱敏层次直接接触敏感数据。 6.4 选择脱敏方法 依据数据脱敏场景选择数据脱敏

    11、方法,数据脱敏方法参见附录A。 6.5 定义脱敏规则 依据已选择的数据脱敏方法,定义脱敏规则,并对常用数据脱敏规则进行固化,避免重复定义。 6.6 执行脱敏操作 脱敏操作需遵循个人隐私保护、数据安全保护等相关法规、行业监管规范或标准,个人敏感信息安 全应遵循GB/T 35273中相关规定。根据已定义的数据脱敏规则,数据脱敏操作包括但不限于: a) 对脱敏过程运行监控和分析; b) 定期对脱敏工作开展安全审计; c) 对脱敏任务自动化运行。 6.7 评估脱敏效果 在执行脱敏工作基础上,利用测试工具评估脱敏后数据对应用系统功能、性能等方面的影响,并根 据验证情况不断优化脱敏规划。 DB37/T 3

    12、523.22019 4 A A 附 录 A (资料性附录) 数据脱敏方法 数据脱敏方法见表A.1。 表A.1 数据脱敏方法 序号 脱敏方法 方法描述 示例 1 掩码 用通用字符替换原始数据中的部分信息, 掩码后的数据长度与原始数据一样。 将手机号码13500010001经过掩码得 到135*0001。 2 规整 将数据按照大小规整到预定义的多个档 位。 将客户资产按照规模分为高、中、低三 个级别,将客户资产数据用这三个级别 代替。 3 替换 以虚构的数据代替真实的数据。 将姓名“张三”替换为“王二”。 4 乱序 对敏感数据进行重新随机分布,混淆原有 值和其他字段的联系。 将金额13526乱序为

    13、65123。 5 均化 针对数值性的敏感数据,在保证脱敏后数 据集总值或平均值与原数据集相同的情 况下,改变数值的原始值。 将65、75、90、50均化为79、61、85、 55。 6 散列 对原始数据取散列值,使用散列值来代替 原始数据。 将1234567取散列值为0100110。 7 数据截断 直接舍弃业务不需要的信息,仅保留部分 关键信息。 将手机号码13500010001截断为135。 8 日期偏移取整 按照一定粒度对时间进行向上或向下偏 移取整,可在保证时间数据一定分布特征 的情况下隐藏原始时间。 将时间20180101 01:01:09按照5秒钟 粒度向下取整得到20180101 01:01:05。 9 限制返回行数 仅仅返回可用数据集合中一定行数的数 据。 商品配方数据,只有在拿到所有配方数 据后才具有意义,可在脱敏时仅返回一 行数据。 10 限制返回列数 仅仅返回可用数据集合中一定列数的数 据。 查询人员基本信息时,对于某些敏感 列,不包含在返回数据集中。 11 DB37/T 3523.22019 5 参 考 文 献 1 全国信息安全标准化技术委员会等,大数据安全标准化白皮书(2018版) 2 贵阳大数据交易所,大数据交易区块链技术应用标准 _


    注意事项

    本文(DB37 T 3523.2-2019 公共数据开放 第2部分:数据脱敏指南.pdf)为本站会员(jobexamine331)主动上传,麦多课文档分享仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知麦多课文档分享(点击联系客服),我们立即给予删除!




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
    备案/许可证编号:苏ICP备17064731号-1 

    收起
    展开