DB32 T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf
《DB32 T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf》由会员分享,可在线阅读,更多相关《DB32 T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf(20页珍藏版)》请在麦多课文档分享上搜索。
1、ICS 35.020 CCS L72 DB32 江苏省 地 方 标 准 DB 32/T 4040.1 2021 政务大数据 数据元规范 第 1 部分:总则 Big Data of Administrative Specification for Data Elements Part 1:General 2021-05-14 发布 2021-06-14 实施 江苏省市场监督管理局 发布 DB32/T 4040.1-2021 I 目 次 前 言 . II 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 数据元和代码集的表示规范 . 2 4.1 数据元的属性概述 . 2 4
2、.2 数据元属性的描述方法 . 3 4.3 数据元标识类属性 . 4 4.4 数据元定义类属性 . 6 4.5 数据元关系类属性 . 6 4.6 数据元表示类属性 . 7 4.7 数据元管理类属性 . 10 4.8 数据元附加类属性 . 11 4.9 代码集标识符 . 12 5 数据元的设计方法 . 12 5.1 数据元和数据元属性的提取 . 12 5.2 数据元的分类规则 . 12 5.3 数据元的命名规则 . 12 6 数据元的维护和扩展方法 . 13 6.1 数据元维护策略 . 13 6.2 新增数据元 . 13 6.3 变更数据元 . 14 6.4 废止数据元 . 14 7 数据元的使
3、用方法 . 14 参考文献 . 16 DB32/T 4040.1-2021 II 前 言 本文件按照 GB/T 1.1 2020标准化工作导则 第 1 部分:标准化文件的结构和起草规则的规 定起草。 DB32/T 4040政务大数据 数据元规范分为 7 个部分: 第 1 部分:总则; 第 2 部分:公共数据元; 第 3 部分:综合人口数据元; 第 4 部分:综合法人数据元; 第 5 部分:社会信用数据元; 第 6 部分:电子证照数据元; 第 7 部分:自然资源和空间地理数据元。 本文件为政务大数据 数据元规范的第 1 部分。 本文件由江苏省大数据管理中心提出。 本文件由江苏省政务服务管理办公室
4、归口。 本文件起草单位:江苏省政务服务管理办公室、江苏省大数据管理中心。 本文件主要起草人:赵明、陈俊、宋裕官、何正庆、王旭、徐建荣、刘瑛、韩骉、邱玉婷、杨坤、 尤慧、朱小燕、朱珠、姚丹、刘伟、王子文、刘晓红、纪雅莉、张献彬、张永丽、张媛媛、张树楠。 DB32/T 4040.1-2021 1 政务大数据 数据元规范 第 1 部分:总则 1 范围 本文件规定了政务数据元(以下简 称数据元)的概念和组成、数据元和代码集的表示规范、数据元 的设计方法、数据元的维护和扩展方法、数据元的使用方法。 本文件适用于政务数据元的编制、使用和扩展。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成
5、本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T 18391.1 2009 信息技术 元数据注册系统( MDR) 第一部分:框架 GB/T 19488.1 2004 电子政务数据元 第 1 部 分:设计和管理规范 GB/T 35295 2017 信息技术 大数据 术语 3 术语和定义 下列术语和定义适用于本文件。 3.1 数据 data 信息的可再解释的形式化表示,以适应于通信、解释或处理。 注: 数据可以由人工或自动的方式加工、处理。 来源: GB/T 18391.1 2009, 3.
6、2.6 3.2 大数据 big data 具有体量巨大、来源多样、生成极快、且多变等特征并且难以用传统数据体系结构有效处理的包含 大量数据集的数据。 注: 国际上,大数据的 4 个特征普遍不加修饰地直接用 volume、 variety、 velocity 和 variability 予以表述,并 分别赋予了它们在大数据语境下的定义: a) 体量 volume:构成大数据的数据集的规模; b) 多样性 variety:数据可能来自多个数据仓库、数据领域或多种数据类型; c) 速度 velocity:单位时间的数据流量; d) 多变性 variability:大数据其他特征,即体量、速度和多样性
7、等特征都处于多变状态。 来源: GB/T 35295 2017, 2.1.1 3.3 数据元 data element 由一组属性规定其定义、标识、表示和允许值的数据单元。 注: 数据元在特定的语义环境中被认为是不可再分的最小数据单元。数据元一般来说由对象类、特性和表示三部分 组成: DB32/T 4040.1-2021 2 a) 对象类:思想、概念或真实世界中的事物的集合,它们具有清晰的边界和含义,其特征和行为遵循同样的 规则。对象类是人们希望研究、搜集和存储它们的相关数据的事物; 示例 1: 汽车、人、房屋、订单等。 b) 特性:对象类中的所有成员共同具有的有别于其他的、显著的特征。特性是
8、用来区分和描述对象的手段; 示例 2: 颜色、性别、年龄、收入、地址等。 c) 表示:描述了数据被表达的方式,表示与数据元的值域关系密切。一个数据元的值域指数据元的所有允许 值的集合。 示例 3: 对于“个人所得税金额”这个数据元,它的值域可以是一系列非负整数(带有货币单位),这是一种 非枚举型的值域,而“个人所得税比率”对收入进行分段划分,并给每一段赋予一个比率,它的值域就 是这些比率的集合,此时称它的值域为枚举型值域。 来源 : GB/T 18391.1 2009, 3.3.8,有修改 3.4 元数据 metadata 定义和描述其他数据的数据。 来源 : GB/T 18391.1 200
9、9, 3.2.16 3.5 属性 attribute 某个对象或实体的一种特性。 来源 : GB/T 18391.1 2009, 3.1.1 3.6 值域 value domain 允许值的集合。 来源 : GB/T 18391.1 2009, 3.3.38 3.7 注册 registration 一个管理项与其管理部门的关系。 来源 : GB/T 18391.1 2009, 3.3.31 3.8 政务部门 administrative organization 政府部门及法律法规授权具有行政职能的事业单位和社会组织。 3.9 管理部门 responsible organization 标准化
10、行政主管部门授权对政务数据元实施注册、维护和管理功能的组织 。 3.10 应用部门 applications organization 因履行职责需要使用其他政务部门 ( 3.8) 的政务信息资源和为其他政务部门 ( 3.8) 提供政务信 息资源的政务部门 ( 3.8) 。 4 数据元和代码集的表示规范 4.1 数据元的属性概述 数据元的表示规范是通过对其一系列属性的描述来实现的,这些属性即是数据元的元数据。表 1 给出了数据元的六大类属性。 DB32/T 4040.1-2021 3 表 1 数据元的六大类属性 属性类别 属性名称 说明 标识类属性 内部标识符 标识类属性是用于标识数据元的一类
11、属性。 中文名称 中文全拼 中文首拼 英文名称 版本 同义名称 定义类属性 定义 定义类属性是描述数据元语义方面的一类属性。 对象类词 特性词 关系类属性 分类方案 关系类属性是描述数据元之间相互关系的一类属性。 分类方案值 关系 表示类属性 表示词 表示类属性是描述数据元表示方面的一类属性。 数据类型 数据格式 值域 计量单位 管理类属性 状态 管理类属性是描述数据元管理与控制方面的属性。 来源部门 管理部门 批准日期 附加类属性 备注 附加类属性是描述上述属性以外的其他属性。 4.2 数据元属性的描述方法 下面的描述符是对数据元属性的描述: a) 名称 赋予数据元属性的标记,名称是唯一的,
12、名称以字符型表示。 b) 定义 属性的描述,可使一种属性与其他属性清晰地区别开来,定义以字符型表示。 c) 约束 显示一个属性是始终还是有时出现的描述符,该描述符有必选和可选两个取值,前者表示该属性必 须出现,后者表示该属性是否出现可选。 d) 出现次数 显示一个属性出现多少次的描述符,该描述符有以下四种情况: 0 1(表示不出现或出现 1 次), 0 n(表示不出现或出现多次), 1 1(表示出现且仅出现 1 次), 1 n(表示出现 1 次或多次)。 e) 类型 描述属性的所有取值的类型。 示例: 字符、数值、日期、时间、日期时间和二进制。 f) 规则 DB32/T 4040.1-2021
13、 4 数据元属性的命名和分配规则。 g) 备注 与属性应用有关的注释。 4.3 数据元标识类属性 4.3.1 名称:内部标识符 定义:在一个管理部门 内由管理部门自行分配的,与语言无关的数据元的唯一标识符 。 约束:必选。 出现次数: 1 1。 类型:字符型。 规则: 内部标识符由 14 位阿拉伯数字分 4 个部分组成,规则如下: a) 第一部分为信息资源分类码,用从 01 开始递增的两位阿拉伯数字表示,分为公共、综合人口、 综合法人、社会信用、电子证照、自然资源和空间地理 6 大类,表 2 给出了信息资源分类码; 表 2 信息资源分类码 序号 信息资源分类 代码 1 公共 01 2 综合人口
14、 02 3 综合法人 03 4 社会信用 04 5 电子证照 05 6 自然资源和空间地理 06 b) 第二部分为政务信息资源数据元的一级分类,用从 01 开始递增的 2 位阿拉伯数字表示; c) 第三部分为政务信息资源数据元的二级分类,用从 00001 开始递增的 5 位阿拉伯数字表示; d) 第四部分为二级分类下数据元的顺序码,用从 00001 开始递增的 5 位阿拉伯数字表示。图 1 给 出了内部标识符结构的表示方式; 图 1 内部标识符表示方式 e) 内部标识符一旦赋予,将不被复用。 备注:无。 4.3.2 名称:中文名称 定义:赋 予数据元的单个或多个中文字词的指称 。 DB32/T
15、 4040.1-2021 5 约束:必选。 出现次数: 1 1。 类型:字符型。 规则: a) 在一定语境下数据元的名称应唯一; 中文名称由一个对象类词、一个特性词和一个表示词组成,其顺序为:中文名称对象类词 特性词表示词; b) 中文名称中应只有一个对象类词、特性词和表示词; c) 当表示词与特性词有重复或部分重复时,可将名称中冗余词省略; d) 中文名称尽量与权威名称保持一致。 备注:无。 4.3.3 名称:中文全拼 定义:数据元中文名称的汉语拼音。 约束:必选。 出现次数: 1 1。 类型:字符型。 规则: 数据元的中文全拼是用“ -”连接中文名称中的每一个汉字的拼音,全部用小写。 备注
16、:无。 4.3.4 名称:中文首拼 定义:数据元中文名称的汉语拼音的首字母。 约束:必选。 出现次数: 1 1。 类型:字符型。 规则:中文首拼全部使用大写字母。 备注:无。 4.3.5 名称:英文名称 定义: 赋予数据元的单个或多个英文字词的指称。 约束:可选。 出现次数: 0 1。 类型:字符型。 规则:英文名称优先采用权威来源。 备注:无。 4.3.6 名称:版本 定义:用于本文件在正式发布后和下次修订发布期间,数据元应用部门和管理部门内部版本管理的 标识。 约束:可选。 出现次数: 0 1。 类型:字符型。 规则: a) 版本是由阿拉伯数字字符和小数点字符组成的字符型,本文件实施后,版
17、本定为 1.0。 DB32/T 4040.1-2021 6 b) 版本号变更的原则为: 1) 数据元的必选属性发生变化时,无论非必选属性是否变化,则小数点字符前的数字字符加 1,小数点字符后的数字归 0; 2) 数据元的必选属性不变而非必选属性发生变化时,则小数点字符前的数字字符不变,小数 点字符后的数字加 1。 示例 : 某数据元的版本号为 1.0,当 数据元第一次修订时,其必选属性发生变化而非必选属性不变,则该数据元的 版本为 2.0;当该 数据元第二次修订时,其必选属性不变而非必选属性发生变化,则该数据元的版本为 2.1; 当 数据元第三次修订时,其必选属性和非必选属性同时发生变化,则该
18、数据元的版本为 3.0。 备注:无。 4.3.7 名称:同义名称 定义:一个数据元在不同应用环境下的不同称谓。 约束:必选。 出现次数: 0 n。 类型:字符型。 规则:无。 备注:一个数据元可以有多个同义名称。 4.4 数据元定义类属性 4.4.1 名称:定义 定义:是用描述性的短语或句子对一个数据元所作的解释。 约束:必选。 出现次数: 1 1。 类型:字符型。 规则:无。 备注:无。 4.4.2 名称:对象类词 定义:数据元名称成分之一,表达了该数据元所属事物或概念的集合。 约束:可选。 出现次数: 0 1。 类型:字符型。 规则:无。 备注:标识出数据元的对象类词,有助于实现对数据元的
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DB32 4040.1-2021 政务大数据 数据元规范 第1部分:总则 4040.1 2021 政务 数据 规范 部分 总则
