1、 电子政务数据资源开放数据技术规范 The e-government data resources opening data technical specification DB44/T 2110 2018 广东省地方标准 ICS 35.240.01 L 70 备案号: 58887-2018 DB44 2018-01-25 发布 2018-04-25 实施 广东省质量技术监督局 发布 DB44/T 2110 2018 I 目 次 前言 . II 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 分类组织方式 . 2 5 元数据 . 2 6 数据格式 . 11 7 字符集
2、 . 15 8 版权声明 . 15 9 数据使用策略 . 16 10 数据更新 . 16 11 数据质量要求 . 16 附录 A (规范性附录) 数据格式 XML Schema . 18 附录 B (资料性附录) 数据样例 . 24 附录 C (规范性附录) 图标说明 . 29 DB44/T 2110 2018 II 前 言 本标准按 GB/T 1.1-2009给出的规则起草。 本标准由广东省经济和信息化委提出并归口。 本标准起草单位: 广东省标准化研究院、工业和信息 化部电子第五研究所、广东省电子政务协会。 本标准主要起草人:陈贤明、卢朝金、黎东初、覃震宇、徐剑、王嘉斌、林敏锐、王韬、黄燕玲
3、、 刘笑兰、林泽虹、肖晓赟、陈雨、刘军华、苏嘉健、江振强、王贵虎。 DB44/T 2110 2018 1 电子政务数据资源开放数据技术规范 1 范围 本规范规定了电子政务数据资源开放数据的分类组织方式、元数据、数据格式、版权声明、数据使 用策略、数据更新及数据质量要求。 本规范适用于我省各级政府部门开放各种政务数据,并为各相关部门政务数据资源开放提供实操性 指导。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的 引用文件,仅注日期的版本适用于本文 件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 7027-2002 信息分类和编码的基本
4、原则与方法 GB/T 7408-2005 数据元和交换格式信息交换日期和时间表示法 GB 2312-1980 信息交换用汉字编码字符集 基本集 GB 18030-2000 信息技术 信息交换用汉字编码字符集 基本集的扩充 GB/T 26816-2011 信息资源核心元数据 GB/T I9000-2000 质量管理体系 基础与术语 RFC 2396 统一资源标识符:一般句法 DB44/T 2109 2018 政务信息资源标识编码规范 DB44/T 2111-2018 电子政务数据资源开放数据管理规范 3 术语和定义 下列术语和定义适用于本文件。 3.1 元数据 metadata 描述数据的数据,
5、对数据及信息资源的描述性信息。 3.2 元数据元素 metadata elements 元数据的基本单元,用以描述信息资源的某个特性。 3.3 元数据实体 metadata entity 一组说明数据相同特性的元数据元素。 3.4 标识符 identifier DB44/T 2110 2018 2 用于标识或命名一个数据项目并可能指出该数据确定性质的一个或一组字符。 3.5 编码 coding 按一定规则将一个集合的元素映射为另一个集合的元素的过程。 3.6 数据类型 data type 允许对域内的值进行操作的值域说明。 3.7 数据集 data set 可以识别的数据集合。 4 分类组织方
6、式 政务数据资源开放的数据分类组织方式遵循 DB44/T 2109 2018。 5 元数据 5.1 元数据属性 5.1.1 概述 本规范采用摘要表示的方式定义和描述元数据,摘要内容包括以下几个属性:中文名称 、定义、英 文名称、数据类型、值域、缩写名、约束 /条件、最大出现次数、备注。 5.1.2 中文名称 元数据元素或元数据实体的中文名称。 5.1.3 定义 对元数据进行解释和说明。 5.1.4 英文名称 元数据元素或元数据实体的英文名称。元数据元素的英文名称一般用小写英文全称,英文单词之间 用空格分隔;元数据实体的英文名称中没有空格,而是多个单词连写,其中每一个单词首字母为大写。 5.1.
7、5 数据类型 元数据元素或元数据实体的数据类型。数据类型的表示方式见表 1。 DB44/T 2110 2018 3 表 1 元数据的数据类型表示方式 表示方式 说明 c 字 符 c3 3位字符,定长 c.3 最多位 3位字符 n 数字字符( 0、 1、 2) n3 3位定长数字字符 n.3 最多 3位数字字符 n.9,2 数值型,总长度为最多 9位数字字符,小数点后保留 2位数字 d 日期型 d8 日期型,按年、月、日顺序,格式 8位定长,全数字表示( YYYYMMDD)。年用 4位数字 表示,月,日各用 2位数字表示,彼此之间没有分隔符。 d14 日期型,按年、月、日、时、分、秒的顺序,格式
8、 10位定长,全数字表示( YYYYMMDDhhmmss)。 年用 4位数字表示,月,日、 时、分、秒各用 2位数字表示,彼此之间没有分隔符。 5.1.6 值域 规定元数据元素的有效值域。 5.1.7 缩写名 元数据元素或元数据实体的英文缩写名称。缩写规则如下: a) 缩写名必须唯一 ; b) 缩写名不应包括任何空格、破折号、下划线或分隔符等 ; c) 缩写名不应使用复数形式的英文单词,除非该单词本身是复数形式 ; d) 元数据元素缩写名描述应采用 LCC方式,即除第一个单词外,每个单词的首字母大写,这些单 词组合起来;元数据实体缩写名描述应采用 UCC方式,即每个单词的首字母均为大写; e)
9、 对国际或行业领域已存在惯用英文名称缩写的,采 用惯用缩写。 5.1.8 约束 /条件 元数据元素或元数据实体是否选取的说明描述符。描述符分别有: a) M:必选,表明该元数据元素或元数据实体必须选用 ; b) O:可选,表明该元数据元素或元数据实体可根据实际应用而选用或不选用。宜尽可能多地选 择这些可选实体和可选元素,以便充分地说明其数据。可选实体可以有必选元素,但是,如果 一个可选实体未被选用,则该实体所包含的元素(包括必选元素)都不选用 ; c) C:条件必选,表明该元数据元素或元数据实体满足约束条件中所定义的条件时应选用。条件 必选用于以下 3种可能之一: 当在多个选项中进 行选用时,
10、至少一个选项必选,且必须选用; 当另一个元数据元素已经选用时,选用一个元数据实体或元数据元素; 当另一个元数据元素已经选择了一个特定值时,选用一个元数据元素。 5.1.9 最大出现次数 DB44/T 2110 2018 4 元数据元素或元数据实体可以有的实例最大数目。只出现一次用“ 1”表示,重复出现用“ N”表 示;固定次数不为 1时,用相应数字表示(如: 2、 3、 )。 5.2 核心元数据 5.2.1 概述 电子政务开放数据资源核心元数据的构成包含 4个必选的元数据元素(资源代码、版本号、更新周 期和数据使用策略)和 3个元数据实体( 版权信息、数据提供单位和数据项),还包括可选的 3个
11、元数据 元素(数据集名称、关键字和摘要)和 1个元数据实体(扩展属性)。 7个必选元数据,包括 4个元数据元素和 3个元数据实体: a) 资源代码:见 5.2.3.1; b) 版本号:见 5.2.3.2; c) 更新周期:见 5.2.3.3; d) 数据使用策略:见 5.2.3.4; e) 版权信息:见 5.2.3.5; f) 数据提供单位:见 5.2.3.6; g) 数据项:见 5.2.3.7; h) 更新时间 见 5.2.3.8; 4个可选元数据,包括 3个元数据元素和 1个元数据实体: a) 数据集名称:见 5.2.3.9; b) 关键字 :见 5.2.3.10; c) 摘要:见 5.2
12、.3.11; d) 扩展属性:见 5.2.3.12。 5.2.2 核心元数据模型 GB/T 26816-2011第 5.2条确立的元数据模型适用于本规范。 5.2.3 核心元数据描述 5.2.3.1 资源代码 定义 : 政务信息资源的唯一标识 英文名称 : Resource Code 数据类型 : 字符串 值域 : 遵循 DB44/T 2109 2018中 6 政务信息资源标识符 的规定 缩写名 : resCd 约束 / 条件 : M 最 大 出 现 次 数 : 1 5.2.3.2 版 本号 定义 : 同一个政务信息资源的不同版本的标识 英文名称 : Version 数据类型 : 字符串 值域
13、 : 自由文本 DB44/T 2110 2018 5 缩写名 : ver 约束 / 条件 : M 最 大 出 现 次 数 : 1 5.2.3.3 更新周期 定义 : 描述政务信息资源的更新频率 英文名称 : UpdateCycle 数据类型 : 字符串 值域 : 自由文本 缩写名 : uCycle 约束 / 条件 : M 最 大 出 现 次 数 : 1 5.2.3.4 数据使用策略 定义 : 描述政务信息资源开放使用的策略 英文名称 : DataUsagePolicy 数据类型 : 自由文本 值域 缩写名 : : 有条件开放和无条件开放 dataUP 约束 / 条件 : M 最 大 出 现 次
14、 数 : 1 5.2.3.5 版权信息 定义 : 政务资源的版权所属单位信息 英文名称 : Copyright 数据类型 : 复合型 缩写名 : copr 约束 / 条件 : M 最 大 出 现 次 数 : 1 5.2.3.5.1 版权所属机构代码 定义 : 版权所属机构的统一社会信用代码 英文名称 : CopyrightUnitCode 数据类型 : 字符串 值域 : 遵循 GB 32100-2015的规定 缩写名 : coprCode 约束 / 条件 : M 最 大 出 现 次 数 : 1 5.2.3.5.2 版权所属机构名称 定义 : 版权所属机构的名称 英文名称 : Copyright
15、Unit Name 数据类型 : 字符串 值域 : 自由文本 缩写名 : coprName 约束 / 条件 : M 最 大 出 现 次 数 : 1 5.2.3.5.3 版权声明 定义 : 对政务资源的版权声明 DB44/T 2110 2018 6 英文名称 : CopyrightNotice 数据类型 : 字符串 值域 : 自由文本 缩写名 : coprNotice 约束 / 条件 : M 最 大 出 现 次 数 : 1 5.2.3.6 数据提供单位 定义 : 政务资源数据的提供单位信息 英文名称 : DataProviderUnit 数据类型 : 复合型 缩写名 : proUnit 约束 /
16、 条件 : M 最 大 出 现 次 数 : 1 5.2.3.6.1 提供单位机构代码 定义 : 数据提供单位的统一社会信用代码 英文名称 : ProviderUnitCode 数据类型 : 字符串 值域 : 遵循 GB 32100-2015的规定 缩写名 : proUCode 约束 / 条件 : M 最 大 出 现 次 数 : 1 5.2.3.6.2 提供单位机构名称 定义 : 数据提供单位的名称 英文名称 : ProviderUnitName 数据类型 : 字符串 值域 : 自由文本 缩写名 : proUName 约束 / 条件 : M 最 大 出 现 次 数 : 1 5.2.3.7 数据项
17、 定义 : 描述政务资源各数据项的属性 英文名称 : DataUnit 数据类型 : 复合型 缩写名 : dUnite 约束 / 条件 : M 最 大 出 现 次 数 : N 5.2.3.7.1 数据项标识 定义 : 数据项的唯一标识符 英文名称 : IDName 数据类型 : 字符串 值域 : 自由文本 缩写名 : idName 约束 / 条件 : M 最 大 出 现 次 数 : 1 DB44/T 2110 2018 7 5.2.3.7.2 数据项名称 定义 : 数据项的名称 英文名称 : DisplayName 数据类型 : 字符串 值域 : 自由文本 缩写名 : disName 约束 /
18、 条件 : M 最 大 出 现 次 数 : 1 5.2.3.7.3 数据类型 定义 : 数据项取值的类型 英文名称 : Datatype 数据类型 : 字符串 值域 : 自由文本 缩写名 : dType 约束 / 条件 : M 最 大 出 现 次 数 : 1 5.2.3.7.4 数据项定义 定义 : 描述数据项的含义 英文名称 : Definition 数据类型 : 字符串 值域 : 自由文本 缩写名 : def 约束 / 条件 : O 最 大 出 现 次 数 : 1 5.2.3.7.5 备注 定义 : 数据项的备注信息 英文名称 : Comments 数据类型 : 字符串 值域 : 自由文本
19、 缩写名 : com 约束 / 条件 : O 最 大 出 现 次 数 : 1 5.2.3.7.6 最大长度 定义 : 数据项取值的最大长度 英文名称 : MaxnumSize 数据类型 : 字符串 值域 : 自由文本 缩写名 : maxSize 约束 / 条件 : O 最 大 出 现 次 数 : 1 5.2.3.7.7 最小长度 定义 : 数据项取值的最小长度 英文名称 : MinnumSize 数据类型 : 字符串 DB44/T 2110 2018 8 值域 : 自由文本 缩写名 : minSize 约束 / 条件 : O 最 大 出 现 次 数 : 1 5.2.3.7.8 精度 定义 :
20、数值型数据项的精度 英文名称 : Scale 数据类型 : 字符串 值域 : 自由文本 缩写名 : sca 约束 / 条件 : O 最 大 出 现 次 数 : 1 5.2.3.8 更新时间 定义 : 更新时间 英文名称 : UpdateTime 数据类型 : 日期型 值域 : 自由文本 缩写名 : updateT 约束 / 条件 : O 最 大 出 现 次 数 : 1 5.2.3.9 数据集名称 定义 : 开放数据集的名称 英文名称 : DataSetName 数据类型 : 字符串 值域 : 自由文本 缩写名 : dataSN 约束 / 条件 : O 最 大 出 现 次 数 : 1 5.2.3
21、.10 关键字 定义 : 描述所开放数据内容概况的关键字 英文名称 : Keyword 数据类型 : 字符串 值域 : 自由文本 缩写名 : key 约束 / 条件 : O 最 大 出 现 次 数 : 1 5.2.3.11 摘要 定义 : 描述开放数据的 摘要 内容 英文名称 : Abstract 数据类型 : 字符串 值域 : 自由文本 缩写名 : abs 约束 / 条件 : O 最 大 出 现 次 数 : 1 DB44/T 2110 2018 9 5.2.3.12 数据项扩展属性 定义 : 描述数据项的扩展信息 英文名称 : ExtendAttribute 数据类型 : 复合型 缩写名 :
22、 ex Attribute 约束 / 条件 : O 最 大 出 现 次 数 : N 5.2.3.12.1 属性名称 定义 : 数据项的扩展信息名称 英文名称 : AttributeName 数据类型 : 字符串 值域 : 自由文本 缩写名 : attName 约束 / 条件 : M 最 大 出 现 次 数 : 1 5.2.3.12.2 属性值 定义 : 数据项的扩展信息数值 英文名称 : AttributeValue 数据类型 : 字符串 值域 : 自由文本 缩写名 : attValue 约束 / 条件 : M 最 大 出 现 次 数 : 1 5.3 核心元数据的扩展 5.3.1 概述 政务资
23、源在不同领域、不同行业的应用需求可能存在变化,要根据需求在应用中对本规范规定的元 数据进行补充。在进行政务资源元数据内容扩展过程中,应按照本规范规定的扩展原则、扩展要求和步 骤执行。 5.3.2 扩展原则 政务资源 核心 元数据扩展应遵循以下基本原则: a) 新建的元数据不应与本规范定义的元数据中现有的元数据实体、元素、代码、定义相冲突 ; b) 增加的元数据元素应按照本规范所确定的层次关系进行合理的组织。如果本规范现有的元数据 实体无法满足新增元数据的需要,则可以新建元数据实体 ; c) 扩展的元数据元素可组成新的基本数据类型, 但不能成为核心元数据类型 ; d) 可对元数据元素的值域施加比
24、本规范更严格的限制,即可将原值域具体化(例如:以枚举型替 代自由文本) ; e) 可对现有的元数据元素的值域进行缩小(例如,在本规范中某元数据元素的值域有 5个值,在 扩展后可规定其值域包含其中 3个值,要求用户从这 3个值中选择 1个) ; DB44/T 2110 2018 10 f) 可对元数据元素的约束 /条件和最大出现次数施以更严格的限制(例如,在本规范中定义为可 选的元数据,在扩展后可以是必选的;在本规范中定义为无限次重复出现的元数据,在扩展后 可以是只能出现 1次)。 5.3.3 扩展要求 核心元数据的扩展应符合以下 基本要求: a) 元数据扩展时,既要考虑政务资源在应用中的特点以
25、及工作的复杂、难易程度,又要充分满足 政务资源应用建设以及用户的查询、提取数据的需要 ; b) 选取的元数据不但要满足当前阶段的应用需求,更应该考虑将来一定时间内可能产生的标准化 需求。扩展过程中,要积极参考国内和国外先进标准 ; c) 扩展的元数据子集、实体或元素,应按本规范定义中文名称、定义、英文名称、数据类型、值 域、缩写名、约束 /条件、最大出现次数,并宜给出适当的例子。 5.3.4 扩展实施 对政务资源核心元数据进行扩展时,主要分为 7个步骤,如图 1所示。 ( 步 骤 1 ) 分 析 已 有 元 数 据 ( 步 骤 2 ) 定 义 新 的 代 码 表 ( 步 骤 3 ) 定 义 新
26、 的 元 数 据 元 素 ( 步 骤 4 ) 定 义 新 的 元 数 据 实 体 ( 步 骤 5 ) 定 义 更 严 格 的 元 数 据 约 束 条 件 ( 步 骤 6 ) 增 加 或 减 少 代 码 表 的 值 ( 步 骤 7 ) 元 数 据 扩 展 文 档 使 用 已 有 元 数 据 实 体 、 元 素 、 代 码 表 等 图 1. 核心元数据扩展步骤 DB44/T 2110 2018 11 6 数据 格式 6.1 概述 本部分规定电子政务数据资源开放的数据格式模型 ,用于不同系统、平台之间开放数据的信息共享 交换。 数据格式模型由数据结构和数据集组成,如图 2所示。数据结构是可选元素,元
27、素名称是 DataStructure,用来描述开放的信息内容的结构信息。数据集是必选元素,元素名称是 DataSet,用来封 装结构化数据。 图 2. 数据格式模型示意图 数据格式模型的 XML Schema见附录 A,数据格式模型封装交换指标项的 XML文件示例见附录 B,示 意 图中各图标的说明见附录 C。 6.2 数据结构 数据结构由资源代码、版本号、更新时间、更新周期、数据使用策略、版权信息、数据提供单位、 数据项、数据集名称、关键字、摘要和扩展属性 11个元素组成,其结构如图 3所示。 DB44/T 2110 2018 12 图 3. 数据结构示意图 a) 资源代码 XML元素名称:
28、 ResourceCode 说明:政务信息资源的标识符,采用 DB44/T 2109 2018中 6政务信息资源标识符编码规则。该 元素为必选元素。 b) 版本号 DB44/T 2110 2018 13 XML元素名称: Version 说明:同一政务信息资源的数据结构标识符,格式为:“数据项元素修改次数,非数据项元素 修改次数”,初始值为 0.0。当数据结构发生变化时,应该更新版本号信息。资源代码与版本 号共同确定唯一的数据资源。该元素为必选元素。 c) 更新周期 XML元素名称: UpdateCycle 说明:对数据交换频率的描述,用于对数据质量的管理。该 元素为必选元素。 d) 数据使用
29、策略 XML元素名称: DataUsagePolicy 说明:政务信息资源开放条件的分类信息。根据开放等级标准,分为无条件开放和有条件开放。 该元素为必选元素。 e) 版权信息 XML元素名称: Copyright 说明: 政务资源的版权所属单位信息 。该元素为必选元素。版权信息由 版权所属机构代码、版 权所属机构名称和版权声明 3个元素组成: 1) 版权所属机构代码 XML元素名称: CopyrightUnitCode 说明: 版权 所属机构代码,采用 GB32100-2015的规定。该元素为必选元素。 2) 版权所属机 构名称 XML元素名称: CopyrightUnitName 说明:
30、版权 所属机构名称。该元素为必选元素。 3) 版权声明 XML元素名称: CopyrightNotice 说明:对政务资源的版权声明。该元素为必选元素。 f) 数据提供单位 XML元素名称: DataProviderUnit 说明: 政务资源的提供单位信息 。该元素为必选元素。数据提供单位由提供单位 机构代码和 提 供单位 机构名称组成: 1) 提供单位 机构代码 XML元素名称: ProviderUnitCode 说明:提供单位机构代码,采用 GB 32100-2015的规定。该元 素为必选元素。 2) 提供单位 机构名称 XML元素名称: ProviderUnitName 说明:提供单位机
31、构名称。该元素为必选元素。 g) 数据项 XML元素名称: DataUnit 说明:构成数据结构的最小数据单位。该元素至少出现一次,可以出现多次。数据项由数据项 标识、数据项名称、数据类型、数据项定义、备注、最大长度、最小长度、精度 8个元素组成: 1) 数据项标识 XML元素名称: IDName 说明:数据项的唯一标识符。该元素为必选的元素。 2) 数据项名称 XML元素名称: DisplayName DB44/T 2110 2018 14 说明:数据项的名称。采用业务中惯 用的名称作为数据项名称,例如企业名称。该元素为 必选的元素。 3) 数据类型 XML元素名称: Datatype 说明
32、:数据项取值的类型,包括字符型、数值型、日期型、二进制等 4种数据类型。该元 素为必选的元素。 4) 数据项定义 XML元素名称: Definition 说明:描述数据项的含义。该元素为可选元素。 5) 备注 XML元素名称: Comments 说明:数据项的备注信息。该元素为可选元素。 6) 最大长度 XML元素名称: MaxnumSize 说明:数据项取值的最大长度,不指定表示没有最大长度限制。该元素为可选元素。 7) 最小长度 XML元素名称: MinnumSize 说明:数据项取值的最小长度,不指定表示没有最小长度限制。该元素为可选元素。 8) 精度 XML元素名称: Scale 说明
33、:数值型数据项的精度,即小数点后的位数,不指定时表示没有精度限制。该元素为 可选元素。 h) 数据集名称 XML元素名称: DataSetName 说明:政务资源 数据集的名称 。该元素为必选元素。 i) 关键字 XML元素名称: Keyword 说明: 描述 政务资源 数据内容概况的关键字 。该元素为必选元素。 j) 摘要 XML元素名称: Abstract 说明:描述政务资源 的主要内容 。该元 素为可选元素。 k) 数据项扩展属性 XML元素名称: ExtendAttribute 说明:描述数据项的扩展信息。该元素为可选元素。扩展属性由扩展属性名称和扩展属性值个 元素组成: 1) 属性名
34、称 XML元素名称: AttributeName 说明:数据项的扩展信息名称。该元素为必选元素。 2) 属性值 XML元素名称: AttributeValue 说明:数据项的扩展信息数值。该元素为必选元素。 6.3 数据集 数据集用来封装结构化数据。数据集由一个或多个数据记录组成,如图 4所示。 DB44/T 2110 2018 15 图 4. 数据集示意图 a) 资源代码 XML元素名称: ResourceCode 说明:同 6.2数据结构资源代码节点。该元素为必选元素。 b) 版本号 XML元素名称: Version 说明:同 6.2数据结构版本号节点。该元素为必选元素。 c) 数据记录
35、XML元素名称: RecordData 说明:组成数据集的基本单位,表示一条记录。例如,关系数据库表的一行,或电子表格的一 行等。数据记录由一个或多个数据项组成。该元素为必选元素。 d) 数据项 XML元素名称: UnitData 说明:组成数据记录的基本单位。例如,关系数据库表中的某个字段,或电子表格中的某个单 元格。该元素为必选元素。数据项由数 据项标识符、数据项值和数据项 3个元素组成: 1) 数据项标识符 XML元素名称: UnitIDName 说明:数据项的唯一标识符。该元素为必选元素。 2) 数据项值 XML元素名称: UnitValue 说明:数据项的值。对于二进制类型的数值应首
36、先采用 BASE64编码。该元素为必选元素。 3) 数据项名称 XML元素名称: UnitDisplayName 说明:数据项的名称。该元素为可选元素 。 7 字符集 电子政务数据资源开放的数据使用的字符集应符合 GB 2312-1980和 GB 18030-2000规定的字符集。 8 版权 声明 DB44/T 2110 2018 16 8.1 概述 政 务资源信息所有者对开放的数据的版权进行声明,并声明相关的使用政策以及法律责任。 8.2 声明要求 政务资源信息所有者在开放数据时,必须明确各部门所采集与开放的数据的版权问题,其中包括版 权发布方、数据授权方式、免费获取说明、商业使用说明、署名
37、及授权等内容。根据侵权行为对社会的 负面影响程度,对侵犯版权行为进行相应的处置。 9 数据使用策略 9.1 概述 政务资源信息提供者和管理者 需根据数据资源的开放条件,明确数据的使用策略。 9.2 数据开放等级标准 政务资源信息经过敏感性评估后分为两种开放等级标准 :一种为无条件开放(经审核开放的数据没 有 附加条件直接开放,公众可自由浏览、下载、使用);一种为有条件开放(经审核开放的数据有附加 条件开放,获得授权、登记用户基本信息及数据用途等基本情况后方可浏览、下载、使用)。 10 数据更新 10.1 概述 政务资 源信息在更新数据时,需要以资源代码和版本号作为与旧数据项或记录对应的唯一标识
38、。 10.2 更新规则说明 政务资 源信息在更新数据时,遵循以下规则: a) 根据 DB44/T 2109 2018中 6 政务信息资源标识符 编码的规定,具有相同资源代码的数据集为 相同政务信息类别的信息内容 ; b) 同一个政务信息资源,由于更新周期、版权信息以及数据项等 核心元数据的不同会分别对应不 同的版本号。更新数据时需根据不同版本号的核心元数据信息,调整数据更新的逻辑,以及数 据的相关使用策略。 10.3 数据更新模式 在描述政务资源信息的更新周期时(见 5.2.3.3),必须明确以下几点信息: a) 实时性:须明确数据更新频率是实时更新还是周期更新 ; b) 更新期限:如果是周期
39、更新数据,必须明确具体的更新时间节点,例如每月 1日的 00:00:00; c) 更新方式:须明确数据更新方式是增量更新还是全库更新。 11 数据质量要求 按照 DB44/T 2111 2018,政务资源信息开放的数据质量需满足: 完整性 、一致性、准确性、及时 性 : a) 数据完整性是指数据的精确性和可靠性。它是应防止数据库中存在不符合语义规定的数据和防 止因错误信息的输入输出造成无效操作或错误信息而提出的。数据完整性分为四类: 实体完整 DB44/T 2110 2018 17 性 、 域完整性 、 参照完整性 、 用户自定义完整性 。例如数据信息是否存在缺失的状况,数据缺 失的情况可能是
40、整个数据记录缺失,也可能是数据中某个字段信息的记录缺失 ; b) 数据一致性通常指关联数据之间的逻辑关系是否正确和完整。数据提供方的源头数据和开放数 据之间的数据保持状态以及值域、格式规范的一致。同时, 也包括数据是否 遵循 DB44/T 2111-2018规定,数据编码是否遵循 DB44/T 2109-2018规定, 数据集合是否保持了统一的格式 ; c) 准确性也叫准确度,指数据记录的信息是否存在异常或错误,如字符乱码,数值异常的大或者 小,以及与现实信息保持一致 ; d) 及时性是指数据从产生到可以开放查看的时间间隔,也叫数据的延时时长。根据 5.2.3.3更新 周期元数据的描述判断是否
41、符合数据及时性的要求。 DB44/T 2110 2018 18 附 录 A (规范性附录) 数据格式 XML Schema 数据格式模型 数据结构 数据集 更新周期 数据使用策略 DB44/T 2110 2018 19 版权信息 数据提供单位 数据项 数据集名称 关键字 摘要 扩展属性 数据项标识 DB44/T 2110 2018 20 数据项名称 数据类型 数据项定义 备注 最大长度 最小长度 精度 名称 DB44/T 2110 2018 21 属性值 数据记录 数据项 提供单位机构代码 提供单位机构名称 DB44/T 2110 2018 22 版权所属机构代码 版权所属机构名称 版权声明
42、数据 项标识符 数据项值 数据项名称 资源代码 版本号 DB44/T 2110 2018 23 DB44/T 2110 2018 24 附 录 B (资料性附录) 数据样例 GD023/Z03B0IA010000100102D0011 0.0 每年 1月 1日 00:00:00 有条件开放 006939932 广东省国土资源厅 本数据集版权归广东省国土资源厅所有 006939932 广东省国土资源厅 GD023/Z03B0IA01000010010200011 DB44/T 2110 2018 25 序号 数值型 GD023/Z03B0IA01000010010200021 矿产名称 字符型 GD023/Z03B0IA01000010010200031 种类 字符型 勘查并已探明 的矿产地 矿产、勘查 广东省范围内已经过勘查探明的矿产地信息。 数据集格式 xlsx DB44/T 2110 2018 26