DB 6502 T004.1-2022 数字克拉玛依 数据元规范 第1部分:总则.pdf
《DB 6502 T004.1-2022 数字克拉玛依 数据元规范 第1部分:总则.pdf》由会员分享,可在线阅读,更多相关《DB 6502 T004.1-2022 数字克拉玛依 数据元规范 第1部分:总则.pdf(18页珍藏版)》请在麦多课文档分享上搜索。
1、ICS 35.020CCS L 72克拉玛依市地方标准DB6502/T 004.12022数字克拉玛依 数据元规范第一部分:总则2022-05-20 发布2022-06-20 实施克拉玛依市市场监督管理局发 布DB6502Digital KaramaySpecification for Data ElementsPart 1:GeneralDB6502/T 004.12022I目次目次.I前言.II1 范围.12 规范性引用文件.13 术语和定义.14 数据元的表示规范.34.1 数据元的属性概述.34.2 数据元属性的描述方法.44.3 数据元标识类属性.44.4 数据元定义类属性.64.5
2、 数据元表示类属性.74.6 数据元管理类属性.104.7 数据元附加类属性.105 数据元的设计方法.105.1 数据元和数据元属性的提取.105.2 数据元的分类规则.115.3 数据元的命名规则.116 数据元管理.126.1 基本原则.126.2 要求.127 数据元的维护和扩展方法.137.1 数据元维护策略.137.2 新增数据元.137.3 变更数据元.137.4 废止数据元.138 数据元的使用方法.13参考文献.15DB6502/T 004.12022II前 言本文件按照GB/T 1.12020标准化工作导则 第 1 部分:标准化文件的结构和起草规则的规定起草。DB6502/
3、T XXXX数字克拉玛依 数据元规范分为9个部分:第 1 部分:总则;第 2 部分:综合人口数据元;第 3 部分:综合法人数据元;第 4 部分:空间地理数据元;第 5 部分:疫情防控数据元;第 6 部分:应急管理数据元;第 7 部分:社会信用数据元;第 8 部分:社会民生数据元;第 9 部分:宏观经济数据元。本文件为数字克拉玛依 数据元规范的第 1 部分。本文件由数字克拉玛依综合协调领导小组提出。本文件由克拉玛依市工业和信息化局归口。本文件起草单位:克拉玛依油城数据有限公司、克拉玛依市公安局、中国电子系统技术有限公司、红有软件股份有限公司、中科天极(新疆)空天信息有限公司、新疆简正智信标准化服
4、务事务所(有限公司)本文件主要起草人:刘东、臧奕茗、王从发、潘元鹏、何芳、冯建平、徐祺、张锐、刘敏。DB6502/T 004.120221数字克拉玛依 数据元规范 第一部分:总则1范围本文件规定了数字克拉玛依 数据元规范的术语和组成、数据元和代码集的表示规范、数据元的设计方法、数据元管理、数据元的维护和扩展方法、数据元的使用方法。本文件适用于数字克拉玛依 数据元的编制、管理、使用和扩展。2规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 7408 数据元和交换模式
5、 信息交换 日前和时间表示法GB/T 17295 国际贸易用计量单位代码GB/T 18391.1-2009 信息技术 元数据注册系统(MDR)第一部分:框架GB/T 19488.1-2004 电子政务数据元 第1部分:设计和管理规范GB/T 35295-2017 信息技术 大数据 术语3术语和定义下列术语和定义适用于本文件。3.1数字克拉玛依 digital karamay以云计算、大数据、人工智能、互联网等数字技术为依托,汇聚、整合、利用克拉玛依市各领域数据资源,集城市管理、社会服务、公共交通、卫生健康、房屋管理、文化旅游、应急管理、环境保护等各类数据信息的应用,实现克拉玛依市“用数据说话、
6、用数据决策、用数据管理、用数据创新”的数字城市管理和服务的新模式,让广大市民从数字城市发展中享有更多获得感、幸福感、安全感。3.2数据 data信息的可再解释的形式化表示,以适应于通信、解释或处理。注:数据可以由人工或自动的方式加工、处理。来源:GB/T 18391.1-2009,3.2.63.3大数据 big data具有体量巨大、来源多样、生成极快、且多变等特征并且难以用传统数据体系结构有效处理的包含大量数据集的数据。注:国际上,大数据的 4 个特征普遍不加修饰地直接用 volume、variety、velocity 和 variability予以表述,并分别赋予了它们在大数据语境下的定义
7、:a)体量 volume:构成大数据的数据集的规模;b)多样性 variety:数据可能来自多个数据仓库、数据领域或多种数据类型;c)速度 velocity:单位时间的数据流量;DB6502/T 004.120222d)多变性 variability:大数据其他特征,即体量、速度和多样性等特征都处于多变状态。来源:GB/T 35295-2017,2.1.13.4数据元 data element由一组属性规定其定义、标识、表示和允许值的数据单元。注:数据元在特定的语义环境中被认为是不可再分的最小数据单元。数据元一般来说由对象类、特性和表示三部分组成:a)对象类:思想、概念或真实世界中的事物的集合
8、,它们具有清晰的边界和含义,其特征和行为遵循同样的规则。对象类是人们希望研究、搜集和存储它们的相关数据的事物;示例 1:汽车、人、房屋、订单等。b)特性:对象类中的所有成员共同具有的有别于其他的、显著的特征。特性是用来区分和描述对象的手段;示例 2:颜色、性别、年龄、收入、地址等。c)表示:描述了数据被表达的方式,表示与数据元的值域关系密切。一个数据元的值域指数据元的所有允许值的集合。示例 3:对于“个人所得税金额”这个数据元,它的值域可以是一系列非负整数(带有货币单位),这是一种非枚举型的值域,而“个人所得税比率”对收入进行分段划分,并给每一段赋予一个比率,它的值域就是这些比率的集合,此时称
9、它的值域为枚举型值域。来源:GB/T 18391.1-2009,3.3.8,有修改3.5元数据 metadata定义和描述其他数据的数据。来源:GB/T 18391.1-2009,3.2.163.6属性 attribute某个对象或实体的一种特性。来源:GB/T 18391.1-2009,3.1.13.7值域 value domain允许值的集合。来源:GB/T 18391.1-2009,3.3.383.8中文首拼 chinese first fight中文首拼是在数据应用中对数据元的统一标识。中文首拼由该数据元中文名称中每个汉字的汉语拼音首字母(不区分大小写)组成,如果按照以上规则,不同数据
10、元的标识符若出现重复,则在后面加 0199 予以区别。3.9内部标识符 Internal identifier在一个管理部门内由管理部门自行分配的,与语言无关的数据元的唯一标识符。3.10类目 categoriesDB6502/T 004.120223把具有某种共同属性或特征的信息归并在一起,把具有不同属性或特征的信息区别开来的过程。3.11提交机构 submitting body对数据元提出新增、变更或废止的机构或个人。3.12政务部门 government affairs departments政府部门及法律法规授权具有行政职能的事业单位和社会组织。3.13管理部门 management标
11、准化行政主管部门授权对政务数据元实施注册、维护和管理功能的组织。3.14应用部门 application department因履行职责需要使用其他政务部门(3.12)的政务信息资源和为其他政务部门(3.12)提供政务信息资源的政务部门(3.12)。4数据元的表示规范4.1数据元的属性概述数据元的表示规范是通过对其一系列属性的描述来实现的,这些属性即是数据元的元数据。表1给出了数据元的五大类属性。表 1 数据元的五大类属性属性类别属性名称是否必选属性说 明标识类属性内部标识符是标识类属性是用于标识数据元的一类属性中文名称是英文名称否中文全拼是中文首拼是版本否定义类属性说明是定义类属性是描述数据
12、元语义方面的一类属性对象类词否特性词否表示类属性表示词否表示类属性是描述数据元表示方面的一类属性数据类型是表示格式是值域是计量单位是管理类属性状态否管理类属性是描述数据元管理与控制方面的属性提交机构是附加类属性备注是附加类属性是描述上述属性以外的其他属性DB6502/T 004.1202244.2数据元属性的描述方法下面的描述符是对数据元属性的描述:a)名称赋予数据元属性的标记,名称是唯一的,名称以字符型表示。b)说明属性的描述,可使一种属性与其他属性清晰地区别开来,定义以字符型表示。c)约束显示一个属性是始终还是有时出现的描述符,该描述符有必选和可选两个取值,前者表示该属性必须出现,后者表示
13、该属性是否出现可选。d)出现次数显示一个属性出现多少次的描述符,该描述符有以下四种情况:01(表示不出现或出现 1 次),0n(表示不出现或出现多次),11(表示出现且仅出现 1 次),1n(表示出现 1 次或多次)。e)类型描述属性的所有取值的类型。示例:字符、数值、日期、时间、日期时间和二进制。f)规则数据元属性的命名和分配规则。g)备注与属性应用有关的注释。4.3数据元标识类属性4.3.1名称:内部标识符定义:在一个管理部门内由管理部门自行分配的,与语言无关的数据元的唯一标识符。约束:必选。出现次数:11。类型:字符型。规则:数据元内部标识符由两位大写罗马字符和6位阿拉伯数字组成,规则如
14、下:a)第一部分为信息资源分类码,用从A开始依次递增的一位大写罗马字符表示;分为:综合人口数据元、综合法人数据元、空间地理数据元、疫情防控数据元、应急管理数据元、社会信用数据元、社会民生数据元和宏观经济数据元 8 大类,详见表2。表 2信息资源分类码序号信息资源中文信息资源英文信息资源缩写数据元首位编码1综合人口数据元PopulationRKA2综合法人数据元CorporateFRB3空间地理数据元SpaceKJC4疫情防控数据元Epidemic preventionand controlEQDDB6502/T 004.120225表 2信息资源分类码(续)序号信息资源中文信息资源英文信息资源
15、缩写数据元首位编码5应急管理数据元EmergencyEJE6社会信用数据元CreditXYF7社会民生数据元LivelihoodMSG8宏观经济数据元Macro-economyJJHb)第二部分为政务信息资源数据元的二级分类,用从01开始递增的2位阿拉伯数字表示;d)第三部分为二级分类下,数据元的顺序码,用从 0001 开始递增的4位阿拉伯数字表示,详见图1;顺序码,4 位阿拉伯数字二级分类,2 位阿拉伯数字一级分类,1 位大写罗马字符信息资源分类码,1 位大写罗马字符图 1 内部标识符表示方式e)内部标识符一旦赋予不得复用。备注:无。4.3.2名称:中文名称定义:赋予数据元的单个或多个中文字
16、词的指称。约束:必选。出现次数:11。类型:字符型。规则:a)在一定语境下数据元的名称应唯一;中文名称由一个对象类词、一个特性词和一个表示词组成,其顺序为:中文名称对象类词特性词表示词;b)中文名称中应只有一个对象类词、特性词和表示词;c)当表示词与特性词有重复或部分重复时,可将名称中冗余词省略;d)中文名称尽量与权威名称保持一致。备注:无。4.3.3名称:中文全拼定义:数据元中文名称的汉语拼音。DB6502/T 004.120226约束:必选。出现次数:11。类型:字符型。规则:数据元的中文全拼是用“-”连接中文名称中的每一个汉字的拼音,全部用小写。备注:无。4.3.4名称:中文首拼定义:数
17、据元中文名称的汉语拼音的首字母。约束:必选。出现次数:11。类型:字符型。规则:中文首拼全部使用大写字母。备注:无。4.3.5名称:英文名称定义:赋予数据元的单个或多个英文字词的指称。约束:可选。出现次数:01。类型:字符型。规则:英文名称优先采用权威来源。备注:无。4.3.6名称:版本定义:用于本文件在正式发布后和下次修订发布期间,数据元应用部门和管理部门内部版本管理的标识。约束:可选。出现次数:01。类型:字符型。规则:a)版本是由阿拉伯数字字符和小数点字符组成的字符型,本文件实施后,版本定为 1.0。b)版本号变更的原则为:1)数据元的必选属性发生变化时,无论非必选属性是否变化,则小数点
18、字符前的数字字符加1,小数点字符后的数字归0;2)数据元的必选属性不变而非必选属性发生变化时,则小数点字符前的数字字符不变,小数点字符后的数字加1。示例:某数据元的版本号为 1.0,当数据元第一次修订时,其必选属性发生变化而非必选属性不变,则该数据元的版本为2.0;当该数据元第二次修订时,其必选属性不变而非必选属性发生变化,则该数据元的版本为2.1;当数据元第三次修订时,其必选属性和非必选属性同时发生变化,则该数据元的版本为 3.0。备注:无。4.4数据元定义类属性4.4.1名称:说明DB6502/T 004.120227定义:是用描述性的短语或句子对一个数据元所作的解释。约束:必选。出现次数
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DB 6502 T004.1-2022 数字克拉玛依 数据元规范 第1部分:总则 T004 2022 数字 克拉玛依 数据 规范 部分 总则
