GB T 20533-2006 生态科学数据元数据.pdf
《GB T 20533-2006 生态科学数据元数据.pdf》由会员分享,可在线阅读,更多相关《GB T 20533-2006 生态科学数据元数据.pdf(214页珍藏版)》请在麦多课文档分享上搜索。
1、ICS 35.240 A 24 中华人民共和国国家标准GB/T 20533-2006 生态科学数据元数据离1etadatafor ecological data 20邸,09-18发布中华人民共如国国家盾量监督检撞撞菇总局中国国家标准化苦理委员会2007-03-01实施发布GB/T 20533-2006 目次前言引言-a a-., - E 1 范围2 规范性应用文件3 术语和定义- 4 符号和缩略语. . . 4 4. 1 缩略语. . 4 4. 2 UML模型符号 . 4 4. 3 UML模型关系 5 4. 4 UML模型构造型. . ., 5 5 一致性. 叼.6 6 约定, 6 6 1
2、元数据基本属性. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 6 2 UML模型图. ,. .,. . . 7 6. 3 XML Schema和名称空间. . . . . . . . . . . . . . . . . . . 7 6. 4 数据字典- . 7 7 要求. . . 7 7 1 生态科学数据对元数据的要求- 7 7. 2 元数据包. 8 7. 3 元数据数据类型. 10 7.4 生态科学数据核心元数据. 11 7. 5 元数据扩展和元数据成用专规.11 7. 6 元数据应用专规示例,. . . 1
3、1 7 7 元数据实施. 11 8 元数据模式. . . . . . . . . . . . . . . 11 8 1 元数据包. . . . . . 11 8 2 元数据数据类型. - 19 附录AC规范性附录)数据字典,.,. 22 附录趴规范性附录)元数据扩展和元数据应用专规. 86 附录CC规范性附录)抽象测试套件- 的附录0(规范性附录)数据集全集元数据应用专规.,. . .- 91 附录E(规范性附录)核心元数据.,.188 附录F(资料性附录)元数据应用专规示例, . .- 189 附录GC资料性附录)元数据应用专规制定方法 . 207 附录H(资料性附录)元数据实施 . 209
4、 参考文献. 210 GB/T 20533-2006 前言本标准的附录A、附录B、附录C、附录D和附录E为规范性附录,附录F、附录G和附录H为资料性附录。本标准由中国科学院“科学数据库及其应用系统”和“中国生态系统研究网络”支持编制。本标准由中国科学院提出。本标准由全国信息分类编码标准化技术委员会归口。本标准起草单位:中国科学院计算机网络信息中心、中国科学院地理科学与资源研究所、中国科学院南京土壤研究所、中国科学院水利部水土保持研究所、中国科学院寒区早区环境与工程研究所、中国科学院水利部成都山地灾害与环境研究所、中国科学院东北地理与农业生态研究所。本标准主要起草人:黎建辉、肖云、于贵瑞、侯艳飞
5、、胡良霖、施建平、何洪林、董济农、郭明航、虞路清、张耀南、陈斌如、赵军、王闰强、刘宁、高美荣。本标准为第一次制定。GB/T 20533-2006 引言伴随着人类对人与自然协调发展重要性认识的加深,生态学受到越来越多的关注,并成为当前科学研究的热点学科。现代科学研究的一个特点是数据成为科学研究和科学发现的重要基础,在生态学领域亦是如此。随着生态科学研究的发展和信息技术的进步,生态科学数据在迅速增长。然而目前与此并存的另一现象是,科研人员在实际的研究工作中往往感觉到所需数据的匮乏。很多时候,这种匮乏并不是因为所需的数据尚不存在,而在于这些数据难以发现、难以获取和缺乏可用性。这也是我国及其他很多国家
6、大力开展和推进科学数据共享活动的缘起。在造成上述不协调现象的诸多因素中,元数据的缺乏和不规范是制约科研人员发现、管理和使用生态科学数据的主要原因之一。元数据是关于数据的数据,用于说明数据的内容、品质、产生过程和背景、访问和获取方式以及其他有关特征。从数据的使用来看:a) 数据生产者可能在数据产生很长时间之后去使用或重用它们;b) 数据的生产者并非总是数据的使用者,数据生产者以外的人员使用数据的需求日益强烈,尤其是对长时间序列、大尺度和综合性生态研究来说,这样的需求更显而易见。适当的元数据能帮助数据生产者以及数据生产者以外的用户更快地发现所需要的数据,更好地了解其内容和限制,评估其对于应用需求的
7、适用性,并恰当地获取和使用它们。同时,由于数据生产者和用户都需要处理越来越多的数据,元数据能为他们提供关于这些数据的关键知识,帮助其有效地保存、管理和维护这些数据,提高效率,且使数据生产单位能够不受人员变动的影响,防止数据资产的流失,维护单位和国家的有关投资。另外,在生态科学数据中,很多数据特别是观测数据的产生具有不可重复性,为保证它们不被误用和在将来可肘,尤其需要详细地说明数据产生的方法和条件。元数据允许数据生产者对这些信息进行完全的记录,以便这些数据小因时间的流逝而丧失可用性。本标准的目的是提供一个口I扩展的、用于描述和归档管理生态科学数据的概念数据模型。该模型将生态科学数据的特征归纳为1
8、0类:标识信息L、数据质量信息、方法信息、场地信息、项目信息、分发信息、元数据参考信息、实体信息、空间参照系信息和空间表示信息。本标准的实施将促进生态科学数据的高效保存、管理和维护,促进它们为科研人员、其他用户或者软件程序等的检索、评价、获取和使用,促进生态科学数据的共享和交换。IT GB/T 20533-2006 生态科学数据无数据1 范围本标准定义了个在数据集层次上描述生态科学数据的概念模型,统定了构成该模型的一组必迭的、条件必选的和可选的元数据子集、元数据实体和元数据元素,提供了对该模辈革前形式化描述。本标准还规定了各种需求层次的元数据应用所需要前最小元数据元素集简称为核心元数据,以及规
9、定了为满足特殊需求对元数据进行扩震和ilitJ寇元数据应用专就能规则和方法。本标准中的生态科学数据包括生态观测、调查、试验等生态科学研究活动中所产生的原始基本数据,也包括根据科研需求对原始基本数据进行施工整理而形成的数据,既可以是数字化约,也可以是非数字化的。本标准适用于生态科学数据集和数据集系列的编自和结述、数据集和数据集系列的组织管理,也可用于数据交换中心始数据服务。本标准期望为生态科学数据生产者、数据管理者、数据管理系统分析和设计人员以及与数据生产、组织管理、服务或使用有关的其他人员既使用,以便理解生态科学数据元数据标准化的基本原理和总体要求。尽管本标准主要用于生态科学数据集,但其原理可
10、以扩展到其他领域的科学数据资源。通过定义一个通用的概念模型,本标准保证各元数据实施之间有较高程度的活义互操作位,但是,本标准并没有规定元数据在一个信息系统中具体如何实施2 支重建性应用文伶下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注目期的引用文件,其撞在后所有的修改单(不包括勤误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件豹最新版本。凡是不注R期的引用文伶,其最新版本运用于本标准GB/T 2659 世界各属和地区名称代码(GB/T2659-2号00,吨vISO 31661,1997) GB 3102. 1 1993 空间和对间的量和单
11、位(eqvISO 31 1 :1992) GB/T 4880 1991 诸种名称代码也qvISO 639,1988) GB/T 7408 1994数据元和交换格式信息交换日期和时间表示法(eqvISO 8601 :1988) GB/T 7714-2005 文后参考文献著录娩则(ISO690, 1987, Documentation Bibliographic refer ences Con乞ent,form and struc四re;ISO 6902,1997, Information and documentation-Bibhographic references Part 2, Elec
12、tronic documen臼orparts thereof, NEQ) GB/T 18391. 3 2001信息技术数据元的规范与标准化第3董事分2数据元的基本属性(idtISO/IEC 11179-3:1994) GB/T 19710 2005地理信息无数据(ISO19115, 2003, MOD) ISO/IEC 19501,20岱信息技术开放的分布式处理统一建模语言(UML)V盯sion1. 4. 2 W3C Recommendation XML Schema 1. 1, 2004 3 术语和定义下列术语和定义适用于本标准。3. 1 到i衰重要在据tabular垂ata以表格或类表格形
13、式存在的数据合GB/T 20533-2006 3.2 3.3 3.4 3.5 3.6 3. 7 3. 8 3. 9 极格数据rasterdata 接栅格单元的行和列排列的、有不同灰皮值或颜色翻阵列数据。矢量数据vec如rdata 以坐标字表示的空间点、线、军军等几何数据及与其稳联系的有关属绞数据部总称。敛据集dataset可以识到的数据集合。注1,通过对诸如覆盖范医或者属性类型的窥制,数据集在场理上可以是更大数据集中的一个注较小的数据墨,注2,改写GB197102号码,定义毛孔数据集系列也taset提到es符合相同产品辈革范的数据集部集合。GB/T 19710 20馅,定义哇,3数据实体da坦
14、entity包含数据内容始一个逻辑的或物理的存储单元。伊j如,文本文件、关系数据库数据表、电子表格、GJS层等。注2一个数据集可能自个或多个数据实体毯成。无数据皿etadata主主义和播述其他数据的数据。 GB/T 18391. 1,定义3.41无数据实例皿姐datainstance 与某元数据模式梧符的某一具体数据资源豹元数撞击。无数据元素n姐姐dataelement 元数据凶基本单元。二GB/T1710-2005,定义4.在注1,与UML术语中的属性凋义。注2,元数据元素在元数据实i体中是难一鹅e3. 10 元戴握实体metadata entity 一组说明数据相同特俭的元数据元素。GB1
15、9710 2005,定义4.7注1,可以包含一个或多千元数据实体。注2,与UML术语中的类同义e3. 11 2 元数据子集metad晦阳tion 元数据的子集合,由相关的无数据实体和元素组成。GB/T 19710 2005,主主义4.8二这z与UML术语中剖包离义。GB/T 20533-2006 3. 12 无数据注册系绞metadata registry 登记和发布元数据的语义、结构、交换格式等的权威信息的可公开访问的系统。3. 13 元敛握应用专魏阳tadataapplication profile 为特定应用定义约元主主主言元素、规则奉军指南幸亏一个集合,这些元数据元素来自一个或多个已有
16、的元数据标准,还可以包括用户自定义必元数据元素。3. 1唾编码体系encoding挺机me提供语埃信息或句法分析规则,以帮骂主对元数据元素总值透行解释位受控词表或者格式规范。注g编码体系包括词汇编码栋系和勾法编码簿系。3. 15 渴汇编码体系voca每骇laryencoding目:heme作为元数据元素值域的受控请表。费苦如,汉语主题混表、世界各昌和地区名称代码表等。3. 16 句法编码体系syntaxencodir理scheme元数据元素的筐在格式主遵从的正式表示法。例如,“200001 01”作为日期的标准表示3. 17 名称空揭nar础pace名称的集合,以统一资源标识符(URD标识。注
17、z作为定立名称的活境,名称空降是解决不同来露幸亏词汇之薄的名称冲突问题的革中税制,3. 18 数据类型da幅type有效值域和允许对该值域内的值进行的合法操作的规定。例如,整整、实墨、布尔型、字符串、写真吕以及本标准中吕定义必数据类型等。注1,数据类型包括基本预定义类婆和用户定义的类型。注2,数据类型用本语标识,例如整望。注3,改写GB/T19710 2号。5,定义4.I. 3. 19 3.20 3.21 筐域吨luedomain 允许值的集合。概念模式回到甜Pt昭schema概念模型的形式化描述。概念模型con世:pt四1醋。de!定义一个论域的概念上韵模型。3.22 论域盟主iverseo
18、r discourse 一场讨论或辩论中所涉及的所有实体祷成的范畴。3 GB/T 20533-2006 3.23 模式schema模拟的形式化描述。3.24 模型model 对论域某将方面的抽象。3. 25 鼓据模型data model 以反映夜息在商构的某种方式对放报绷织的恼i盘。注2数据模型指明数据的腐性、结构和内在关罩3.26 数据交换中,bcl阳ringhonse收集和发布数据资源的元数据提供对分布式数据资源的统一王军询和定位的一站式服务系统。3.27 资源resource 具有身份粉1识的任何如t.例如,数据集、服务、人员或机构等。4 符号和铺路语4. 1 8暗自串i蕃HTML 超文
19、本置标诺诺(HypertextMarkup Language) MAP 元数据应用专规(MetadataApplication Profile) MDR 元数据注册系统(MetadataRegistry) SGML 标准通Y!l:ll量标语言(Sfandard Generaliied Markup Language) UML 统盖章模谣言(UnifiedModeling Language) URI 统一资源标识符(UniformResource !ndentifier) XML I可扩艇量的王词吉普f因1UML符号4 GB/T 20533 2006 UMLOO巾的某部分有替罪5纷出补充说明成明
20、确的解释时,泼将会很有用。E可以j巴淀粉墙音成给自自形化的主主贺,补充性或解释性的文字写在表示注释的带折角矩形框中。注稼和被注释的图元素之间用条直撞线“”走H亮。4. 3 UML模型关系a) 关联关联网于描述附个或更多类之间的一般关系。关联的方向必须说明。如果不指明方向,则假定为双向关联。如果是单向关联,关联方向可以在线段终点ffl箭头来标记。b) 聚合然食用于创建问个炎之间的部分与理媒体的关系。;(在关系咐,个主题ill辛苦苦角色,另个类m容器的构f牛角色。聚集的表示法是从“部分”类画一条带空心菱形箭头的实线指向“整体”类。c) 泛化泛化表泳父3是(或直益型运)和可以辛辛代它的子奖之间的关系
21、。父3位是泛化类而f类则定义为特化类。泛化的表示法是从子3是顾条丰营效心三角箭头的实线指向父炎。d) 依赖依赖用来表示对包(元数据子集)的理解、使用等依赖其他的包(元数据子集。依赖的表示法是从依赖炎证到一条带箭头的威线指向被依赖炎。e) 角色两个类发生关联时,每个类通常在虽已联中都扮演辛苦某种角色。UML梳理卫巾吁以使用“角色名称”标明目标对象到源对象的关系。在双向关联中,将提供两个角色名称。图2说明了在UML图中如何司提那角色4I称和黎数。一辈图2UML角色网2中,角色名称“角色1”是类1对类2的关系,“角色2”是类2对类l的关系,“蒙数1”表示类l有多少个对象洲炎2的岛生个对象关联.在数2
22、”斗捷尔炎2有多少个对象和虽是1的直在个x提版。基数的取债可以是个正憨数n(例如,“1”、“2飞“3勺,也可以是“0. n”、句”、“”、“m.n”(m小于川,还可以烧、z,n”Cm小于川。其巾,m平日n者J盖确泛的iE粮数;“”代农许多、多个,“”在“0.”、“ n. ”话境中表示“或”,例如,基数l为“0.”表示类1的0个或多个对象与类2的1个对象关联,基数1为“1.”表示类1的1个或多个对象与类2的1个对象当主耳其;“,”夜“o.”、勺n. n”i话境巾表泳“到”,例如,基数1句“1.3”装示类1的1个、2个或3个对象与类2的1个对象关联户,”表示“或,例如,基数1为“2,4”农那型号1
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 20533 2006 生态科学 数据
