GB T 29181-2012 术语工作 计算机应用 术语信息置标框架.pdf
《GB T 29181-2012 术语工作 计算机应用 术语信息置标框架.pdf》由会员分享,可在线阅读,更多相关《GB T 29181-2012 术语工作 计算机应用 术语信息置标框架.pdf(48页珍藏版)》请在麦多课文档分享上搜索。
1、ICS 0 1. 020 A 22 道B中华人民共和国国家标准GB/T 29181-2012月SO16642: 2003 术语工作计算机应用术语信息置标框架Computer applications in terminology一Terminological markup framework (ISO 16642: 2003 , IDT) 2012-12-31发布2013国06-01实施ks/俨产总d矿郁吨中华人民共和国国家质量监督检验检亵总局也士中国国家标准化管理委员会Q(.IJ 7号-,-0-,一/叮叮江主VJ/ GB/T 29181-2012月SO16642: 2003 目次前言.皿1
2、范围.2 规范性引用文件-3 术语和定义.4 术语信息置标的一般原则与互操作性原则.3 5 语言数据描述的一般模型及其在术语工作中的应用.55.1 导论55.2 结构层次和信息单元的一般表示.7 5.3 术语信息的元模型.8 5.4 以元模型为基础设计术语数据的表示形式5.5 交换、发布和互操作性.5.6 一般模型的XML规范表示.5.7 术语数据集中各种语言的表示法.15 6 定义TML. . 16 6. 1 概论.16 6.2 互操作性条件的定义.16 6.3 TML的实现.17 附录A(规范性附录)GMT格式的XML描述方案.20 附录B(规范性附录)MSCTML . 22 B. 1 简
3、介. 22 B. 2 MSC XML文挡的例子. 22 B. 3 扩展树. 24 B.4数据类目 25 且5结论. . 26 附录C(规范性附录)Geneter TML . 27 C.1 简介.27 C.2 范例z作为TML的Geneter子集的规范.27 C.3 GI 29 C.4 TE 29 C.5 CI . 36 C.6 Geneter 限制和扩展.37 附录D(资料性附录)术语数据与TMF的一致性.40 D.1 概要.40 D.2 示例术语数据.40 D.3 元素内容的描述.41 D.4 与TMF一致.41 GB/T 29181-2012月SO16642: 2003 前言本标准按照GB
4、/T1. 1-2009给出的规则起草。本标准等同采用ISO16642: 2003(术语工作计算机应用术语信息置标框架。本标准代替GB/T16642-2003(术语工作计算机应用术语信息置标框架。与标准中规范性引用的国际文件有一致性对应关系的我国文件如下z一-GB/T15237.1-2000(术语工作词汇第1部分z理论与应用)(eqvISO 1087-1: 2000)。一-GB/T16786-2007(术语工作计算机应用数据类目(ISO12620:1999,NEQ)。一-GB/T17532-2005(术语工作计算机应用词汇)(lSO1087-2:2000,MOD)。本标准由全国术语与语言内容资源
5、标准化技术委员会(SAC/TC62)提出并归口。本标准起草单位E中国标准化研究院。本标准主要起草人z程永红、周长青、于欣丽、肖玉敬、王海涛、刘智洋、苟恩东。阳皿GB/T 29181-2012月SO16642: 2003 1 范围术语工作计算机应用术语信息置标框架为了对术语数据集合中所记录的数据进行表达和描述,本标准针对需要使用的基本原则规定了具有指导作用的框架。该框架包括了元模型和用XML表示的特定术语标记语言(TML)的描述方法。本标准对TML中限定标记的使用方法作了定义,但除了附录B附录D所定义的三种TML之外,本标准并没有为其他TML定义专门的限定标记。本标准适用于计算机应用程序的开发和
6、使用,其目的是有利于处理术语数据以及在不同应用程序之间进行术语数据交换。它并不是对ISO12620及其他相关国际、国家标准中所规定的数据类目和数据结构规范的方法进行标准化。本标准还定义了可以使一种以TML表示的数据映射到另一种TML上的条件,并规定了相应的通用映射工具(GMT)(见附录A)。此外,本标准定义了对语言数据进行描述的一种通用性模型。2 规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单适用于本文件。ISO 1087-1: 2000术语工作词汇第1部分z理论与应用(Terminol
7、ogywork-Voca bulary Part 1: Theory and application)。ISO 12620: 1999术语工作计算机应用数据类目(Computerapplications in terminology Data categories)。ISO 1087-2: 2000术语工作计算机应用词汇(Terminologywork-Vocabulary-Part 2: Computer applications)。3 术语和定义3. 1 3.2 以下及ISO1087-1 :2000, ISO 1087-2 :2000界定的以及下列术语和定义适用于本文件。补充信息compl
8、ement町information;CI 对术语条目中所描述的内容予以补充,并在术语数据集合中共事的信息。注2领域层级关系、机构描述和参考文献信息都是补充信息的典型例子。敢据类目data cat唔0叮关于给定数据宇段的类型说明。ISO 1087-2:2000,6.14J 注1:一个数据类目是一种数据字段类型,如定义。注2:ISO 12620:1999是数据类目的目录,也就是一种DCR(见3.3户.1 GB/T 29181-2012月SO16642: 2003 3.3 3.4 3.5 3.6 数据类目注册库data category registry; DCR 为了对TML予以描述而被用作规范性
9、参考文件的数据类目规范。注:ISO 12620: 1999在本标准的话语环摸中是一个典型的DCR.数据类目选集data categoselection ; DCS 限定信息内容范围并构成TML说明的组件。注z信息内容可以受到限制,例如通过规定允许使用的数据类目种类以及各个数据类目的使用方法等.扩展树expansion tr臼在某给定TML中,构成元模型某个层面的一组XML元素及其结构关系所形成的列表。通用映射工具generic mapping tI;GMT 术语信息置标框架XML模型的标准形式。3.7 全局信息global inCormation; GI 应用于整个数据集合的技术性和管理性的信
10、息。示例z数据集的标屈、历史修订记录。3.8 3.9 3. 10 3. 11 3. 12 3. 13 3. 14 3. 15 2 信息单元information unit; IU 附于元棋型某层面上的某项不可拆分的基本信息。语言段language s四tion;LS术语条目上的片段,包含与某一种语言相关的信息9注=一个术语条自可能包含种、两种或多种语言的信息.目标语言object language 被描述的语言迦结构层structural ltvel 可附加一项或多项信息单元的元模型层面。结构骨架structural skeleton 按照元模型的要求而对某术语数据库的实例所作的抽象描述。样式
11、style 与数据类目相关的一组属性,决定着用XML表述该数据类目的方式。术语组件段term component section; TCS 术语段中的片段,用以给出术语各组成成分的语言学信息。术语段term section; TS 语言段中给出术语信息的片段。示倒z术语用法、术语元素等信息。3. 16 3. 17 3. 18 3. 19 3.20 3.21 3.22 术语数据集合Jterminological data11民tion;TDC包含特定专业领域有关各种极念的信息数据集合。ISO 1087-2: 2000 ,2. 21J GB/T 29181一2012/ISO16642: 2003
12、注z本标准假定术语数据集除包含严格意义的术语信息外,还包括Gl(3.7)和CI(3.1)0 术语条目terminological entry; TE 包含各种术语单元信息的条目。示例z学科专属性概念、术语等.注:TE中的所有元素都可与CI(3.1)、其他条目,以及同条目中的其他元素链接。术语标记语言terminologi四Imarkup language; TML 用于对TDC(3.16)进行描述、且遵循本标准阐述的限定标记方法的XML应用规范。统一建模语言unified modelling language; UML 用于对软件系统的各种特征进行描述、可视化、构建和文档化的语言。词汇表voc
13、abulary 用于根据样式(3.13)实现数据类目的字符串集合。工作语言working language 用于描述对象的语言XML提纲XML outline 一个术语数据库的组成部分,对应于元模型的XML实现方案。4 术语信息置标的一般原则与互操作性原则对某个特定的TML进行描述,可以看成是一个有着多种知识源、并在各种层次上互相作用的过程。这个过程引出了TML需要进行规范的两个重要方面=一一TML的各种信息属性,即其对与术语描述相关的某项给定信息的表示能力z一一表达TML的方式,例如作为一个XML文档。图1表示了构成本标准的基础,以及可形成TML总体规范的各种知识源。上述知识源中有两项内容是
14、所有TML共享的,可作为本标准的参照资料。元模型描述了结构层次的基本级别,所有TML都应遵循,正如本标准所定义的情况。DCR是一组数据类目规范,任何特定的TML都应以其为依据建立自己的数据类目集。对于本标准的实际应用,ISO12620构成了参照使用的DCR,用于某个TML规范的各种信息单元。另外两种知识源用于定义给定TML的各种特定信息单元。该定义是从其信息属性和其在XML中的表示形式两方面出发进行的。一-DCS描述了可在给定TML中使用的数据类目集。DCS可包含DCR的子集和特定应用环境需要的任何特殊指定的数据类目。一一专用语规范(专用语)包括将给特定TML作为XML文档进行描述时所需要的各
15、种元素。这G/T 29181-2012/ISO 16642: 2003 些元素包含扩展树(3.5)、数据类目实例化样式(3.13)以及相应的词汇表(3.20)。从术语相关的角度讲,元模型和某个给定DCS的相结合涵盖了TML所有的信息属性,足以对互操作性的条件进行定义。任何与这类条件相应的信息结构都可以用GMT表示法来规范地表达为XML文档。两种不同的TML之间的互操作性,完全取决于在这种层次上(见图2)它们之间的兼容性。GMT L户户于册伽即126?一一一术语置标语言(TML)非标准语言一一扩展树一一数据类日样式+词汇圄1描述TML所涉及的各种知识源/卢/ TMF: 术语信息咒标框架TML:
16、术语信息标记语育GMT: 通用殃射工具MSC: 附录B中的TML实例Geneter:附录C中的TML实例圄2使用GMT时两种TML之间的互操作性更准确地说,两种TML之间的互操作性可以通过把它们各自的规范进行相互比较来确定,如果两种TML基于同样的DCS,那么任何以其中一种TML表达的术语数据集合都可以转换成以其他格式表示的术语数据集舍,而且不会丢失信息。尤其是当用某种TML的XML实现形式来表达互操作条件时所需要的附加规定,并不会影响两种标记语言之间的互操作性级别。以上所述互操作性原理导致两个直接结果z4 一一证明了当以一种TML表达的数据转换成以另一种TML表达的数据时,GMT作为一种主要
17、标记语言的作用zGB/T 29181-2012/ISO 16642: 2003 一一当两种TML基于两个不同的DCS时,GMT的作用是提供某种框架,用来识别哪些信息能够在这两种格式之间进行转换,以及在转换时哪些信息将会丢失(不充分的互操作性条件)。专用语信息与各种互操作性条件结合在一起,提供了用XML表达给定的TML所必需的信息。5 语言数据描述的一般模型及其在术语工作中的应用5. 1 导论5. 1. 1 -lMt原则从组织严密的数据(例如术语数据库到松散结构的信息(例如简单标注了名称、日期等的文本),这些格式多种多样的信息资源、中都存在着各种语言学结构。诠注语料库的表示形式是不分层级的,但却
18、是建立在针对多种视角所作的表述基础之上的。这里所说的视角代表着各种层面的语言信息,而相应的表述通常要指向基本数据(例如词性标注),或指向其他说明(例如基于基础短语结构注释所作的参考注释)。下面的模型确立了一类文件结构,可用来覆盖大量的语言诠注格式,并且提供了一种可以通过使用XML语言而得以实现的框架。每种文档类型都是通过三层信息结构模式来描述的,这种三层信息结构模式描述的对象是z一一元模型,代表由与语言学描述相关的结构结点所组成的一种层级体系;一一各种特定的信息单元,可以与元模型中任一结构结点相关联z一一相关的注释,可以用来限定给定信息单元关联值的部分内容。每个结构结点都可以使用一组基本的或复
19、合的信息单元来予以限定。基本信息单元描述的是可以用数据类目直接表达的属性。复合信息单元常对应于某个层级上数个基本信息单元构成的组合,该组合反映的是一个完整连贯的信息单位。例如,一个复合信息单元可以用来表示某项事务应属于某个事务类型、具有某种责任,以及发生在事务日期这样的事实信息所形成的信息单位。基本信息单元,无论是直接附着在一个结构结点,还是附属在复合信息单元之内,可以具有两种非排他类型的值z一一原子值(atomicvalue) ,或者对应于某个XML方案(XMLschema)中的简单类型(simpletype) ,例如数、字符串、选择列表的元素等,或者对应于注释文本下的浪合内容类型(mixe
20、dcontent type) ; 一一结构结点的调用值,目的是表达该结构结点与当前结构结点之间的关系。基本信息单元和复合信息单元都可以作为结构骨架中与具体结构结点相联系的一些特征值结构(feature-value structure)予以抽象地表述。例如,一个Geneter子文档内容为 通过确定与元模型相对应的结构骨架,以及将所对应的信息单元与该结构骨架中的每个结构结点相关联,上述XML文档可以映射成为本节中所描述的抽象模型,见图3.GB/T 29181-2012/ISO 16642:2003 此处的数据类目可以映射到ISO12620中规定的相应数据类目zIS0 12620: 1999 GB/
21、T 16786 数据类目编号数据类目编号id A.10.15 条目标识符A.10.15 subjectField A.4 学科领域A.4 definition A.5.1 定义A.5.1 lang A.10.7.1 语育标识符A.10.7.1 terrn A.1 术语A.1 terrnType A.2.1 术语类型A.2.1 fullForrn A. 2. 1. 7 全称A. 2. 1. 7 D 符识标RR 条-L学科领域=manuf画.cturing定义=A value. 柏户=斗叫咀切d啕ph术语类型=缸fullF,阳ormE语言标识符=h 3 卢标识符=旷3 E术语=胁 图3将XML文挡
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 29181 2012 术语 工作 计算机 应用 信息 框架
