GBZ 17978-2000 信息处理 SGML支持设施 SGML使用技术.pdf
《GBZ 17978-2000 信息处理 SGML支持设施 SGML使用技术.pdf》由会员分享,可在线阅读,更多相关《GBZ 17978-2000 信息处理 SGML支持设施 SGML使用技术.pdf(96页珍藏版)》请在麦多课文档分享上搜索。
1、中华人民共和国国家标准化指导性技术文件信息处理 支持设施使用技术发布 实施国家质量技术监督局 发布前言本指导性技术文件等效采用 信息处理 支持设施 使用技术 在充分吸收尊重等效国际标准的基础上 略去了与中文信息处理无关的内容或不适合在我国实际应用的内容 以基于已颁布的国家标准的内容替换了部分国际标准的内容如汉语拼音方案的采用和基于 的文件类型定义等等本指导性技术文件仅供参考有关对本指导性技术文件的建议和意见 向国务院标准化行政主管部门反映本指导性技术文件由中华人民共和国信息产业部提出本指导性技术文件由中国电子技术标准化研究所归口本指导性技术文件起草单位北京信息工程学院本指导性技术文件主要起草人
2、 李宁邓良松侯迪前言国际标准化组织 和 国际电工委员会 是世界性的标准化专门机构 国家成员体 它们都是 或 的成员国通过国际组织建立的各个技术委员会参与制定针对特定技术范围的国际标准 和 的各技术委员会在共同感兴趣的领域内进行合作 与 和 有联系的其他官方国际组织和非官方国际组织也可参与国际标准的制定工作在信息技术领域中 和 建立了一个联合技术委员会即技术委员会的主要任务是制定国际标准但在例外的情况下技术委员会可以提出下列类型之一的技术报告类型 虽然一再努力 但仍不能获得出版一项国际标准所需要的支持时类型 所讨论的项目仍处于技术发展阶段类型 技术委员会所收集到的数据不是来源于正式出版的国际标准
3、 如目前工艺水平 时类型 和 技术报告要在出版后三年内应提交复审以决定是否将它们转变成国际标准 类型 技术报告不是务必要进行复审的除非它们所提供的数据已被认为不再有效或已经无用属于类型 技术报告 它是由 信息技术联合技术委员会制定的引言信息处理文本和办公系统 标准通用置标语言 说明了用于出版和交换目的的文件的描述和置标规则 在 的 中提供了一个基本的用于计算机辅助出版的文件类型但在那里并未做任何解释它将在本指导性技术文件中做出解释 以帮助理解 本指导性技术文件还给出了使用 的各种样例 因此 本指导性技术文件是对 的补充其主要目的是辅助该语言的使用中华人民共和国国家标准化指导性技术文件信息处理
4、支持设施使用技术国家质量技术监督局 批准 实施应用范围和领域本指导性技术文件通过提供导读性的信息补充了 它不试图也不应被认为是对的扩充修改或分析 语言包括一系列成分 其中一些是可选的 这些导读性信息只覆盖了该语言的主要成分 请注意 对 和 的讨论不在本指导性技术文件的范围内本指导性技术文件的读者主要是文件类型的设计者他们已经熟悉了 语言的基本概念又需要把 用于各种不同应用的导读信息 和 就是按用户指南的式样编写的并可以用作最终用户文件的基础 的附录部分可作为 的入门介绍本指导性技术文件包括在书写一个正式的文件类型定义之前 对文件进行分析的注解以及一系列的样例 报告中主要的例子是针对通用文件类型
5、的正式定义如同 中 中的例子一样 其他例子有书信备忘录电子报表数学公式和一些正文和图形的混合体注 本指导性技术文件中用到的像 置标为和键入 这样的术语 并不一定意味着置标是由用户显式地添加的因为文本输入者期望能使用结构化的上下文有关的编辑程序或由应用程序来置标 例如电子报表的转换引用标准下列标准所包含的条文 通过在本指导性技术文件中引用而构成为本指导性技术文件的条文 本指导性技术文件出版时所示版本均为有效 所有标准都会被修订使用本指导性技术文件的各方应探讨使用下列标准最新版本的可能性信息处理信息交换用七位编码字符集信息处理 七位和八位编码字符集 代码扩充技术信息处理信息交换用汉字编码字符集 基
6、本集信息处理文本通信用编码字符集信息处理信息交换用八位代码结构和编码规则信息处理文本和办公系统 标准通用置标语言信息处理系统计算机图形存储和传送图片描述信息的元文卷第二部分 字符编码信息技术 计算机图形存储和传送图片描述信息的元文卷第部分清晰正文编码信息处理 支持设施 文件交换格式信息处理 支持设施 公用文本拥有者标识符登记规程定义中的定义仍适用于本指导性技术文件为创建文件类型定义所做的文件分析一般注解在一个将要使用 的组织中 对不同类型的文件所进行的分析对于其成功地应用 是至关重要的 如果只是把 用于纸面文件那么通过建立文件类型定义 来反映现存文件的类例如报告 的结构所需要分析的问题很少 但
7、更重要的 也更困难的是着眼于通过不同的处理途径来分析如何标识文件的成分这一未来之需 例如建立一个数据库它在标准的 软件环境下是可查询的或产生多媒体出版物例如缩微胶片和光盘系统 或产生二次出版物 比如仅含题目和摘要的出版物文件分析的步骤最初一步的分析要确定所需的各个文件类型定义需要仔细考虑的是一类特定的文件与众不同之处是在于其特有的元素与结构 还是在于其表现 版面 式样 例如一类文件其首部含有带有题目 作者名 索引号的一页带有摘要的一页而另一类的文件其第一页部分含有题目 作者名 索引号摘要接着是出现在同一页上的文件主体 在很多情况下尽管存在着表面上的差别这两类文件实际上是一种类型只是有两种表现式
8、样罢了对每一类型的文件进行分析的第一步是确定元素及其必要的任何属性 这方面所用到的技术将在以后对某些文件的典型部分进行分析时作详细讨论在这步分析中最好能区分出多种文件类型的公共元素例如段注解列表和标题以便形成一套一致的 这样既便于键入又使得合并不同类型的文件的某些部分更加容易 在各个组织中不同类型的文件的主体元素很可能是等同的区别只出现在开头和结尾部分所以一封书信的主体元素可以与一篇报告相同但书信的开头部分是地址 发信人日期和索引号而报告的开头部分是题目 作者摘要和目录第二步是确定这些元素的层次结构从完整的文件入手将其分成几个主要部分再把它们向下分为其他元素 如此细分 直到字符正文 一层第三步
9、是考虑使用便捷引用一旦完成这三步之后 一个形式化的 就能比较容易地建立起来了设计问题在设计文件类型的元素和属性的过程中应考虑到正文可能由应用软件或文本格式化程序自动产生 这能使修订一个文件或合并不同文件的某些部分时的一系列工作变得方便 一般情形如下对标题插图 列表和脚注等元素进行编号时 不要用以下形式的标记工具集产生程序在 中描述而应把文件类型定义设计成能使用如下标记的方式工具集产生程序在 中描述而使用应用软件或文本格式化程序对标题进行编号并处理交叉引用 应注意 这个标记不说明引用的表现形式 它既可能产生 工具集产生程序 页 也可能产生 段落 页 所以正如表现式样一样交叉引用的表现形式也独立于
10、 源文件建立目录表 插图和表格的列表 最好能使用应用软件 或文本格式化程序 来统计文件中的条目 而 这样的标记用来指出相应的元素放在文本的何处 在多数文件类型中这些元素的位置在文件中总是固定的因而可用置标最简化规则省略掉建立索引 较好的做法是在正文中插入像索引中要加入的词的标记文本格式化程序对条目进行收集和排序自动地加上页号打印在 标记指示之处 而不是用手工的办法建立分类索引条目并随着正文的修订而修改其页号这里还存在一些问题 虽在技术上不很重要但对 应用的方便性有很大影响 如通用标识符的击键次数最少化问题 如果标记是作者本人加的 那么不常用的通用标识符就应设计为较长且容易记忆的 比如 就比 方
11、便尽管它多敲了两次键对于一些常用的标记例如段落短标记就较好如果这些标记是由打字员击入的 那么击键次数的最少化比容易记忆更重要 通用标识符表和属性表可以放在键盘旁边以方便查阅 如果这种标记是由功能键或类似的键产生的 击键次数最少化所带来的优点只是略微节省了标记的存贮和传输开销 在本指导性技术文件中通用标识符同 的 一样标记最简化 对于支持 特性的语言分析器很多标记都可以省略 例如可构造允许有如下标记的工具集工具集是来代替工具集工具集是但是当一个标记只能在一定条件下方可省略的时候 的设计必须把节省击键次数和为记住该标记缺省的特殊条件而付出的努力作一平衡 标记最简化用的最多的是列表 的设计可以省略掉
12、第一个列表项目的标记第一列表项第二列表项最后的列表项注 表示无序表见 表示列表条目但要注意到在可省略标记的地方添加标记是不会出错的属性最简化 对于支持 特性的语言分析器如果一个属性值只是名字记号组 该属性名就可以从说明中省去 但是为了使用的方便 设计者需要记住属性值的意义 所以如下的定义及置标或者比定义及置标或者更能体现属性值的意义便捷引用 对于支持 特性的语言分析器一些元素可能在分析时就被自动加入标记 例如引号 可以作为代替 和 的一种方便的做法 对此更为详细的讨论见第 章因为 是为满足尽可能广泛的多种应用系统设计的 所以很显然倘若所有的应用系统都使用不同的标记来标识公共元素就会给使用 进行
13、文件交换带来许多不便 因此希望文件类型定义的设计者能学习那些公共的很好地定义了的标记以便对不同应用中的公共元素使用相同的定义正文主体分析举例分析图 的正文主体 可以很容易地确定下面的元素和 加标题的节分别称作 和 还有一个 元素在文件的其他部分出现段落称该元素为注解称该元素为和 编号的 即有序的 有时是嵌套的列表称该类列表元素为插图 称该元素为脚注称该元素为脚注引用 称该元素为术语及其定义的列表 即词汇表称该元素为标题号引用 称该元素为插图引用 称该元素为为了在引用与被引用元素之间建立链接标题插图和脚注元素需要 属性 标识符属性 而引用它们的元素则需要 属性带标题的节所有带标题的节都有相同的结
14、构 标题接着内容 标题的内容仅由字符组成注 该例中文件元素的层次结构指明一个带标题的节的内容持续到下一个同层或更高层的带标题节为止而不是在该节的标题末尾处结束置标举例同等实体间的通讯定义每一层的内容是 个或多个段 以及与此类似的元素 它们是用参数实体 来表示的定义见后 接着是 个或多个更低层的标题 因而这些元素被定义为节子节子子节子子子节标题图 文件样页注该例中元素的置标最简化的讨论见在很多应用程序中没必要区别不同层次的标题因此 可以代替 和在该正文主体中 的内容已被确定为 与 与 可定义以下的参数实体描述之单元项列表所有列表段 节子元素简单段节元素注 在这个简单正文主体的例子中给出的多层参数
15、实体初看可能太复杂 但是下面的叙述表明使用这种参数实体来构造定义是很方便的 其中所使用的命名约定将在 中详细解释段和注解元素段和注解元素的置标举例对于使用 协议的在两个或多个 交换的信息来说可以在 协议中定义多个协议族这种关联段和注解在结构上很相似所以可有如下定义段和注解这两种元素的内容被定义为字符 和 所以可有下面的定义标题和插图引用脚注引用所有的引用列表元素有两种类型的列表一种是有序表 它的列表项进行过排序并按某种顺序编号 另一种是词汇表它的列表项是一个术语及其定义这里描述了两种列表结构的设计方法 在第一种方法中 每种类型的列表都被定义成不同的元素在第二种方法中只定义一种 或很少几种形式的
16、列表元素 不同的列表元素利用属性来区别 这两种方法各自的优点在本条后面叙述分别标识的元素这两种列表称为 和 有序表需要列表头和列表尾标记列表中每个元素的标记称为 即列表项以及实现列表嵌套的结构 每个列表项可包括多个段 这些元素可定义为单元项列表列表项其中 定义为段序列置标为激活 停息管理包括激活 维护及终止在开放系统中分布的 资源 包括 的物理介质开放系统参数的初始化 修改监控包括注 另外一种嵌套列表的方法是为每一层定义不同的通用标识符 在置标时 哪一个是当前层将会更清楚 但是若嵌套的是不同类型的列表 这个优点就会因需要多套通用标识符所导致的复杂性而被抵消词汇表 与有序表相似只是每个列表项包含
17、一个术语及其定义 于是该元素可以定义为词汇表词汇表术语词汇表定义注 和 元素的内容相同 所以参数实体 可重用置标为连接为传送数据 由 层所建立的两个或多个 实体间的关联连接 终点在 服务 存取 点中 连接一端的终结器公共列表元素在公共列表元素的设计中 单个列表元素有两个属性 一个属性确定该列表的形式另一个属性描述该列表是否可形成某种有序序列 其定义为列表列表术语列表项在此设计中这两种类型的列表可置标为为一般性起见 这里我们给出了一个嵌套了有序表的词汇表颜色透明背景的颜色它被表示成三个百分比每一个百分比代表一种基色红绿蓝可透性透过背景的光量表示为百分率列表的两种设计方法的讨论第一种方法的优点是击
18、键次数较少 可以适用于有良好定义的 边界清楚的应用系统 而第二种方法更适合于通用的或演变着的应用系统将列表属性当作真正的 属性处理会带来灵活性 例如 某人想提供一种选项表明一个列表既是词汇表 而表项又加了编号 此时很自然地会使用置标如果用第一种设计方法就要定义一个新的元素或给 元素添加一个 属性在 元素的部分使用有序属性而会产生不一致类似地通过 属性这种形式 以 替换 属性便可支持流动 列表列表可充溢成句子或段落的一部分假如一个文件是在没有 语法制导的编辑系统辅助下编辑的如果列表的结束标记不需要替换则将列表从一种形式转换为另一种形式将更容易另一方面 这种方法暗示了在 语法制导编辑系统的实现中
19、应用 不足以 提示和检验这些子元素的有效性 这是因为属性的某些组合使得只有 所允许的子元素的部分子集才是有效的 例如在 这一元素中 只有 子元素才是有效的 但是 也允许 子元素出现脚注元素脚注要求有元素的开始和结束标记及可选的用于引用的 属性 脚注可以定义为脚注置标为连接 这些定义并不在本指导性技术文件中使用 但将在将来的标准中使用注 的解释见后插图元素该例中的插图元素由插图主体和插图标题构成 插图主体可以是正文和 或一个图画 插图的定义如下置标为实体间的 协议浮动元素插图脚注的位置通常是不固定的 它们是浮动元素除了不能出现在另一个插图或脚注中外 最好定义成可在任何地方出现 因而可定义为浮动元
20、素引用元素对标题插图和脚注的引用都具有相同的结构它们的内容是 即它们或由文本格式化程序产生或由应用软件产生 引用元素可以定义为产生的引用置标为它们间的中继主体元素定义总结基于图 的两页正文 为其主体成分所作的文件类型定义有以下几种参数实体单元项列表所有列表段 节子元素简单段节子元素标题和插图引用脚注引用所有引用段序列浮动元素标题节子节子子节子子子节标题段和注解段和注解脚注列表单元项列表列表项词汇表词汇表术语词汇表定义插图引用产生的引用附加元素对同样类型的多个文件的进一步分析表明有一些附加元素需加在定义中 如注解表 称为某些表 其中的条目不由字母数字字符标识而在前面冠以破折号 这种列表元素称为无
21、序表样例 称为对外部文件中标题 插图 表格和脚注的引用 称为前面两种新类型的列表具有同 相同的结构因为定义中有参数实体可用这两种新元素可通过改变原来的 定义来实现单元项列表另一方面样例元素则要求引入一个新的元素样例对于外部文件的元素的引用 元素可以定义为对外部文件的引用注 为引用求解应用软件或文本格式化程序需要访问关于外部引用的数据库这是一个包括了所有具有 属性的元素信息的数据库 应用软件或文本格式化程序还需修改该数据库并对每个已格式化的文件更新它对其他文件的任何引用 另外这些信息还将有助于确立修改一个文件对于其他文件的影响置标最简化使用 使置标最简化与其说是一个技术问题 不如说是一个风格问题
22、 经验表明 最简化标记的定义需权衡这几个方面击键次数的减少 置标一致性以及可省标记是否容易掌握 置标最简化并非是唯一的好的方案标题分析举例考虑图 中的标题可以确定七种主要元素 标题 作者 机构表 日期 摘要 注解 及出版和版权信息 对于这种类型的文件这些元素都是需要的 标题元素可以定义为注解 和出版及版权信息 暂时先不讨论图 标题页样例标题元素如果我们的目的只是产生一个打印的标题页 标题元素可简单地定义为置标为如果我们的目标是建立文章数据库或建立关于一系列文章的索引的二次出版物 有可能要对所研究的 加以标识元素可以这样定义置标为机构表元素同样根据应用的需要 机构表也可能具有不同程度的结构两种极
23、端是置标为和机构表系机构名称资格城市郡县国家置标为注 对于如此复杂的列表中的数据项很明显最适合用选单驱动的方式来产生对应机构信息中的各部分都有相应的选单域供选择填写作者表元素作者表不仅包括姓名 而且还包括对机构的引用和在多数情况下对说明性注解的引用 由于每一个注解几乎总是对应一个作者因而该注解可以认为是作者表的一部分 只是文本格式化程序将其放在页的底部罢了 按数据库应用的方式 作者的姓名可以分为名和姓两部分 它可以定义为置标为不同形式的说明性注释例如 和 可以作为不同的元素定义为置标为也可以由一个属性来指明类型元素可定义为置标为日期元素这篇期刊文献中的日期可以定义为置标为在另外的情况下可能需要
24、不同类型的日期 例如置标为或为不同类型的日期定义单独的元素置标为在某些情况下日期可以定义为一个简单字符串 在另外一些应用系统中可能要求标识年月日及日程 例如置标为在某些应用程序中当前日期最好能由应用软件或文本格式化程序 产生而不总是由键盘敲入摘要元素这里的摘要元素包括仅由字符组成的正文段 在更一般的情况下 段落包含第 章中所述的更多的子元素置标为说明如下 对于所研究的范围来说文章元素这里所考虑的是期刊文献 为了讨论出版和版权信息需要关注比 元素更高一层的元素 文章元素由出版信息版权 关键字表及随后的 和文章主体构成 出版信息的内容是由应用软件或文本格式化程序基于文章元素上一层的信息自动产生的
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GBZ 17978 2000 信息处理 SGML 支持 设施 使用 技术
