GB Z 18906-2002 开放式电子图书出版物结构.pdf
《GB Z 18906-2002 开放式电子图书出版物结构.pdf》由会员分享,可在线阅读,更多相关《GB Z 18906-2002 开放式电子图书出版物结构.pdf(41页珍藏版)》请在麦多课文档分享上搜索。
1、ICS 35.240.30 A 19 韭/、王H王|日导GB/Z 18906 2002 Open electronic-book pubIication structure 2002-12-04发布2003-05-01实. . 中华人民共和国国家质量监督检验检疫总局发布GBjZ 18906-2002 目次前言. . . . E 1 范围. . . . . . . . . . . . . . . l 2 规范性引用文件., . . . . . . . . . . . . . . . . . . . . . 1 3 术语和定义. . . . l 4 概述. . . . . . . . . . .
2、. . . . . . . . . . 2 5 OEB包. . . . . . . 9 6 HTMLjXML置标结构. . . . . . . . . . . . . . . 18 7 css结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 附录AC资料性附录)元素类型表. . . . . . . . . . . . . . . . 35 I 厂GB/Z 18906-2002 目U本指导性技术文件修改采用开放式电子图书论坛(Openebook Forum , OebO的开放式电子图书出版物结构)(第
3、1版)。原文件的附录B(EB包DTD)、附录C(OEB文档DTDl和附录D(字符实体)未被采用,该组织的详细信息请参见http:/www.openebook. org 0 本指导性技术文件仅供参考。本指导性技术文件的附录A为资料性附录。本指导性技术文件由中华人民共和国信息产业部提出。本指导性技术文件由中国电子技术标准化研究所总归口。本指导性技术文件起草单位2中国电子技术标准化研究所(CES!)、中国科学院计算技术研究所。本指导性技术文件主要起草人z黄铁军、林守勋、肖明、李红辉、高倍。皿GB/Z 18906-2002 开放式电子图书出版物结构范围研究开放式电子图书出版物结构的目的是为电子图书的内
4、容表述提供一种规范,特别需要注意的是. 本指导性技术文件试图为内容提供商(比如出版商以及拥有可显示内容的其他人或者机构和工具提供商提供最小化的通用指南,确保电子图书的内容在各种电子图书平台上均具有保真性、精确性、可访问性和呈现性。 本指导性技术文件试图反映各种电子图书内容格式标准的现有情况。 本指导性技术文件的目标是为出版商、代理机构以及作者等电子图书内容发布者提供一种格式,使他们能够为用户提供适于多种阅读器系统的电子图书内容。本指导性技术文件的前提假设是为了使电子图书技术在市场上取得更大成功,阅读器系统必须能够方便地访问大量的、多种类型的作品。2 规范性引用文件下列文件中的条款通过本指导性技
5、术文件的引用而成为本指导性技术文件的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本指导性技术文件,然而,鼓励根据本指导性技术文件达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本指导性技术文件。GB/T 7408数据元和交换格式信息交换日期和时间表示法CeqvISO 8601) GB 13000. 1 信息技术通用多八位编码字符集CUCS)第一部分=体系结构与基本多文种平面Cidt ISO/lEC 10646-1) GB/T 17235. 1 信息技术Ceqv ISO/IEC 10918-1) 3 术语和定义连续色
6、调静态图像的数字压缩及编码下列术语和定义适用于本指导性技术文件。3. 1 OEB基本文档basic OEB document 指按本指导性技术文件来定义其结构的OEB文档。3.2 内容提供商content provider 第1部分要求和指南出版商、作者或其他信息提供者,他们按照本指导性技术文件所描述的格式为一个或多个阅读器系统提供某种出版物。3.3 建议不用功能deprecated 本指导性技术文件允许但建议用户不要使用的功能。该功能在将来的版本中可能会被放弃。l G/Z 18906-2002 3.4 扩展OE文档extended OE document 在本指导性技术文件定义的扩展机制内,
7、使用了本指导性技术文件规定之外的构造的OER文挡回3.5 OE核心媒体类型OE core media type 所有阅读器系统都必须支持的MIME媒体类型。3.6 OE文档OE document 符合本指导性技术文件中规定的XML文档。3.7 OE包OEpackage 描述OEB出版物的文件。它标识出版物中的所有其他文件,并提供有关这些文件的描述和访问信息。3.8 OE出版物OE publication OEB文档以及其他文件的集合,这里的其他文件通常表现为各种媒体类型,包括结构化文本和图形,它们共同构成该出版物巾不可分割的组成部分。3.9 读者reader 阅读出版物的人。3. 10 阅读设
8、备reading device 呈现出版物的物理平台(包括硬件和软件)。3. 11 阅读器系统reading system 能够接受OEB出版物并且能够为读者所利用的一种软硬件统一体。各种阅读器系统的最大不同之处可能表现在其体系结构的不同上。阅读器系统既可在某个单一的设备上实现,也可分散在多台计算机上实现。需要特别注意的是,如果某个阅读设备是更大的阅读器系统的组成部分,则不要求该设备能够直接接受OEB出版物,但整个阅读器系统必须能够做到这一点。阅读器系统中还可以包括本指导性技术文件范围以外的其他附加处理功能,比如压缩、索引、加密、版权管理以及分发等功能。4 概述4. 1 关于本指导性技术文件本
9、指导性技术文件由出版商、阅读器系统厂商、软件开发商以及相关标准的专家们汇集在一起,它是共同探讨努力的结果。4.2 与其他规范之间的关系本指导性技术文件将其他相关规范的子集和应用组合在一起,以方便实现各种电子文凹的创建、组织、表述以及明确互换。相关规范包括:2 a) XMLl. 0置标元语言(http,/www.w3. org/TR/REC-xm); b) XML名城规范(http,/www.w3. org/TR/REC-xml-names); c) d) HTML4.0文档内容置标语言(http,/ /www. w3. org/TR/REC-htm140).同时还考虑了XHTMLl.O规范(h
10、ttp,/www.w3. org/TR/xhtmll/); CSS 1样式表语言(http,/www.w3. org/TR/REC-CSSl).同时还包括CSS2(http , /www. 墨-_G/Z 18906-2002 w3. org/TR/RECCSS2)中极少量的属性ge) Dublin Core元数据语言(http,/purLorg川c/)以及USMARC相关代码列表(http,/www.loc. gov/marc/relators/re9802r1. htm) , f) GB 13000字符集gg) 特殊的MIME媒体类型(http,/www.ietf.org/rfc/rfc17
11、38. txt)。4.2. 1 与XML之间的关系OEB基于XML的原因是因为后者具有普遍性和简便性等特征,并且因为这样做还能使文档存活得更长一些。XML中提供了有关文裆语法的明确规则,这样做可以减少文档的实现成本,还可以减少文裆在跨系统中的不兼容性。此外.XML具有可扩展性,因为它并没有将其限定为任何特殊的元素类型集合,它还支持国际化,并鼓励对文档进行置标(只要这些置标能够更直接地表述文档的内部组成即可).这些置标被用于文档的格式化以及其他类型的计算机处理。OEB阅读器系统必须是XML1.0中定义的XML处理器。所有OEB文裆都必须是格式良好的XML文挡,尽管并没有要求它们必须是有效的XML
12、文档,但在本指导性技术文件中为了确保所有基本OEB文档的有效性,所以对其语法形式特作如下规定 是有效的XML文档;完全符合OEB文挡DTD规定,在XHTML1. 0颁布后,还必须符合该规范的有关规定;在遵循HTML4.0版本的常用浏览器中可进行有效浏览。最后一条并不要求OEB阅读器系统完全符合HTML4. 0规范,其中的一个主要原因是,HTML4.。在实际应用(比如在浏览器中应用)时支持XML空元素语法,但在先于XHTML1.。的HTML4.0正式规范中却不支持XML空元素语法。格式良好的XML语法要求能够具备任何HTML浏览器通常要求的各种特征,比如: 所有元素都必须限定在起始标记和结束标记
13、之间;所有元素都必须正确嵌套,不允许交叉嵌套;属性值必须用引号括起来;属性赋值必须使用非最小化形式(而不同于诸如边界之类的某些用法), 内容中用到的,但在XML语法中这些空格是可选的)。空元素是指允许不包含任何内容的元素(比如HTML中的怡和hr元素)0XML与正式的HTML 语法在对待空元素方面仍然互不兼容。但是.XML语法中要求标记末尾的斜杠前面带有空格这一规定已被大多数HTML浏览器接受(这是严格遵守XML语法的格式,因为XML忽略各种标记内部的空格。因此,本指导性技术文件中要求XML的这个(一致的)变种(比如勺。这是最简便的语法形式,尽管这样做有助于延长文挡的使用寿命,但从严格意义上说
14、,这不是有效的HTML格式。很轻松就能够将有效的HTML句法转换成格式完备的XML句法(不过,语义转换可能会添加新的结构,但也许不会添加新的信息值)。对较规范的非有效性HTML进行转换也通常是轻松完成的过程,并且很容易就可以自动实现,目前已有用于自动实现的若干免费工具,比如Tidy(请参考网址:http , / /www. w3. org/People/Raggett/tidy/)。但是,如果想将非常不规范的HTML转换成XML.则其复杂程度不可预知。格式完备的XML1.0文档不一定都是合格的OEB文挡,原因是本指导性技术文件中又对其作了更加严格的限制,以提高文挡的互操作性。这些限制条件就是定
15、义如下的OEB通用要求,3 、-G/Z 18906-2002 本指导性技术文件中定义了两个XMLDTD,即包DTD和基本OEB文档DTDo其中,包DTD构成某个完整出版物的根,阅读器系统利用它来查找和组织出版物的各个组成部分。基本OEB文裆DTD则从形式上定义了本指导性技术文件巾所描述的HTML子集。4.2.2 与XML名域之间的关系本指导性技术文件的当前版本中并没有要求阅读-:/g系统依据XML名域建议草案(http:/www.w3.org/TR/REC-xml-names)来处理XML名域前缀。名域前缀是为元素和属性名称添加前缀的一种方法,以便对来自多个不同定义集合中的名称进行区分。利用X
16、ML名域声明,可将某个前缀与某个唯一的URI进行关联。另外,名域声明或许将某个URL作为缺省的名域,并将其应用于缺少名城前缀的元素。XML名域前缀与后缀元素之间用冒号隔开。本指导性技术文件中禁止使用有关OE的以下用法,即禁止在OEB文档中使用名域前缀。但是,如果想在OEB包中使用DublinCore元数据元素的各种属性,则要求使用诸如dc:prefix(前缀)之类的形式。OEB文随中的元素若带有名域前缀,则被视为扩展元素,并且冒号将扮演正常的XML名称符号。阅读器系统必须将冒号识别为OEB文挡巾的有效名称符号。为了保持向上兼容性,要求OEB包中的元素元数据都带有xmlns:dchttp:/pu
17、rl.org/dc/elements/1. 0/属性和xmlns:oebpackage = http:/openebook. org/namespaces/oeb-package/1. 0/属性。此外,还需要在OEB包DTD巾对Dublin Core诸元素进行声明,并带有明显的前缀dcz。4.2.3 与HTML之间的关系由于考虑到现有软件工具、历史遗留数据、出版实践以及市场条件等多方面的重要性,所以本指导性技术文件基于HTML基础之上。采用这种方法,可以允许内容提供商对现有的HTML内容、工具以及专门技术作进一步探讨。为了将阅读器系统开发商的研制负担降至最低点(他们可能会使用在功率和显示方面都
18、会受到限制的各种设备),所以本指导性技术文件的出版物结构中并没有包括全部的HTML元素和属性。本指导性技术文件中的元素和属性选自HTML4.0规范,并遵照与现有的HTML、XHTML以及新兴的XML的发展方向相吻合的原则进行选取。如果您想了解全部的元素和属性,则请参考附录A,其中包括了有关HTML3.2、HTML4. 0以及OE文档中各种元素类型的一份完整列表。HTML 4.0巾建议不用的全部HTML构造,在本指导性技术文件巾或者弃而不用,或者依旧建议不用。基于CSS的各种对等物的情形就是如此。样式表构造还可以用于HTML4.0规定以外的新功能。为了获得可预知的结果并且保持本指导性技术文件未来
19、版本的向上兼容性,本指导性技术文件中强烈建议z基本OEB文档都是有效的XML文档,并且该文档与OEB文档DTD相关。4.2.4 与css之间的关系本指导性技术文件在CSS1和CSS2的基础上定义了一种样式语言,并带有媒体类型text/x-oebl css 尽管OEB撰写组意识到上述有关媒体类型的定义与CSS工作组(请参阅网址http:/www.w3. org/TR/.REC-CSSl)的建议草案没有吻合,但考虑到实际情况又不得不这样做。本指导性技术文f!中包括了基于CSS的样式表构造,后者用来定义基准的显示效果功能。为了将阅读器系统开发商以及设备制造商的负担降至最低点,本指导性技术文件中没有包
20、括CSSl或者CSS2 中的全部属性。本指导性技术文件中增加了少数几个附加的属性和属性值,用来支持页顶布局、页用和页脚。在大多数情况下,本指导性技术文件中并未要求阅读器系统能提供标准CSS样式表所要求的全部显示效果。例如,某些阅读器系统中使用的是单色显示器。所以,本指导性技术文件中既没有认可将所有阅读器系统限定为单色显示器这类做法,也没有声称要使用OEB以外的非标准颜色扩展。在此情况GB/Z 18906-2002 下,本指导性技术文件中允许使用各种CSS设置,并保持其含义。但这样做的结果是,完全合乎要求的阅读器系统也许会逐渐蜕变成显示效果更简单的系统。本指导性技术文件支持嵌入样式属性、样式元素
21、以及外部链接的样式表。在处理各种样式表的过程中,本指导性技术文件没有要求阅读器系统执行与XML名域相关的各种处理。样式表可通过以下途径与某OEB文档进行关联-a) 利用特定HTML元素的style属性进行关联;b) 利用HTML头中的style元素进行关联;c) d) 在HTML头中的link元素利用个外部样式标识符进行关联,或者通过W3C建议草案与XML文裆进行关联的样式表气网址为,http,/www. w3. org/TR/ xm1-sty 1esheet)中定义的处理指令来利用某个外部样式表标识符进行关联。如果将来发布了该草案的正式文本,则请采用最终的正式文本。上述前三种情形的优先权如H
22、TML4. 0和CSS2中所定义的。通过处理指令链接的样式表单并视为在任何实际的HTML1ink元素之前通过link元素链接的样式表单。正如一致性部分中所定义的那样,如果没有为某个特定元素定义任何样式表或者找不到任何可应用的样式,则缺省的HTML显示效果将等同于本指导性技术文件以及HTML4.0中其他任何地方定义的显示效果。通过上述前两种方法将样式附加到文档中,使用的也许仅仅是本指导性技术文件第7章中支持定义的CSS结构。但是,通过HTML链接元素或者处理指令来链接外部样式表这两种方法,使用的或许是CSS或其他样式语言,比如XSL(请参考网址,http,/www.w3.org/TR/WD-xs
23、)。只有本指导性技术文件第7章中支持定义的那些CSS结构才可能会包含在样式类型text/x- oeb1 css中.对于其他烧体类型的样式表,贝11阅读器系统自行判断以什么内容来替代text/x-oebl-css样式表。HTML 4. 0规范将外部样式表按其标题成批链接到集合中(如果标题为空字符串,贝tl包括一个持久性集合)。该规范要求在诸如此类的集合中至少有一个样式表必须是MIME媒体类型text/x-oeb1 css 阅读器系统执行的只是OEBCSS子集,所以它可能会忽略使用其他样式语言的所有样式表。支持外部样式表功能的各种阅读器系统也许会从其他任一外部样式表中进行选择。本指导性技术文件强烈
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 18906 2002 开放式 电子图书 出版物 结构
