CY T 102.2-2020 新闻出版数字内容对象存储、复用与交换规范 第2部分:对象封装、存储与交换.pdf
《CY T 102.2-2020 新闻出版数字内容对象存储、复用与交换规范 第2部分:对象封装、存储与交换.pdf》由会员分享,可在线阅读,更多相关《CY T 102.2-2020 新闻出版数字内容对象存储、复用与交换规范 第2部分:对象封装、存储与交换.pdf(26页珍藏版)》请在麦多课文档分享上搜索。
1、 ICS01.140.40 A 19 CY 中华人民共和国新闻出版行业标准 CY/T 102.2 2020 代替 CY/T 102.22014 新闻出版 数字内容对象存储、复用 与交换规范 第 2部分:对象封装、存储与交换 Specification of pres and publication digital content object storage, reuse and exchangePart 2: Object encoding, storage and exchange 2020 - 11 - 16发布 2021 - 02 - 01实施 国家新闻出版 署 发布 CY/T 102
2、.22020 I 目 次 前言 . II 引言 . III 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 缩略语 . 2 5 数字内容对象封装 . 2 5.1 对象封装方式 . 2 5.2 交换信息包文件结构 . 2 5.3 证实方法 . 5 6 数字内容对象存储 . 5 6.1 信息包存储 . 5 6.2 实例文件存储 . 6 6.3 数据文件存储 . 7 6.4 证实方法 . 8 7 数字内容对象交换 . 8 7.1 交换方式 . 8 7.2 资源标识符获取接口 . 8 7.3 指定资源 IRI获取接口 . 10 7.4 元数据获取接口 . 11 7.5 数据文
3、件 URL获取接口 . 12 7.6 数据流获取接口 . 13 7.7 交换信息包获取接口 . 13 7.8 交换信息包上传接口 . 14 7.9 资源检索接口 . 15 参考文献 . 20 CY/T 102.22020 II 前 言 本文件按照 GB/T 1.1 2020标准化工作导则 第 1部分:标准化文件的结构和起草规则的规定 起草。 本 文件是 CY/T 102新闻出版数字内容对象存储、复用与交换规范的第 2部分。 CY/T 102已经 发布了以下部分: 第 1部分:对象模型; 第 2部分:对象封装、存储和交换; 第 3部分:对象一致性检查方法。 本文件代替 CY/T 102.2 20
4、14数字内容对象存储、复用与交换规范 第 2部分:对象封装、存储 和交换,与 CY/T 102.2 2014相比,除结构调整和编辑性改动外,主要技术变化如下: a) 修改了 本文件 的适用范围,由适用于图书单一出版物类型扩展为适用多类型出版物; b) 修改了数字内容对象的封装方 式。 CY/T 102.2 2014中采用 OAI-ORE资源图文件对符合 PUBO本体模型的数字内容对象进行封装,本次修订采用“ PUBO RDF实例文档( RDF/XML 文档)”对符合本次修订版 PUBO本体模型的出版物数字内容对象进行封装; c) 修改了信息包结构,其内容包括: 1) 将 CY/T 102.2
5、2014中 CONTAINER文件夹下的各级资源图文件及相关文件夹修改为 采用“ PUBO RDF实例文档”进行表示; 2) 修改了清单文件 pubomanifest.xml的内容,除包含 CY/T 102.2 2014中媒体文件清 单 ( dataFileList)之 外,新 增了对象清单( objectList),用 于表示各资源实例作 为主体时,与之相关的客体及语义关系。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由全国新闻出版信息标准化技术委员会( SAC/TC 553) 提出并 归口。 本文件起草单位:北京大学、中宣部机关服务中心(中宣部信息中
6、心)、北京拓标卓越信息技术研 究院、中国科技出版传媒股份有限公司。 本文件主要起草人:王文清、陈鹏飞、刘成勇、刘勇、张沫、南志弘、陆新民、关涛、张志、姜磊、 郭昱锦。 本文 件及其所代替文件的历次版本发布情况为: 2014年 1月首次发布为 CY/T 102.2 2014; 本次为第一次修订。 CY/T 102.22020 III 引 言 随着互联网技术的发展和数字加工与出版相关技术的逐步成熟,传统的新闻出版机构陆续应用信息 技术开展数字出版。在数字加工与出版过程中,图书、期刊等出版内容资源不仅包括可交付印刷或电子 出版与服务的各类媒体对象( 如整书或篇章的 PDF文件,以及期刊某期及某论文的
7、 PDF文件等 )、排 版 或 加工过程中产生的媒体对象(如排版设计源文件等),还包括封面、目次、元数据、各类内容主体、各 类辅文(如参 考文献、摘要、术语表等)数字内容实体构件。对于这些出版内容资源,需要建立一个新 闻出版领域统一的数字内容对象模型,以系统地表示和记录资源的内容结构、特征、表现形式、载体方 式以及资源之间的关联关系,并能按不同粒度进行相关数据的封装、存储、复用与交换。 近年来,在出版内容资源的知识表示与建模领域,受应用需求的驱动,国内外相关行业及企业标准 应运而生。 2017年 11月,数字内容对象存储、复用与交换规范系列国家标准的起草工作正式启动; 2020年 3月,该系列
8、国家标准正式发布,为出版内容资源本体的建立奠定了模型基础。 以 GB/T 38371.1 2020数字内容对象存储、复用与交换规范 第 1部分:对象模型等 3项推 荐性 国家标准为基础,结合新闻出版行业出版内容资源的加工及应用要求 ,本 标 准 的 制 订 需 求 提 上 日 程 。 在 本标准的起草过程中 ,起草组对多项现行国家标准、行业标准及工程标准进行了调研,同时参考了大量 国内外数据标准和模型 ,从 对 象 模 型 、对 象 封 装 、存 储 和 交 换 以 及 对 象 一 致 性 检 查 等 多 个 方 面 给 出 一 套 统一的行业标准,以实现新闻出版领域对出版内容资源的规范化表示
9、,消除数据复用和交换障碍,降低 资源管理和利用成本,推动出版内容资源的融合和深入 利用。 CY/T 102.22020 1 新闻出版 数字内容对象存储、复用与交换规范 第 2部分:对象封装、存储与交换 1 范围 本文件 规 定了 出版内容资源 对象的封装、存储与交换方式 , 并给出了 对象交换服务 接口。 本文件 适用于新闻出版行业 有关数字内容资源的数字化统一管理和共享 。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T
10、7408 2005 数据元和交换格式 信息交换 日期和时间表示法( ISO 8601:2000,IDT) GB/T 38371.2 2020 数字内容对象存储、复用与交换规范 第 2部分:对象封装、存储与交换 CY/T 102.1 2020 新闻出版 数字内容对象存储、复用与交换规范 第 1部分:对象模型 CY/T 102.3 2020 新闻出版 数字内容对象存储、复用与交换规范 第 3部分:对象一致性检查方法 3 术语和定义 GB/T 20000.1界定的以及下列术语和定义适用于本文件 。 3.1 信息包 information package 通过打包信息进行封装和 识别的一种逻辑容器 。
11、 来源: GB/T 38371.2 2020, 3.2 3.2 交换信息包 exchange information package; EIP 在 不同系统 之间,用于数据 交换的信息包。 来源: GB/T 38371.2 2020, 3.3 3.3 存档信息包 archive information package; AIP 为资源存档和长期保存而规定的逻辑存储格式。 来源: GB/T 38371.2 2020, 3.4 CY/T 102.22020 2 3.4 PUBO RDF实例文件 PUBO based RDF instance file 基于出版内容资源本体模型的符合 RDF表示规范
12、的实例数据存储文件。 4 缩略语 下列缩略语适用于本文件。 AIP:存档信息包( Archive Information Package) DCOO:数字内容对象本体( Digital Content Object Ontology) EIP:交换信息包( Exchange Information Package) MIME:多用途互联网邮件扩展( Multipurpose Internet Mail Extensions) OAIS:开放档案信息系统( Open Archival Information System) PUBO: 出版内容资源本体( Publication Content
13、Resource Ontology) RDF:资源描述框架( Resource Description Framework) SRU:基于 URL的搜索 /检索( Search/Retrieve via URL) SRW:搜索 /检索 Web服务( Search/Retrieve Web Service) URL:统一资源定位符( Uniform Resource Locator) 5 数字内容对象封装 5.1 对象封装方式 5.1.1 容器级封装 容器级封装用以封装 出版物数字内容对象 及其相关的所有对象信息。 5.1.2 对象级封装 对象级封装用以封装 出版物数字内容对象 及其所包含的单一
14、媒体对象信息。 5.2 交换信息包文件结构 5.2.1 交换信息包类型 根据交换信息包所封装的资源粒度,可分为容器级交换信息包与对象级交换信息包。 5.2.2 容器级交换信息包结构 容器级交换信息包封装了一个完整的容器级封装所包含的所有信息,其结构 如下: Container_Local_ID.zip/ mimetype META-INF/ container.xml pubomanifest.xml CONTAINER/ pubo_rdf_instance.xml( 实例文件 ) dataFile/ CY/T 102.22020 3 audio/ 音频数据 文件 video/ 视频数据 文件
15、 image/ 图 像 数据 文件 text/ 文本数据文件 other/ 其他类型数据 文件 注 1: “ Container_Local_ID” 为容器级封装的本 地 标识 符 ; 交换信息包以 “ Container_Local_ID.zip” 命名 , 采 用 ZIP压缩格式 对信息包 进行 压缩 ; 注 2: 每个交换信息包均含有一个名为 mimetype的文件 , 其中内容 为 固定 值 “ application/pubo+zip” , 用于说明 交换信息包文件的格式 ; mimetype文件不含新行或回车 , 自身不 作 压缩 ; 注 3: “ META-INF” 文件目录用于
16、存放容器级封装相关的信息 , 其中包含 container.xml和 pubomanifest.xml两个 文件 : a) container.xml: 其 文件内容如下 面的 XML片段所示 。 该 XML示例片段中, “ ”元素的属性包括: full-path:当前容器级封装的 PUBO RDF实例文件 的 相对 路径 ; media-type:该交换信息包文件的打开方式 ; package-type: 表示包类型,容器 级交换信息包 类型为 “ pubo-container+xml”。 b) pubomanifest.xml:该清单文件给出了该容器级封装所包含的 媒体对象 文件 (即数据
17、文件) 列表 及 对 象 实 例 关 系 列表 ,文件命名为 “ pubomanifest.xml”。该文件的 根 元素为 “ ”, 其 属性包括: identifier: 取值为 出版物数字内容对象 实例 IRI,在 该 内容清单中是唯一的; version:内容清单的版本号,用来区分 具 有相同标识符的内容清单。 “ ” 下包含子元素 “ ” (数据文件列表) , 示例 XML片段如下所示 : CY/T 102.22020 4 该 XML示例片段中,“ ”元素的属性包括: id: 必备属性;每一个“ item”对 应 一 份 数 据 文 件 , “ id”为 当 前 媒 体 对象 的 IR
18、I(“ ” 表示 应用单位的命名空间取值) ; href: 必备属性;取值为当前媒体对象对应 数据文件 的 相对路径 (相对于 CONTAINER文件目录) ; media-type: 必备属性;取值为当前数据文件的 MIME类型取值 。 “ ” 下包含 的另一个 子元素 “ ” (对象清单) , 示例 XML片段如下所示 : 该 XML示例片段中,“ ” 及“ ” 元素的属性包括: subjectId: 必备属性; 当前主体 对 象 实 例的 IRI(“ ”表 示 应 用 单 位 的 命 名 空 间 取 值 ) ; subjectId来 自于当前 PUBO RDF实例文件( 即 pubo_r
19、df_instance.xml文件) ; predicate: 必备属性; 当 前 “ ” (关系) 所对应的 属 性 类 型 ; objectId: 必备属性;当前客体 对 象 实 例的 IRI; objectId是“ ”中某一个“ ” 的 subjectId。 注 4: “ CONTAINER” 文件目录包含两部分: pubo_rdf_instance.xml:当前 容器 级封装实例 的 PUBO RDF实例文件 ; dataFile文件目录 : 其 下的 文件 子 目录包括 “ audio”“ video”“ image”“ text”“ other”等 ; 每个 文 件 子目录下包含对
20、应类型的数据文件。 5.2.3 对象级交换信息包结构 对象级交换信息包 用以封装 出版物数字内容对象 及其所包含的 单一 媒体 对象(及相关 数据文件 ) 信 息 , 其结构 如下: Object_Local_ID.zip/ mimetype META-INF/ container.xml pubomanifest.xml CONTAINER/ CY/T 102.22020 5 pubo_rdf_instance.xml( 实例文件 ) dataFile/ media_type_label/ 某 一媒 体类 型 数据 文件 注 1: “ Object_Local_ID” 为 出版物数字内容对象
21、 的本地标识符 ;交换 信息包以 “ Object_Local_ID.zip” 命名 , 采用 ZIP压缩格式 对信息包进行压缩 ; 注 2: “ mimetype”文件的内容及要求与容器级交换信息包中同名文件一致; 注 3: “ META-INF” 文件目录用于存放 当前 出版物数字内容对象 相关信息,其中包含 container.xml和 pubomanifest.xml两个文件: a) container.xml: 其 文件内 容如下 面的 XML片段所示 : 该 XML示例片段中,“ ”元素的属性包括: full-path及 media-type属性含义及内容与 容器级交换信息包中对应
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CY 102.2-2020 新闻出版数字内容对象存储、复用与交换规范 第2部分:对象封装、存储与交换 102.2 2020 新闻出版 数字 内容 对象 存储 交换 规范 部分 封装

链接地址:http://www.mydoc123.com/p-1500385.html