CY T 102.3-2020 新闻出版数字内容对象存储、复用与交换规范 第3部分:对象一致性检查方法.pdf
《CY T 102.3-2020 新闻出版数字内容对象存储、复用与交换规范 第3部分:对象一致性检查方法.pdf》由会员分享,可在线阅读,更多相关《CY T 102.3-2020 新闻出版数字内容对象存储、复用与交换规范 第3部分:对象一致性检查方法.pdf(22页珍藏版)》请在麦多课文档分享上搜索。
1、ICS01.140.40 A 19 CY 中华人民共和国新闻出版行业标准 CY/T 102.3 2020 代替 CY/T 102.32014 新闻出版 数字内容对象存储、复用 与交换规范 第 3部分: 对象一致性检查方法 Specification of pres and publication digital content object storage, reuse and exchangePart 3: Object conformance examination method 2020 - 11 - 16发布 2021 - 02 - 01实施 国家新闻出版 署 发布 CY/T 102.
2、32020 I 目 次 前言 . II 引言 . III 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 一致性检查内容 . 2 4.1 完整性检查 . 2 4.2 符合性检查 . 2 4.3 有效性检查 . 2 4.4 准确性检查 . 2 5 一致性检查方法 . 2 5.1 语义检查方法 . 2 5.2 信息包验证方法 . 3 6 特殊约束条件检查 . 3 6.1 预定义术语取值检查 . 3 6.2 属 性一致性关系检查 . 3 7 对象信息包验证 . 4 7.1 信息包结构验证 . 4 7.2 数据文件校验 . 10 7.3 对象实例关系校验 . 12 附录 A(
3、资料性 ) PUBO模型约束示例 . 13 A.1 PUBO最大基数约束示例 . 13 A.2 PUBO最小基数约束示例 . 13 A.3 PUBO基数约束示例 . 14 A.4 PUBO属性并存关系示例 . 14 A.5 PUBO属性同值关系示例 . 14 参考文献 . 16 CY/T 102.32020 II 前 言 本文件按照 GB/T 1.1 2020标准化工作导则 第 1部分:标准化文件的结构和起草规则的规定 起草。 本文件是 CY/T 102新闻出版数字内容对象存储、复用与交换规范的第 3部分。 CY/T 102已经 发布了以下部分 : 第 1部分:对象模型; 第 2部分:对象封装
4、、存储和交换; 第 3部分:对象一致性检查方法。 本文件代替 CY/T 102.3 2014数字内容对象存储、复用与交换规范 第 3部分:对象一致性检查 方法,与 CY/T 102.3 2014相比,除结构调整和编辑性改动外,主要技术变化如下: a) 修改了 本文件 的适用范围,由适用于图书单一出版物类型扩展为适用多类型出版物; b) 修改了信息包结构验证,其内容包括:将 CY/T 102.3 2014中对 ORE资源图文件的位置和文 件名的验证修改为对 PUBO RDF实例文档的 位置、文件名以及文件内容的验证;存档信息包结 构验证的内容中,将 CY/T 102.3 2014中关于 ORE资
5、源图文件位置的验证,修改为对 PUBO RDF 实例文档位置的验证; c) 删除了 CY/T 102.3 2014中“资源图验证”的内容; d) 修改了数据文件校验,其内容包括:在保留 CY/T 102.3 2014中对数据文件内容校验的基础 上,增加了对数据文件一致性、位置和冗余方面的校验; e) 增加了对“对象实例关系”的校验; f) 修改了附录 A中 PUBO模型约束示例的内容。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不 承担识别专利的责任。 本文件由全国新闻出版信息标准化技术委员会( SAC/TC 553) 提出并 归口。 本文件起草单位:北京大学、中宣部机关服务中心(中
6、宣部信息中心)、北京拓标卓越信息技术研 究院、中国科技出版传媒股份有限公司。 本文件主要起草人:王文清、陈鹏飞、刘成勇、刘勇、张沫、南志弘、陆新民、关涛、张志、姜磊、 郭昱锦。 本文件及其所代替文件的历次版本发布情况为: 2014年 1月首次发布为 CY/T 102.3 2014; 本次为第一次修订。 CY/T 102.32020 III 引 言 随着互联网技术的发展和数字加工与出版相关技术的逐 步成熟,传统的新闻出版机构陆续应用信息 技术开展数字出版。在数字加工与出版过程中,图书、期刊等出版内容资源不仅包括可交付印刷或电子 出版与服务的各类媒体对象( 如整书或篇章的 PDF文件,以及期刊某期
7、及某论文的 PDF文件等 )、排 版 或 加工过程中产生的媒体对象(如排版设计源文件等),还包括封面、目次、元数据、各类内容主体、各 类辅文(如参考文献、摘要、术语表等)数字内容实体构件。对于这些出版内容资源,需要建立一个新 闻出版领域统一的数字内容对象模型,以系统地表示和记录资源的内容结构、特征、表现形式、载体方 式以及资源之间的关 联关系,并能按不同粒度进行相关数据的封装、存储、复用与交换。 近年来,在出版内容资源的知识表示与建模领域,受应用需求的驱动,国内外相关行业及企业标准 应运而生。 2017年 11月,数字内容对象存储、复用与交换规范系列国家标准的起草工作正式启动; 2020年 3
8、月,该系列国家标准正式发布,为出版内容资源本体的建立奠定了模型基础。 以 GB/T 38371.1 2020数字内容对象存储、复用与交换规范 第 1部分:对象模型等 3项推 荐性 国家标准为基础,结合新闻出版行业出版内容资源的加工及应用要求 ,本 标 准 的 制 订 需 求 提 上 日程。 在 本标准的起草过程中 ,起草组对多项现行国家标准、行业标准及工程标准进行了调研,同时参考了大量 国内外数据标准和模型 ,从 对 象 模 型 、对 象 封 装 、存 储 和 交 换 以 及 对 象 一 致 性 检 查 等 多 个 方 面 给 出 一 套 统一的行业标准,以实现新闻出版领域对出版内容资源的规范
9、化表示,消除数据复用和交换障碍,降低 资源管理和利用成本,推动出版内容资源的融合和深入利用。 CY/T 102.32020 1 新闻出版 数字内容对象存储、复用与交换规范 第 3部分:对象一致性检查方法 1 范围 本文件规定了 出版内容资源 对象的一致性检查 内容 、一 致性检查 方法 、特 殊 约 束 条 件 检 查 和 对 象 信 息包验证等。 本文件 适用于 新闻出版行业有关数字内容资源 的内容检查。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改
10、单)适用于本 文件。 GB/T 38371.3 2020 数字内容对象存储、复用与交换规范 第 3部分:对象一致性检查方法 CY/T 102.1 2020 新闻出版数字内容对象存储、复用与交换规范 第 1部分:对象模型 CY/T 102.2 2020 新闻出版数字内容对象存储、复用与交换规范 第 2部分:对象封装、存储与交 换 3 术语和 定义 GB/T 20000.1界定的以及下列术语和定义适用于本文件 。 3.1 一致性 conformance 满足规定的要求。 来源: GB/T 19333.5 2003, 3.8 3.2 一致性检查 conformance examination 满足规
11、定要求的相关检查。 来源: GB/T 38371.3 2020, 3.2 3.3 对象一致性检查 object conformance examination 对数字 内容对象的语义关系以及用于交换的对象信息包结构等方面进行 的满足规定要求的相关检 查。 来源: GB/T 38371.3 2020, 3.3 CY/T 102.32020 2 3.4 基数约束 cardinality constraint 对实例属性的出现次数进行限定的约束方式。 来源: GB/T 38371.3 2020, 3.4 3.5 取值约束 value constraint 对实例属性的取值进行限定的约束方式。 来源:
12、 GB/T 38371.3 2020, 3.5 4 一致性检查 内容 4.1 完整性检查 出版物数字内容对象 及其相关资源数据的完整性检查包括 : a) 对象模型逻辑结构完整性检查:对象模型是否完整表述 出版物数字内容对象 的语义关系,对象 实例是否完整,以及对象实例是否完整包括必备属性等; b) 信息包完整性检查:对 对象实例信息包 中的必备文件(及文件目录)的存在性进行检查 。 4.2 符合性检查 出版物数字内容对象 及其相关资源数据的符合性检查包括: a) 对象语义符合性检查:对象模型是否符合约束条件、推理规则的检查等; b) 信息包 符合性检查 : PUBO RDF实例文件中的语义关系
13、是否与信息包清单文件(即 pubomanifest.xml文件)中的对象关系列 表 (即节点 objectList下 的内容)相符; PUBO RDF 实例文件中的媒体对象 及其 物理 文件是否与信息包清 单 文件中数据文件 列表 (即节点 dataFileList下的内容)相符 。 4.3 有效性检查 出版物数字内容对象 及其相关资源数据的 有效性检查包括: a) 对象模型逻辑有效性检查:检查属性的取值有效性等; b) 语法有效性检查:检查是否符合 XML、 RDF、 OWL相关语法等 。 4.4 准确性检查 出版物数字内容对象 及其相关资源数据的 准确性检查主要是针对对象实例信息包的内容进
14、行检查, 包括文件系统中的目录名称及位置、文件名称及位置、 container.xml与 pubomanifest.xml文件的位置 是否准确等 。 5 一致性检查 方法 5.1 语义检查 方法 利用语义检查方法,可覆盖对以下内容的检查: 对象模型逻辑结构完整性检查; CY/T 102.32020 3 对象语义符合性检查; 对象模型逻辑有效性检查; 语法有效性检查。 语义检查的具体方法如下: a) 对象模型 逻辑结 构 检查 : 检查对象为 PUBO及其扩展模型。 检查 内容 为 本体 逻辑结 构的 语义 一 致性。该逻辑结构的检查可通 过本体模型定义文件以及相应的 本体推理机完成; b) 实
15、例数据逻辑结构检查:检查对象为符合 PUBO或 其扩展模型的 RDF实例数据。检查内容包括 是否符合本体模型逻辑结 构;对于实例的属性,检查内容包括属性与逆属性、传递属性、对称 属性等多个方面。该逻辑结构的检查可通过 RDF实例数据文件、本体模型定义文件以及相应的 本体推理机完成; c) 约束条件检查: 检查对象为 RDF实例数据。 检查内容包括基数约束检查和取值约束检查。 PUBO 基数约束示例参见附录 A.1、 A.2和 A.3。在 PUBO的 扩展模型中,需要在扩展的派生类范围限 定属性取值时,应考虑对取值约束的检查。约束条件检查可通过本体模型定义文件以及相应的 本体推理机完成 ; d)
16、 特殊 约 束条件 检查 : 检查对象为 RDF实例数据。 检查内容 包括预定义术语取值 检查、属性一致 性关系检查。 检查方法见 6.1和 6.2。 PUBO中的特殊约束示例可参见附录 A.4和 A.5。 5.2 信息包验证 方法 利用信息包验证方法,可覆盖对以下内容的检查: 信息包完整性检查; 信息包符合性检查; 信息包准确性检查。 信息包验证的具体方法如下: 出版物数字内容对象 的信息包 主要 包含 PUBO RDF实例文件 ,以 及 一 组 相 关 的数据文件 。信 息 包 按 照 一定的 结 构来 组织 文件。 针对 数据文件, 利用对象模型 中 “ 校验算法 ” 和 “ 校 验值
17、” 属性 所提供的校验 信息, 保 证有效地对 数据文件内容 进行校验 。信息包的 验证 包 括 信息包 结 构 验证(见 7.1) 、 数据文件 校 验(见 7.2) 和 对 象 实 例 关 系校 验(见 7.3)等三个方面 。 6 特殊 约束条件检查 6.1 预定义术语取值检查 在 PUBO扩展体系中,如词表、分类法等编码体系可由“预定义术语集”实例化后进行限定。采用“预 定义术语”的实例表示具体的词表词汇、分类词汇或分类号等信息。 在对实例数据进行校验的过程中,需检查预定义术语的取值是否符合匹配的预定义术语集。 6.2 属性一致性关系检查 6.2.1 属性一致性关系类型 PUBO所描述的
18、各类资源具备多种属性,属性之间存在一定的关系,其类型包括: a) 属性并存 关 系: 针对 某个 实例, 两个或多 个属性取 值 必 须 都存在,或都不存在; b) 属性同 值 关 系: 针对 两个不同的 实例 ,某 一 个 或 两 个 属 性 的 值 必 须 相同。 如某 丛书 的 题 名与 该 丛书 中 某 单 册 图书 的 丛编题 名必 须 相同。 CY/T 102.32020 4 6.2.2 属性并存关系检查 属性并存关系检查规则见表 1,示例参见附录 A.4。 表 1 属性的并存关系检查 检查项目 检查说明 规则编号 Rule-spr-01 规则描述 实例的并存关系属性需同时出现 输
19、入参数 实例 a,属性 p1,并存属性 p2 返回结果 true 或 false 证实方法 如果 a的 p1属性有取值,并且 a的 p2属性无取值,则输出 “ a的 p1属性的并存属 性 p2无取值 ” ,返回 “ false” ;如 果 a的 p1属性无取值,并且 a的 p2属性有取值,则输出“ a的 p2属性的并存属性 p1无取值”, 返回“ false”;如果以上均不成立,则返回 “ true” 6.2.3 属性同值关系检查 属性同值关系检查规则见表 2,示例参见附录 A.5。 表 2 属性的同值关系检查 检查项目 检查说明 规则编号 Rule-spr-02 规则描述 对具备同值关系属性
20、的实例,应进行同值关系检查 输入参数 实例 a和 b,同值属性 sameValueP1和 sameValueP2 返回结果 true或 false 证实方 法 如果 a的属性 sameValueP1有取值 v1,并且 b的属性 sameValueP2有取值 v2,同时 v1不等于 v2,则输 出 “ a的属性 sameValueP1与 b的属性 sameValueP2取值不等”,并返回“ false”; 否 则 返 回 “ true” 7 对象信息包验证 7.1 信息包结构验证 7.1.1 交换信息包结构验证 7.1.1.1 交换信息包文件名验证 交换信息包文件名验证见表 3。 CY/T 10
21、2.32020 5 表 3 交换信息包文件名验证 检查项目 检查说明 规则编号 Rule-pac-1 规则描述 验证 EIP的文件命名是否正确 输入参数 EIP文件 输出结果 True 或 False 证实方法 当 EIP文件 是 以 容器级封装 本地 标识 符或 某 出版物数字内容对象 本 地 标识 符 为文件名的 ZIP文件 时,返 回“ True”, 否 则 返 回 “ False” 7.1.1.2 交换信息包目录名称验证 交换信息包目录名称验证见表 4。 表 4 交换信息包目录名称验证 检查项目 检查说明 规则编号 Rule-pac-2 规则描述 验证 EIP中目 录 名称是否正确 输
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CY 102.3-2020 新闻出版数字内容对象存储、复用与交换规范 第3部分:对象一致性检查方法 102.3 2020 新闻出版 数字 内容 对象 存储 交换 规范 部分 一致性 检查 方法

链接地址:http://www.mydoc123.com/p-1500389.html