1、 新闻出版内容资源加工规范 第 6 部分:数据管理 2014-01-29 发布 2014-01-29 实施 中华人民共和国新闻出版行业标准 Specification of content resource processing in press and publication Part 6: Data management CY/T 101.62014 ICS 35.240.30 L70 发 布中华人民共和国国家新闻出版广电总局 I 前 言nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnulln
2、ull I 1范围 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 1 2术语和定义 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 1 3数据交接 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 1 3.1数据接收 nullnullnullnullnullnullnull
3、nullnullnullnullnullnullnullnullnullnullnull 1 3.2数据交付 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 2 4数据类型 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 2 4.1数据类型描述 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 2 4.2基
4、础数据 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 2 4.3过程数据 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 3 4.4成品数据 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 3 5数据命名 nullnullnullnullnullnullnullnullnullnullnullnulln
5、ullnullnullnullnullnullnull 3 6数据管理 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 3 6.1基础数据管理 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 3 6.2过程数据管理 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 3 6.3成品数据管理 nullnullnulln
6、ullnullnullnullnullnullnullnullnullnullnullnullnullnull 4 6.4数据长期保存 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 4 6.5数据核销 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 4 7数据安全管理 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnu
7、ll 4 7.1保障体系 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 4 7.2制度管理 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 4 7.3环境管理 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 4 7.4设备管理 nullnullnullnullnullnullnullnullnullnu
8、llnullnullnullnullnullnullnullnull 5 7.5人员管理 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 5 7.6技术管理 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 5 7.7数据控制 nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 5 参考文献nullnullnu
9、llnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull 6 目 次 CY/T 101.62014 I CY/T 101新闻出版内容资源加工规范分为以下 10 个部分: 第 1 部分:加工专业术语; 第 4 部分:数据加工质量; 第 5 部分:资料管理; 第 6 部分:数据管理; 第 7 部分:数据交付; 第 8 部分:图书加工; 第 9 部分:报纸加工; 第 10 部分:期刊加工。 本部分为 CY/T 101 的第 6 部分。 本部分由中华人民共和国国家新闻出版广电总局科技司提出。 本部分由全国新闻出版信息标
10、准化技术委员会归口。 本部分起草单位:方正国际软件有限公司、北京拓标卓越信息技术研究院、新闻出版总署信息中心。 本部分主要起草人:赵海涛、周长岭、安秀敏、刘成勇、蔡京生、周卫国、吴治强、张沫。 前 言 第 2 部分:数据加工 与 应用模式; 第 3 部分:数据加工规格; 1 1范围 CY/T 101 的本部分规定了新闻出版内容资源数字化加工中的数据交接、数据类型、数据命名、数 据管理和数据安全管理等方面的要求。 本部分适用于新闻出版内容资源的数字化加工及电子资源的制作和应用。 2术语和定义 CY/T 101.1-2014 中所界定的以及下列术语和定义适用于本文件。 2.1 新闻出版内容资源 p
11、ress and publication content resource 新闻出版领域内任意形式、任何粒度的内容及其他有价值的资源。 CY/T 101.1-2014,4.1.1 2.2 委托方 distributor 委托数据加工处理的单位或个人。 CY/T 101.1-2014,7.2.1 2.3 加工方 processing vendor 承接数据加工处理的单位或个人。 CY/T 101.1-2014,7.2.2 2.4 在线存储 online storage 存储设备和所存储的数据保持“在线”状态,可以随时读取和修改。 CY/T 101.1-2014,6.4.5 2.5 离线存储 of
12、fline storage 备份级存储 用于对在线存储的数据进行备份,以防范可能发生的数据灾难。 CY/T 101.1-2014,6.4.6 2.6 成品数据 finished data 已经完成全部数据处理过程且符合预先设定的规格和质量要求,可实现交付的最终数据形态。 CY/T 101.1-2014,7.1.1 3数据交接 3.1数据接收 加工方按照一定的流程从委托方接收待加工处理的原始数据并形成数据接收清单,内容如下: a) 数据接收基本流程包括: 1) 接收物理存储介质; 新闻出版内容资源加工规范 第 6 部分:数据管理 CY/T 101.62014 2 2) 备份原始数据; 3) 验证
13、备份数据有效性并形成资源清单; 4) 形成数据接收清单并经委托方确认; 5) 归还委托方原始数据。 b) 数据接收清单的内容包括: 1) 介质类型; 2) 数据名称; 3) 数据格式; 4) 数据容量及数量; 5) 数据日期信息; 6) 数据版本信息; 7) 接收日期; 8) 双方交接人员签章。 3.2数据交付 加工方在完成数据的加工及转换后按一定的规格和形式将数据提交给委托方并提交数据交付清单。 内容如下: a) 数据交付基本流程包括: 1) 加工方将交付数据存储在要求的介质中; 2) 加工方形成数据交付清单; 3) 委托方接收存储介质及交付清单; 4) 委托方验证数据存储有效性; 5) 委
14、托方确认数据交付有效性。 b) 数据交付清单内容包括: 1) 数据交付介质; 2) 交付的数据清单; 3) 交付数据的存储空间及文件数; 4) 数据交付的日期; 5) 双方交接人签章。 4数据类型 4.1数据类型描述 4.1.1纸质出版物 加工对象为纸质出版物时,通常采用扫描、图像处理、文字识别和校勘、内容结构化处理、版式 重构等数据加工流程。 4.1.2电子数据 加工对象为电子数据时,通常采用数据有效性分析、数据转码处理、内容结构化处理、版式重构 等数据加工流程。不同数据加工流程其全生命周期中所产生的各种数据的类型可划分为基础数据、过 程数据和成品数据 3 类。 4.2基础数据 4.2.1纸
15、质出版物加工生成的基础数据 通过扫描等方式将纸质出版物转化为计算机图像文件,并对图像文件进行一系列加工处理后的符 合一定质量规范和存储规范的图像数据集合,是展开后续加工的数据基础,也可作为出版单位长期保 存或按需印刷出版纸质出版物的数字化版本。 3 4.2.2电子数据加工生成的基础数据 通过对电子数据的有效性分析和整理,确定其内容完整性、版本一致性和可复用性后,形成可转 码处理的符合一定质量规范和存储规范的计算机排版文件集合,是展开后续加工的数据基础,也可作 为出版单位长期保存或重新印刷出版纸质出版物的数字化版本。 4.3过程数据 按照不同的加工流程、加工粒度进行数据加工处理时各加工环节所产生
16、的各类中间数据,是最终 生成成品数据的必要过程数据,也是质量追溯、质量问题修改、数据再加工的重要基础。 4.3.1纸质出版物加工生成的过程数据 一般包括:文字识别结果数据、文字校勘结果数据、内容结构化加工过程中的相关数据和版式重 构过程中的相关数据等。 4.3.2电子数据加工生成的过程数据 一般包括:乱码处理相关数据和转曲字符处理相关数据等。 4.4成品数据 成品数据应符合数据加工最终目标,并满足一定的质量规范和存储规范,可直接与相关的软件系 统构成数字内容产品。通常包含各类元数据成品数据、 XML 等内容结构化成品数据、各类对象成品数 据、PDF 等版式成品数据以及 EPub 等流式成品数据
17、。 5数据命名 数据命名应清晰准确的反映数据的内容、状态及版本等信息,包括: a) 唯一 ID 号码; b) 处理数据的环节编号; c) 处理数据的版本编号; d) 本环节完成的日期及时间。 6数据管理 6.1基础数据管理 6.1.1基础数据命名和存储 基础数据命名应遵守数据命名规则,其中环节编号和版本编号可省略或均设置为 0。基础数据在 线存储,供后续数据加工环节随时调用,使用权限均设置为只读。 6.1.2基础数据备份 基础数据离线存储 1 2 份备份并长期保存,也可用于覆盖恢复出现问题的在线存储基础数据。 应确保离线存储备份数据的有效性和安全性。 6.2过程数据管理 6.2.1过程数据命名
18、和存储 过程数据命名应遵守数据命名规则。过程数据按项目、环节和日期等信息进行区分并集中在线存储。 6.2.2过程数据流转规范 应根据使用者角色严格控制过程数据的使用权限。过程数据流转应严格按照流程进行,禁止不同 环节间直接进行数据传递(返工数据应遵循同一流程),过程数据流转的管理流程为: a) 从上一环节接收该环节成品数据; b) 参照环节、日期、质量版本等进行存储; c) 将数据按生产流程分发给后续环节。 6.2.3过程数据备份 过程数据除集中在线存储,还应在相应的数据加工设备内保留备份。修改过程数据时,应同时更 CY/T 101.62014 4 新覆盖 2 份备份。 6.3成品数据管理 6
19、.3.1成品数据命名和存储 成品数据命名应遵循数据命名规则并符合加工需求文档的要求。成品数据需在线存储,以便随时 检查、核对或修改。 6.3.2成品数据备份 成品数据离线存储 1 2 份备份并长期保存。应确保离线存储备份数据的有效性和安全性。 6.4数据长期保存 长期保存数据应达到以下要求: a) 数据的存储应至少有 2 份独立的物理备份; b) 数据的存储优先使用磁介质和光介质; c) 存储刷新应在介质理论寿命的一半时进行; d) 当出现先进成熟的存储介质和方法时宜及时迁移到新介质上。 6.5数据核销 加工方对过程数据和成品数据的存储具有时间限制,成品数据验收合格后保留时间不超过 3 个月,
20、 如委托方有特殊要求,可按委托方要求的时间存储,一般不超过 1 年。 数据存储到期后应进行数据的核销。数据的核销应包括过程数据及成品数据在内的全部数据以及 各种数据备份。数据核销时委托方可到场监督,数据核销后委托方应向加工方出具数据核销证明文档。 7数据安全管理 7.1保障体系 应建立数据安全管理保障体系以确保数据安全。数据安全保障体系如图 1 所示。 图 1数据安全保障体系 7.2制度管理 加工方应具备数据安全管理的制度体系,包括: a) 规章制度; b) 工作规范; c) 作业流程和及作业指导书; d) 工作报表模板等。 7.3环境管理 加工方数据处理工作现场应遵循以下要求: a) 无死角
21、监控视频; b) 作业区域应与其他非作业区域隔离,无关人员禁入; c) 出入门禁控制; 数据安全管理 保障体系 制度管理 环境管理 设备管理 人员管理 技术管理 数据控制 5 d) 与作业无关物品禁入等。 7.4设备管理 加工方使用的数据处理设备及网络应遵循以下要求: a) 内外网物理隔离; b) 作业用计算机 USB 接口禁用; c) 数据服务器及存储设备专用; d) 存储介质设专人保管; e) 关键设备和存储设备配置不间断供电电源; f) 采用高性能局域网络及 IDC 机房等。 7.5人员管理 人员管理应遵循以下要求: a) 有完善的人力资源管理制度,人力资源使用符合国家相关规定; b)
22、人员无犯罪记录; c) 人员上岗前应通过相关制度培训并符合岗位技能要求等。 7.6技术管理 技术使用和管理应遵循以下内容: a) 使用的系统和工具软件应设置认证登录功能; b) 不同的岗位应设置不同的系统和工具软件的使用权限; c) 作业用系统及工具软件应具备版本管理和使用规范; d) 系统管理人员和作业人员的操作日志可回溯等。 7.7数据控制 数据处理中各类数据的存储、备份和流转控制应遵循以下要求: a) 有完善的数据存储、备份和容灾管理体系,专人负责; b) 采用存储介质进行数据流转应有完善的控制管理流程; c) 关键过程数据在内部流转应加密处理或采用特殊的非通用格式; d) 成品数据的调出应有专门的审批流程等。 1 CY/T 101.1-2014 新闻出版内容资源加工规范 第 1 部分:加工专业术语 参考文献