GB Z 23283-2009 基于文件的电子信息的长期保存.pdf
《GB Z 23283-2009 基于文件的电子信息的长期保存.pdf》由会员分享,可在线阅读,更多相关《GB Z 23283-2009 基于文件的电子信息的长期保存.pdf(17页珍藏版)》请在麦多课文档分享上搜索。
1、E岱37.080A 14 GB 中华人民共和国国家标准化指导性技术文件GB/Z 23283-2009/ISO/TR 18492: 2005 基于文件的电子信息的长期保存Long-tenn preservation of electronic document-based information CISO/TR 18492: 2005 , IDT) 2009-03-13发布中华人民共和国国家质量监督检验检捷总局也企中国国家标准化管理委员会Q(.IJ GB/Z 23283-2009/ISO/TR 18492 :2005 前本指导性技术文件等同采用ISO/TR18492-200日基于文件的电子信息的
2、长期保存民英文版本指导性技术文件与技术报告ISO!TR18492-2005在内容上相同,但做了以下编辑性修改2一一删除ISO!TR18492-2005的前言,编写本指导性技术文件的前言s一一删除ISO!TR18492-2005的目录z一一在术语和定义增加GB/T20225-2006; 一一改正了附录A.3中出版物序号的错误。本指导性技术文件的附录A为资料性附录。本指导性技术文件由全国文献影像技术标准化技术委员会(SAC!TC86)提出并归口。本指导性技术文件由全国文献影像技术标准化技术委员会七分会负责起草.本指导性技术文件主要起草人2张美芳、孙静荣、李娟、姜志伟。I GB/Z 23283-20
3、09/ISO/TR 18492 :2005 引确保真实基子文件的电子信息的长期保存在档案学、文件管理、电子商务、电子政务和技术开发等许多领域都是突出的问题。为解决这一问题,长期保存基于文件的电子信息的个人和机构已采取多种方法和措施。显然我们话要解决真实的基于文件的电子信息的长期存储问题,但在解决这些问题上,目前还缺乏一个统一的国际标准,这就导致所采用的方法不一致甚至不兼容,有可能直接影响基于文件的电子信息的可用性和真实性.基于计算机硬件和软件的普遍存在的技术过时现象和数字存储介质的有限寿命等,这份指导性技术文件为保存机构利用和保存基于文件的电子信息提供指导性建议a本指导性技术文件为基于文件的电
4、子信息长期保存策略的制定和最佳实践提供了清晰的框架。使它能广泛地宜用于公共部门和个人,以确保基于文件的电子信息的长期可用性和真实性.E GB/Z 23283-2009/1SO厅R18492: 2005 基于文件的电子信息的长期保存1 范围当基于文件的电子信息的保存期超过产生和维护信息所使用的技术硬件和软件)的预期寿命时,为长期保存和检索真实的基于文件的电子信息,本指导性技术文件提供了实用的、方法性的指南.本指导性技术文件考虑了中立的信息技术标准在信息长期利用中的作用.本指导性技术文件同样认为,为确保基于文件的电子信息的长期保存和检索,需要信息技术专家、文件管理者和档案工作者的共同努力.本指导性
5、技术文件没有涵盖真实的基于文件的电子信息的产生、获取和分类的全过程.本指导性技术文件适用于由信息系统产生的作为业务活动凭证的所有形式的信息.注z基于文件的电子信息构成了日常业务活动或事件的业务记忆,使得机构日后可以回顾、分析或证明这些活动和事件.基于文件的电子信息是业务活动的凭证,可以帮助机构现在或将来做出管理决策,满足用户的百求和应对不利的诉讼,为此,基于文件的电子信息室被适当地保留和保存.2 规范性引用文件下列文件中的条款通过本指导性技术文件的引用而成为本指导性技术文件的条款.凡是注日期的引用文件,其随后所有的修改单不包括勘误的内容)或修订版均不适用于本指导性技术文件。凡是不注明日期的引用
6、文件,其最新版本包括修订本)适用于本指导性技术文件.GB/T 20225-2006电子成像词汇(lSO12651: 1999, IDT) ISO 15489-1信息与文件文件管理第1部分z概论ISO/TR 15489亿信息与文件文件管理第2部分=指南ISO/TS 23081-1 信息与文件文件管理过程文件的元数据第1部分z原则3 术语和定义GB/T 20225-2006、ISO15489-1和ISO/TR15489-2确立的以及下列术语与定义适用于本指导性技术文件.3. 1 3.2 3.3 3.4 真实的基于文件的电子信息皿thentfcelectronic docnment-b囚edinfo
7、rmation 准确性、可靠性和完整性得以长期保持的基于文件的电子信息.基于立件的信息d侃ument-basedinformatioD 能作为一个整体来处理的独立存在的信息(例如一个影像、主题、电子表格、数据库视图等).注z基于文件的信息包括,但不必局限于文本、影像、表格数据如电子表格或者其组合.基于文件的信息内容docnment -based information content 包含于基于文件的信息中的实质内容.基于文件的信息背景d缸ument-basedinformation context 有关电子文件的产生、控制、使用、存储和管理的信息,以及与其相似材料的有关信息.G/Z 2328
8、3-2009/ISO/TR 18492 :2005 3. 5 3. 6 3. 7 3.8 基于文件的信息结构document-based informatiop structure 基于文件的信息的逻辑属性和物理属性.注2逻稳属性包括逻辑顺序.如可区分子部分的层次结构,而物理属性包括各种要素,如字体、间距。电子存档electronic archiving 以一个独立的物理或逻辑空间存储电子信息,以免丢失、更改或破坏.注2如果以这种方式保护信息,也许将来会核当作可靠的凭证.长期保存long-term pr暗rvation基于文件的电子信息保持可用性和真实性的期限。注2这个时间可能是几年至儿百年,
9、主要取决于机构的需要与要求.对于-些机掬,保存时间由管理者的偏要、法定需要和业务需要而决定.对于档案馆这样保存公共文件的机构,保存基于文件的电子信息的期限通常为几百年.元数据metadata 描述基于文件的电子信息内容(包括检索的索引术语、背景和基于文件的电子信息结构以及长期管理的数据。3.9 迁移mi伊atin几乎不改变基于文件的电子信息的结构、内容和背景,将信息从一种硬件或软件环境或存储介质转移到另一种环境或存储介质的过程.3. 10 3. 11 保存机构srege fpository 承担真实基于文件曲电子信息存储与保存任务的保存机构或实体.注z这种定义不同于a保存机构的技术寇义.技术过
10、时t民hnologi也I曲SOlescence在业内,由于技术的发展和进步而采取的对已有技术方法的取代.4 代号与绩暗语ASCII 美国信息交换标准代码CRC 循环冗余码枝验HTML 超文本链接标识语言JPEG 联合图像专家组(一种压缩标准OCR 光学字符识别PDF/A-l 可移植的文档格式SHA-l 标准散列算法TlFF 标记图像格式WORM 一次写入多次读取XML 扩展标识语言2 5 长期保存5. 1 慨连G8/Z 23283-2009/ISO/TR 18492 :2005 随着计算机信息的产生、利用、存储和保存技术的日益发展,私人和公共部门越来越依赣基于文件的电子信息作为其业务活动的正式
11、凭证。保存机构面临着如何确保真实的基于文件的电子信息长期保存的挑战.信息产生于安全可靠的信息系统,存储于电子介质中,二者可能面临技术过时的风险,如果因技术过时而遗留没有纠正的错误,将会导致基于文件的电子信息无法恢复.各个机构的活动和业务逐渐在无纸化的环境中进行,这一现实加深了确保真实基于文件的电子信息长期利用的重要性.因此,制定和应用长期保存及栓索真实基于文件的电子信息的明确策略是非常必要的.5.2条款涉及到策略的内容.5.2 长期保存策略的目标5.2. 1 概述本条款明确了保存机构制定保存策略时宜考虑的六项关键要素.5.2.2 可读的基于文件的电子信息长期保存策略宜确保基于文件的电子信息在未
12、来可读.为了实现此目标,构成基于文件的电子信息的比特流在以下任何过程可在计算机系统或设备上利用z一-一文件生成时;一一当前存储时z一一当前利用时z一一将来被用来存储电子信息.这四个过程中都有可能使存储于介质中的基于文件的电子信息变得不可读。这主要由两种原因造成.一是不适宜的保存环境.目前用来存储基于文件的电子信息的所有介质普遍容易受到不适环境的侵害,如温度、湿度的波动,这些不利条件会毁坏介质或加速其老化过程.不同类型的数字存储介质需要不同的保存环境以确保其最大寿命.一些存储介质在磁场干扰、灰尘和环境活染物的作用下容易产生信息损坏(磁性存储介质),而其他不易受到外界因素影嘀的介质(光学存储介质)
13、,只要稍加控制存储环境,介质就不易受损.不管使用何种存储介质,关键是要意识到不利的环境会引起各种形式的存储介质的损毁或老化.二是介质过时.介质过时也会导致信息无法读取。存储介质如磁带或光盘与使用的计算机硬件(如磁带或光盘设备存在物理上不兼容,导致信息元法读取.由于信息技术的不断发展,介质今后过时是不可避免的,因为储存技术的进步会继续导致基于文件的电子信息物理存储方式的改变(如记录技术、磁盘驱动硬件/软件接口的改变),存储介质形式和表现记录信息的比特流是一种物理形式(如纠错码。因此,随着时间的推移,存储介质将会与以后使用的介质不兼容.因介质过时,长期保存策略宜特别重视将基于文件的电子信息定期从旧
14、的介质转移到新的介质上.注2数据的可读位与数据的格式同样重要.宜考虑确保数据格式技术中立格式将来能被用户处理.5.2.3 可理解的基于文件的电子信息长期保存策略宜提供可理解的基于文件的电子信息.如果计算机能够描述如何解释比特流,数字信息才能被计算机理解.因此,基于文件的电子信息的可理解性是关于比特流实际代表信息的功能和根据这种信息采取适当措施的能力.示倒g构成数字标记图像格式的二进制代码本身不具有可理解性.然而.影像文件的页眉,通过使用字节烦序和压缩法能使计算机(通过操作系统和影像软件的结合显示和打印影像.同样,文字处理文件魏带元数据,使得文字处理软件易于理解其内容.5.2.4 可识到的基于文
15、件的电子信息长期保存策略宜提供可识别的基于文件的电子信息.宜按特定方式组织、分类和描述可识别的基3 GB/Z 23283-2009/ISO月R18492 ,2005 于文件的电子信息,使用户和信息系统能够依据名字或ID号码等唯一属性区分信息对象.按照共享的属性把基于文件的电子信息归于各种类别以便查询和检索.无法提供这样的识别方式会严重限制查询和检索.5.2.5 可位素的基于文件的电子信息长期保存策略宜提供可检索的基于文件的电子信息,意味着能检索和显示离散的信息对象(或一部分可检索性通常依赖于软件,它需要特定的键值或指针将信息对象的逻辑结掏如数据域或字符串与物理存储位置连接起来.一般来说,在数据
16、库记录、文件系统目录结构、文件分配表、文件头或标签中有这种链接.官包括以下信息=一个对象开始的位置信息、每个要京或数据要素的字节数目和它们在存储介质上物理位咒等.基于文件的电子信息的逻辑结构是一个操作系统功能或结合特殊的应用系统的设备驱动器,这个应用系统可用于存储、管理和利用数字信息.因此,信息对象的可栓索性不可避免地与设备驱动器、应用软件、文件系统或操作系统联系起来.与旧文件格式兼容的新一代文件格式有助于确保基于文件的电子信息的可检索性.然而,向后的兼容性可能会受到限制,因为许多软件开发商只支持特定的文件格式,而其他软件开发商支持所有版本的不同数据格式.例如超文本链接标示语言、静态图像压缩标
17、准、标记图像格式都具有向后兼容性.5.2.6 可理解的基于文件的电子信息长期保存策略宣保证基于文件的电子信息可以理解.可理解的基于文件的电子信息宜把信息传递给计算机和人类。然而.分散的基于文件的电子信息不仅由内容决定的,而且由产生和使用的背景获得的如元数据因此,保存机构宜意识到确保基于文件的电子信息的可理解性与确保纸质文件的可理解性有很大不同。纸质文件物理特性很典型地表达出它们产生意自使用的背景,而产生和使用基于文件的电子信息的背景通常存在逻辑上的联系而不是物理上的。示例s关于一个特定活动的纸质文件也许被装订在一起或放置在一个文件夹里.而一个弟似活动的基于文件的电子信息也许存在于不向位置的不同
18、介质中,因此,宣通过电子形式联系在-起.这些逻椅上的联系可以包括有关业务处理过程及参与者的证明.产生和使用基于文件的电子信息的背景也包含以各种方式摸得的基于文件的电子信息之间的关系,包括在文挡描述中有关用其他材料处理同样问题的参考代码,或连接每一份与相似处理有关的基于文件的电子信息的分类代码无论保存的时间长捏,基于文件的电子信息的成功检索部分取决于这些逻辑关系的保存-5.2.7 真实的基于文件的电子信息5.2.7.1 摄述长期保存策略的关键目标悬确保真实的基于文件的电子信息。真实性是基于文件的电子信息保存的目的所在,如随着时间推移,可靠的信息没有被改变、更改或破坏.试图提供可长期利用的真实基于
19、文件的电子信息的机构宜在他们的策略中考虑以下三个关键的措施za) 迁移和保存Eb) 存储环境zc) 利用和保护。5.2.7.2 基于文件的电子信息的迁移和保存只要电子文件保留在产生环境中,而没有储存在无法更改的一次写入式的介质上,保证其免受更改是很困难.长期保存策略宜提供基于文件的电子信息从其生成环境、产生者和接收者到保存系统或保存库房的迁移措施.比如根据文件的政策和实践,由强立运作的第三方负责保存基于文件的电子信息.5.2.7.3 存储环境长期保存策略宜明确说明存储基于文件的电子信息介质所需一个稳定的存储环境.因为,不利或不适的存储环境使基于文件的电子信息处于危险中.4 GB/Z 23283
20、-2009/ISO/TR 18492: 2005 5.2.7.4 基于文件的电子信息的利用和保妒长期的保存策略宜提供限制利用基于文件的电子信息和免受蓄意和意外更改和破坏的方法。存储在可擦写式介质上的基于文件的电于信息可以被改变而不留下任何的物理证据。在介质和信息系统之间迁移时,基于文件的电子信息也易受到意外的损坏.因此,确保长期基于文件的电子信息真实性的组织宜制定合适的政策、实践和控制技术。常用的控制技术措施包括:一一使用WORM(如不可重写式磁性或光学介质s一一安全的服务器能够阻止直接利用基于文件的电子信息,提供了只读利用的连接;一一循环冗余校验技术用于检查电子传输可靠性,尤其适用于证实基于
21、文件的电子信息自产生之时未改变z一一标准散列算法如SHA-l)可用一种算法能将基于文件的电子信息压缩成固定长度的位审,可有效地成为基于文件的电子信息的独特指纹,以证实它未被更改.6 长期保存策略的要素6. 1 概述保存准确、可靠、真实的基于文件的电子信息意味着以下几点t一一能够通过计算机读取并正确解释;一一能够以人们理解的格式呈现;一一具有逻辑和物理结构、实质内容和在信息产生、接收时明显的背景信息.电子文件存储介质耐久性的局限性和不可避免的技术过时将迫使保存机构为长期保存和利用真实的、可处理的基于文件的电子信息作出关键性选择.面对介质耐久性和技术缺陷的挑战,保存机构有必要采取不同的保存策略和使
22、用不同的工具,这些策略和工具在概念上可划分为以下三项措施,共同构成长期保存策略的基础.a) 保存机构宜采取介质更新来确保介质的耐久性;b) 如果有自动化工具,将基于文件的电子信息从一个技术平台迁移到另一个技术平台是种应对技术过时的有效方法;c) 当元自动迁移工具时,数字信息和影像被存储在过时系统中时,则需要更有效的措施,在现今的技术环境下,可采用模仿过时的信息系统的方法.尽管这种方法已经有人倡导过,但基于长期利用真实基于文件的电子信息的目的,它面临着操作上的限制.因此,仿真技术在本技术报告中没有进一步讨论。6.2 介质亘新6.2.1 辄述有限的介质耐久性和技术过时说明介质定期更新是不可避免的,
23、介质更新也是保持原始比特流的活性来确保真实和可处理的基于文件的电子信息长期保存的基本需要。介质更新要求基于文件的电子信息被重新格式化或拷贝,6.2.2和6.2.3中有详细介绍.6.2.2 重新格式化基于文件的电子信息6.2.2.1 摄述当基于文件的电子信息被重新格式化时,因为转移到不同的物理载体上,它经历了比特疏的改变如从一个18磁道的介质上转移到36磁道的介质上或者字符代码变更(如从7位ASCIl码转到8位ASCII码),但其物理形式或实际内容没有改变。重新格式化不依服于产生基于文件的电子信息的应用软件.6.2.2.2 重新格式化的原因在如下三种情况时,保存机构宜考虑重新格式化基于文件的电子
24、信息za) 迁移时重新格式化z基于文件的电子信息被移交到保存机构时,宜格式化,形成标准编码形式GB/Z 23283-2009/ISO月2毛18492:2005和存储到标准介质上.b) 升级时重新格式化:当保存机构进行设备升级或用新存储设备取代旧设备时,格式化十分必要.c) 定期重新格式化=定期格式化宜与使用介质的预期寿命、设备的预期寿命和介质运行的驱动程序的寿命相一致.6.2.2.3 用于重新格式化的存储介质保存机构宜慎重考虑存储介质的选择,尤其当重新格式化基于文件的电子信息时.机构宜在磁技术和光技术中进行广泛选择.值得考虑的因素有2一-存储容盘大;一一数据传送率高z-一最低预期寿命20年3一
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 23283 2009 基于 文件 电子信息 长期 保存
