GB T 20530-2006 文献档案资料数字化工作导则.pdf
《GB T 20530-2006 文献档案资料数字化工作导则.pdf》由会员分享,可在线阅读,更多相关《GB T 20530-2006 文献档案资料数字化工作导则.pdf(19页珍藏版)》请在麦多课文档分享上搜索。
1、ICS 35. 040 A 24 中华人民圭七和国国家标准GB/T 20530-2006 文献档案资料数字化工作导则Guide for the digitize processing of document and archives 2006-10-09发布中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会2007-03-01实施发布G/T 20530-2006 目次前言. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 引言. . . . . . . . .
2、 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . II I 班回. 2 规范性引用文件3 术语和定义-4 数字化工作标准化指导原则. 5 数字化工作的组织、人员6 数字化对象的确定原则. . . . . . . . . . . . . . . . . . . 3 7 数字化项目的一般过程. . . . . . . . . . 0 . . . . . . . . 4 8 数字化过程中适用技术的选择. . . . 9 数字化成果的存储、管理与使用要求10 数据利用和检索报导体系11 数字化成果的测试指标. . .
3、. . . . . . . . . .11 附录A(资料性附录)现行有关法律、法规目录四附录肌资料性附录)现行分类法目录. . . . . . . . . . . . . . . . . . . . . . . 13 参考文献. . . . . . . . . . . . . . . . . . . 14 GBjT 20530-2006 目U昌本标准为首次制定。本标准的附录A和附录B为资料性附录。本标准由中国标准化研究院提出并归口。本标准起草单位:中国标准化研究院、国家档案局、西安大东国际数据股份有限公司。本标准主要起草人:X1J植婷、董静平、常建宏、房庆、史立武。I G/T 20530-20
4、06 引本标准是为规范我国的文献档案资料数字化工作,建立、健全我国统一的数字化文献档案资料信息检索报导体系,指导我国信息数字化市场的发展,开展国际目录情报交流,促进文献档案资料信息资源的开发,促进我国国民经济发展与科学技术研究而制定的。本标准是开展和制定各种文献档案资料数字化工作及数字化产品标准的重要依据。E GB/T 20530-2006 文献档案资料数字化工作导则1 范围本标准规定了文献档案资料数字化过程中涉及的标准与一般管理;数字化对象的确定原则;数字化工作的一般过程;数字化过程中适用技术的选择;数字化成果的管理;数据利用和检索报导体系;数字化成果的测试指标等。本标准适用于各级政府机构、
5、企事业单位以及慕他且会组织和个人的文献档案资料数字化过程。2 规范性引用文件下列文件中的条款通过本的修改单(不包括勘误的内是否可使用这些文件的最10089:1991) GB/T 17825. 7 GB/T 17825. 1 GJB/J 3865 电子出版物管互联网出版管中华人民共和中华人民共和关于制作3 术语和定义下列术语和定义3. 1 文献document 记录有知识的一切载3.2 档案archives 3. 3 资料article 严本际准的条不适用于本标准,然而,注日期的引用文件,其最新版备3792.1-1983) 为工作、学习或研究的需要而收集的各种材料。3.4 分类classific
6、ation d的引用文件,其随后所有本概推达成协议的各方研究用部标准。们997,idt ISO/IEC 动直接形成,具有保存和利用按照选定的属性(或特征)区分分类对象,将具有某种共同属性(或特征的分类对象集合在一起的过程。(GB/T10113一2003)1 G/T 20530-2006 3. 5 数字化工作digitize processing 按科学的方法分门别类地以电子格式加工、处理、存储文献档案资料,并能对这些信息资掘进行高放的插入、删除、修改、检索、提供访问接口和信息保护等操作的过程。3. 6 挝据data 对事实、概念或指令的一种形式化表示,适于人工或自动方式进行通信、解辞或处理。(
7、GB/T18391) 3. 7 电子文件electronic records 指在数字设备及环境中生成,以数码形式存储于磁带、磁盘、光盘等载体,依颇计算机等数字设备阅读、处理,并可在通信网络上传送的文件。(GB/T18894-2002, 3. 1) 3. 8 电子档案electronic archives 具有保存价值的巳归档的电子文件及相应的支持软件产品和软、硬件说明。(GB/T17678. 1-1999) 3. 9 电子出版物electronic publication 以数字代码方式将图文声像等信息存储在磁、光、电介质上并可以复制发行的大众传播媒体。供通过计算机或者类似功能的设备阅读使用
8、,以表达思想、普及知识和积累文化。(GB/T17933-1999) 3. 10 网络出版物network publication 将数字信息以一定的编排方式存储在网络服务器上,通过计算机和类似功能的联网设备调阅使用,以表达思想、普及知识和传播文化的大众传播媒体。(GB/T17933 1999) 3. 11 多媒体multimedia 结合表现音频、视频、图形、图像、动固和文本的信息组合。CGB/T17933-1999) 3. 12 数字签名digital signature 附加到数据单元上的或是对数据单元作密码变换后的数据,以使数据单元的接收方确认数据单元的来惊和数据单元的完整性,并保护数据
9、,防止被人(例如接收方)伪造。(GB/T18811-2002) 3. 13 密钥key 控制加密与解密操作的-序列符号。3. 14 数据审计data audit 基于对国际互联网(Internet)和企业内部互联网(Intranet)以及远程网(Telenet)之上建立的数据传输和信息发布活动中,进行的版权审计、数据安全审计、数据质量审计和效益审计(含数据过暗、安全屏蔽、漏洞扫描)等。3. 15 社会组织community 以共同的物质生产活动为基础而相互联系的人们,按一定的目的和系统组织起来的团体。3. 16 报导publishing report 是指对数字化成果及数字化检索体系向外界公开
10、发表的过程或行为。2 GBjT 20530一20063. 17 逻辑卷logic volume 是一个区别于物理卷的概念,是指一组内容相互关联的按照一定规律组合起来的数字化成果的存储体。4 数字化工作标准化指导原则4. 1 优先来用国家标准在数字化工作中,凡是已有相应国家标准的,应优先采用国家标准。4.2 积极采用国际标准在制修订数字化工作相关的国家标准过程中,应积极参照和采用ISO/IEC等先进的国际标准z在采标过程中,当国家标准尚未制定时,可参照和采用相应的国际标准。4.3 数据兼窑与共享4. 3. 1 数据兼睿在兼容未来发展技术的基础上,遵循普遍性、权威性、合理性等原则建立的行业标准或企
11、业内部标准,可过夜性的保留使用。但其信息发布和数据传输部分的设计,应采用模块化堆叠设计,以保证在国家标准或国际标准颁布实施时,信息发布和数据传输可根据新的标准体系方便地升级。4.3.2 数据共事为了使采用新标准对原系统的影响最小化,减少投入风险,凡采用内部标准设计的系统,均须考虑建立在二次检索基础上的数据共享接口设计。并至少为数据的重复使用和管理建立联机和脱机使用的两种模式。5 数字化工作的组织、人员5. 1 数字化工作组织认定及标准审查5. 1. 1 组织认定:从事数字化工作的组织机构应具有数字化工作能力。5. 1.2 实施技术环境标准审查:应具备有数字化工作专业知识和能力的人员、技术和设备
12、,能熟知数字化工作的内涵、规则及国际、国家的有关标准,所做的数字化工作能与数字化工作目标相一致。5.2 数字化工作的人员5.2. 1 数字化工作项目负责人应当具有较高的调查研究水平和良好的组织领导能力,全面掌握与任务有关的标准、方法和技术要求,熟练运用与数字化工作有关的软、硬件相关知识和技术。5.2.2 数字化工作各岗位人员应掌握一定的数字化工作技术和基础知识,熟悉与本职工作有关的标准、方法和技术,胜任数字化工作相关岗位的任务。6 数字化对象的确定原则6. 1 合法性确定原则只有通过正规渠道获取的(如档案、图书、资料部门保存的文献档案资料,政府机关与企事业单位的现行文件,证券与金融部门的票据,
13、社会组织和个人保存的文献档案资料,正式出版物等),并且一般不会引起版权争议的文献档案资料才可以作为数字化的对象。6.2 实用性认定原则国家新闻出版总署、国家版权局、文化部、国家档案局等及经国家授权的组织机构认定的文献出案资料,可以作为数字化的对象。数据的产生具有稳定的过程;数据的公布具有稳定的渠道;连续数据的内容具有可比性:这样的文献资料已经为社会公众所接受,在社会上已经具有一定的权威性,也可以作为数字化的对象,例如:名人的手稿;能说明某一历史事实的地图、照片、录音、录像等。3 GBjT 20530-2006 任何进行数字化的文献档案资料,应符合电子出版物管理规定、互联网出版管理暂行规定等有关
14、的规定。6. 3 完整性原则应当选取内容、结构和文体上完整的文献档案资料进行数字化。7 数字化项目的一般过程一个完整的数字化项目般应经过如下过程:7. 1 需求调研编制项目的市场调研报告,7. 2 勤字化工作计划的蜻汁如编制应当符合一一技术设计;一一一人员组织一一一时间安一一原始一一经费一一招7. 3 琦律事文献档案限于)工作zj 一一-明确一一丈献一一一知识一一数7.4 方案设计方案设计应等。方案设计阶段出规划。7.5 技术工艺准备技术工艺准备阱段的一一依据项目任务书(或翻哥)及项目一一对数字化对象进行分析、一一编制作业的指导性技术文件;要完成以下但不的分析与评估,以现自事层次,提供的交互功
15、能计前基础上对项目的细节作一一准备数字化过程中需要的基本软硬件系统,这些软硬件应当符合本标准的相关规定,经试用合格后方可投人数据生产与利用环境。7. 6 制作与编辑项目作业人员应根据作业的指导性技术文件,按照项目进度计划,贯彻项目的质量控制要求,并对数据扯理过程中产生的中间以及结果数据,实行数据移交过程签收制。7. 7 成晶的审校与验收7.7. 1 项目承担单位应组辑专人,对项目作业人员提交的成品进行全面、系统的测试和验收。7.7.2 成品测试需要的文档含数字化产品本身)由专业技术部门出具测试报告,并组织专家验收,出具验收报告。4 GB/T 20530一20067.7.3 成品的标准化审查在对
16、成品进行审校验收的同时应安排对成品进行标准化审查c经标准化审查的数字化成品从格式、存储、分类与代码、传送安全,到所采用的软件、平台等均应符合本标准及其他相关标准的规定。审查结束,应形成标准化审查报告。据准化审查报告是该项目成果报告的重要组成部分。7.8 整理项目的作业文挡完整的作业归中当文件至少应包括如下九大部分:一一项目设计要求书;一一数字化工程标书:一一数字化工程项目投标书J一一数字化工程施工合自;一一数字化工程作,l一一数字化工程一一数字化工一一数字化一一标准化7.9 项目成果A7. 9. 1 成果拖延7.9.1.1 鉴道内若在主要包括:7.9.1.2鉴张晴:任务书或7.9. 1. 3
17、鉴摇罩在在t按照有关过,应限期补制醉在,再次报请7. 9. 1. 4 鉴茹阉:TIiJ:应在归档7.9.2 成果验收7.9.2.1凡7.9.2.2 验收d章的书面验收结7.9.3 成果归档人签字和验收单位盖7.9.3.1 归档内容缩格式、数据库定义;经费决算报告。:任务书或合同书及其相关文件;项目社战tlj数据;采用的软件系统、压的数量和质量报告;成果鉴定i剂和验,结论(待鉴定、验收后归档)j 7.9.3.2归档要求:按照市悦的辛勤悔糊回京系统时,经项目负责人审查签字,由档案管理部门验收后保存。档案材料加吨芦,编排合理蛊膊济南项目文件保密规定合理划分酬,妥善保管。7.9.3.3 归档时间:应在
18、数字化项目成果报告完成后二个月内。8 数字化过程中适用技术的选搏8. 1 分类与棕引技术8. 1. 1 分类的基本原则数字化过程中对信息的分类应当遵循科学性、系统性、简明性、可扩延性、兼容性和综合实用性的原则c8. 1. 2 采用的分类标准对于数字化信息的分类在遵循上述原则的基础上,应根据信息内容情况参照国家和行业有关标准GB(T 20530-2006 和规范。(现行分类法目录参见附录B)8. 1. 3标引标引就是对文献的内容和形式特征进行分析,用科学、规范的人工语言(信息检索语言)来代替分析结果中的自然语言的过程。最常用的标引是分类标引和主题标引两种,前者依据分析结果对文献赋予分类号,后者依
19、据分析结果对文献赋予主题词。8. 1. 4 标引技术对要进行数字化的文献档案资料可以采用人工标引技术,也可以采用如下自动标引技术:无标引技术、自动拍词标引技术、人机结合抽词标引技术、自动赋词标引技术和自由标引技术。8.2 景入与扫描技术下述几种录入与扫描技术都各有利弊,数字化的组织者应当根据项目要求进行准确选择。8.2. 1 规则录入技术按照数字化项目要求,编制一套符合要求的录入规则,数字化工作人员按照规则进行录入,然后再由程序编制人员编制相关程序,将规则录入结果交由程序转化为项目要求的数字化成果。8.2.2 格式录入技术按照数字化项目要求,由程序编制人员编制相关程序,制成既定格式,最后由数字
20、化工作人员按照既定格式直接录入成项日要求的数字化成果。8.2.3 扫描技术如果采用扫描技术,则应根据数字化项目要求,对扫描的分辨率、扫描格式和扫描色彩位深等相关参数作出严格的规定。8.3 数据合成技术对文本、图片等文献资料的数据合戚,一般可以采用以下几种技术:8.3. 1 纯图像技术技术简单,只需将数字化对象扫描成图像,经图像压缩后存储在介质上即可,但由于不能提供方便的检索手段,一般只能当作文献的数字化拷贝。8.3.2 目录文本、正文图像技术目录全部用文本方式存储,正文部分用压缩的图像存储,并在目录与正文之间建立相应的索引关系,用户可以通过这样的索引关系,根据目录找到正文的图像。8.3.3 全
21、文本技术文献中所有文字全部采用文本方式存储,文献中的图像也用一定的代码与之建立固定的联系,这样可以实现全文检索。8.3.4 全文索引技术是文本方式和图像方式的棍合体,文本和图像之间建立索引关系,用户既可以进行全文检索,又可以很方便地在文本和图像之间进行切换。8.4 数据加工质量控制技术8. 4. 1 数据质量精度的确定8. 4. 1. 1 优质:误码率低于0.25/100000 8.4.1.2 良好:误码率超过0.25(10000,未超过O.5(10 000的。8.4. 1. 3 合格:误码率超过O.5/10 000,未超过1(10000的。8. 4. 1. 4 不合格:误码率超过1(1000
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 20530 2006 文献 档案资料 数字化 工作
