GB T 27702-2011 信息与文献 信息检索(Z39.50)应用服务定义和协议规范.pdf
《GB T 27702-2011 信息与文献 信息检索(Z39.50)应用服务定义和协议规范.pdf》由会员分享,可在线阅读,更多相关《GB T 27702-2011 信息与文献 信息检索(Z39.50)应用服务定义和协议规范.pdf(200页珍藏版)》请在麦多课文档分享上搜索。
1、E ICS 35.240.30 A 14 中华人民圭七-、GE 和国国家标准GB/T 27702-2011 /ISO 23950: 1998 信息与文献信息检索CZ39.50)应用服务定义和协议规范Information and documentation-Information retrieval CZ39. 50)一Application service definition and protocol specification CISO 23950: 1998 , IDT) 2011-12-30发布2012-05-01实施;i.。刊!3h.,.,. uoo.,.;卡干,爪JF非飞呻t1.
2、:叫.y. ,:1. -;也.e.)._.莲、妇问/中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会发布G/T 27702-2011 /ISO 23950: 1998 目次前言.1 引言. II l 范围12 规范性引用文件13 术语和定义24 信息检索服务104. 1 信息检索服务的模型和特征114.2 信息检索服务机制134.3 消息/记录长度和分段534. 4 操作和引用标识584. 5 并发操作584. 6 组成规范594.7 Type-1查询和Type一101查询 60 5 协议规范.m5.1 Z39. 50 APDU的抽象语法和ASN.1规范 63 5. 2 协议过程
3、795. 3 扩展性规则885.4 一致性. . . . . . . . . . . . . . . . . . . . 88 附录A(规范性附录)OID39. 50对象标识符95附录B(规范性附录)CTX:应用环境basic-Z39.50-ac 附录C(规范性附录)ATR:属性集四附录D(规范性附录)ER扎错误诊断105附录E(规范性附录)REC:记录语法114附录F(规范性附录)RSC:资源报告格式137附录G(规范性附录)ACC:访问控制格式139附录H(规范性附录)EXT:本标准定义的扩展服务 142 附录1(规范性附录)USR:用户信息格式157附录J(规迫性附录)ESP:元素规市格
4、式160附录K(规范性附录)VAR:变量集162附录L(规范性附录)TAG:标签集定义和模式165附录M(资料性附录)ERS:扩展结构集模型169附录N(资料性附录)RET: Z39. 50索取171附录。(资料性附录)PRO:Z39.50框架文件189附录P(资料性附录)维护机构的指定 190 GB/T 27702-2011 /ISO 23950: 1998 前言本标准按照GB/T1. 1-2009给出的规则起草。本标准等同采用国际标准ISO23950: 1998(信息与文献信息检索(Z39.50)应用服务定义和协议规范。本标准对国际标准ISO23950: 1998的中译文做了修改,技术内容
5、未作变动。本标准共有16个附录。附录A附录L是规范性附录,附录M附录P是资料性附录。本标准由全国信息与文献标准化技术委员会(SAC/TC的提出并归口。本标准起草单位:中国国防科技信息中心、中国科学技术信息研究所、北京大学。本标准主要起草人:真臻、龚昌明、汤珊红、李秀锦、赵晋巍、冯海涛、陈凌。I GB/T 27702-2011 /ISO 23950: 1998 引IS0 23950与ANS1/N1S0Z39. 50-1995具有相同的内容,只是在文体上有一些细微的差别。例如,ANSIjN1S0Z39. 50中的附件,IS023950中称为附录。这两个标准具有相同的名称信息检索(Z39.50):应
6、用服务定义和协议规范。为避免认为这是两个不同的标准,在两?标准的名称中都明确地使用Z39.50.Z39.50通常指本标准定义的服务和协议。IS023950被批准后,将取代相关标准IS010162和IS010163.在本篇序言的其余部分,凡提到Z39.50-1995是指ANSl/N1S0Z39.50-1995,它与IS023950完全相同。凡提到Z39.50-1988、Z39.50-1992和Z39.50-1994,是指与IS023950不同的较早的版本。ANSI/N1S0 Z39. 50一1995信息检索(Z39.50):应用服务定义和协议规范是ANSI/N1S0Z39.50-1992的修订版
7、。Z39.50-1995的草案稿是指Z39.50-1994,实施者宜注意作为Z39.50 1994提出的所有草案都不是该标准的最新版。Z39.50-1994的多种草案稿都是在Z39.50-1995之前提出的,Z39.50-1995是最终定稿。1984年,本协议提出时仅用于书目信息领域。随着越来越多的专业领域对Z39.50产生兴趣,1990年成立了Z39.50实施者小组(ZIG).ZIG的成员包括希望获取或提供各种信息的制造商、零售商、咨询商、信息提供商和大学,这些信息包括书目信息、文本信息、图像信息、金融信息、公共设施信息、化学信息和新闻。所有感兴趣的团体都可以成为ZIG的成员。Z39.50维
8、护处成立于1989年,它隶属于美国国会图书馆。其任务是修订Z39.50一1988,使之与国际标准IS010162/10163搜索与索取(SR)完全兼容。当时,为1992版提出了多个新的特性,以支持多种信息检索活动。但是,这些新特性尚未完全制订出来,如果把它们纳入1992版会大大地延误标准的公布。因此,维护处暂缓采纳新特性的提议,但同时向实施者承诺,将继续进行新特性的制订工作,下一版标准将成为与1992版兼容的超集。Z39.50-1992取代了Z39.50-1988,成为与IS010162/ 10163搜索与索取兼容的超集。1992年,维护处对Z39.50的实施者进行了一次正式调查,确定提议中的
9、新特性的重要程度。调查的目的是:(a)把这些特性缩小到可管理的范围之内;(b)确定提出的新特性是否得到充分说明和理解;( c)估测它们的费用和复杂程度。调查结果表明有些特性是必不可少的,另有一些特性从更长远的角度考虑可以删除。除此之外的其他特性,调查无法得出结论,对它们的处理最终根据多数人的意见决定。Z39.50-1995于1991年年底开始制定。从1991年12月到1994年4月,维护处在每次ZIG会议上都提出一个修订草案。实施者在ZIG的因特网邮件列表和会议上,仔细阅读和充分讨论每个草案。对每个草案的评论和意见,以及在ZIG会议上达成的协议都在后继的草案中得到体现。1994年4月,ZIG建
10、议将草案最终定稿。1992版被认为是第2版,1995版被认为是第3版。这些版本名确实具有特定的协议意义,但并不指标准的版本。Z30.50-1992规定第2版协议;Z39.50二1995规定第2版和第3版协议。Z39.50-1992代替了过时的Z39.50-1988,但是,Z39.50一-1992和Z39.50-1995之间的关系则完全不同。Z39.50-1995是与1992版兼容的超集,实施者可以从Z39.50一一1995中得到第2版的全部细节,并实现与Z39.50一1992兼容。协议基础本协议规定了客户机和服务器之间信息交换的格式和过程,使客户机能够(a)请求服务器搜索某个数据库,并识别出满
11、足特定要求的记录,(b)索取识别出的部分或全部记录。客户机可以代表用户创建请求:本协议描述(可能位于不同的计算机上的)客户机和服务器之间的n G/T 27702-2011 /ISO 23950: 1998 通信;不描述客户机和用户之间的交互。Z39.50-1992和ISO23950均支持下列基本功能:客户机可以发送搜索请求,指明一个或多个数据库,并包含一个查询以及用于确定搜索出的记录是否作为响应的部分返回的参数。服务器以识别出的记录数作为响应,并可能返回部分或所有记录。然后,客户机可以索取选定的记录。客户机假设搜索到的记录形成一个结果集(一个有序集,其顺序由服务器确定),这些记录可以根据它们在
12、结果集中的位置来引用。可选的功能包括:某些情况下,客户机不希望接收完整的数据库记录时,可以指定一个数据元集,指明拟索取的数据元。例如,客户机可以指定如果识别出的记录少于或等于5条,则传输完整记录;若多于5条,则传输简要记录。客户机可以为响应记录指定首选语法,例如:USMARC。客户机可以命名结果集,以便以后引用。客户机可以删除命名的结果集。服务器可以在处理请求之前要求验证以便对客户机施加访问控制。服务器可以通过发送非征求性或征求性的状态报告,提供资源控制;服务器可以暂停处理并允许客户机指明是否继续。查询表达式ISO 23950 对Type-1查询的支持做出详细的规定和要求。Type-1查询用一
13、个一个的搜索项表示,每个搜索项都有一个属性集,例如指明搜索项的类型(主题、名称等),是否被截断,以及搜索项的结构。服务器负责将这些属性映射到数据库的逻辑设计中。在一个Type-1查询中,搜索项可以通过布尔运算符组合起来。这些搜索项和运算符以逆波兰标记法表示。属性集与某个搜索项相关联的属性都属于某个特定的属性集,其定义是经过注册的,也就是被分配了一个唯一的、全局可识别的、包含在查询中的对象标识符,即属性集标识符。附录CATR定义并注册了属性集bib-1,它描述了用于书目查询的各种属性。bib-1属性集是由书目界开发的;如有需要,其他团体也可以开发并注册属性集。附加的属性集可以在ISO23950之
14、外进行注册。晌应记录本协议将出现在服务器响应消息中的记录分为两类:数据库记录和诊断记录。附录EREC注册了各种MARC格式的对象标识符,包括USMARC、UKMARC、NorwayMARC 和CANMARC;服务器返回的数据库记录带有这些对象标识符。该附录定义了其他几种类型的记录格式,并规定了注册更多记录格式的方法。诊断记录同样也带有标识其格式的对象标识符。附录DERR定义并注册了两种诊断记录格式(Z39.50-1992定义了其中一种),包括了用于书目应用的各种诊断代码。也可以注册其他的诊断记录格式。新特性下面汇总了Z39.50-1995的增强特性(相对于1992版)0第2版和第3版是协议的两
15、个版本;Z39.50-1992和Z39.50-1995则是标准的两个版本。用Z39.50-1995的新特性描述的某一特性般适用于两个协议版本。例如扫描:实施者可以将扫描服务增加到巳存在的Z39.50-1992实现中,而不必利用其他新特性。下面分四类对增强特性进行描述:搜索、索取、新的服务和机制,以及其他增强的特性。搜索属性。属性和属性集具有许多新特性。在第3版中,单个查询(甚至单个搜索项)中的属性可以来自不同的属性集。这有两个优点:第一,这一特性可用于搜索多个数据库(虽然第2版支持对多个数据皿GB/T 27702-20门/ISO23950: 1998 库进行搜索,但一个查询包含的所有属性必须属
16、于单个属性集,这就制约了搜索多个数据库的能力,除非这些数据库相似);第二,定义新的属性集时可以减少重复。第3版增加了两个能够灵活地定义属性集的新特性。一是为属性值定义了新的数据类型(在第2版中,属性值只能是数值型)。二是属性集定义现在可以列出一些可选的评估规则(例如,是否允许服务器使用它认为更合适的属性来代替某个属性),并且查询时可选择其中一条规则。增强的bib-1属性集定义采用了这一新特性。在Z39.50-1995中(除了包含Z39.50一1992中所有的属性), bib-1定义还包含了许多新的属性。扩展结果集模型。Z39.50-1992中开发了结果集的基本模型;1995版描述了扩展结果集模
17、型,这一模型支持扩展的邻近搜索。i亥扩展模型还支持第3版的一种新的搜索功能一一限制,这项功能(实际上)是对结果集的一种操作。它允许根据指定的属性从结果集中选择记录。搜索项。在第3版中,查询用的搜索项可以具有多种数据类型。(在第2版中,搜索项为二进制类型,实质上没有数据类型,通常用结构属性描述其类型。)由于减少了对结构属性的需要,该新特性将简化查询以及属性集定义。中间结果。在Z39.50-1995中,服务器报告搜索进展时,可以提供每个查询部件(即每个子查询或每个数据库)的信息,作为搜索响应的一部分(仅用于第3版)或作为资源控制的一部分。服务器还可以为单个查询部件创建结果集并提供对结果集的访问。索
18、取分段。在第2版中,一个索取响应被限制在单个消息中;服务器尽可能将请求的记录放入该消息中,如果放不下,则能放多少放多少。例如,客户机想要索取一万条记录,并且知道在单个消息中不可能索取这一万条记录。典型的作法是客户机请求所有的一万条记录,等待响应,确定索取到了多少条记录,然后为其余记录发送另一个请求。在许多环境下,这种方法很有效,但在高速网络中这样做会非常慢。服务器在发送每组记录前都必须等待请求,这就产生一个延迟。对于普通网络来说,这种延迟可以忽略不计,但对高速网络来说,这种延迟是不能忍受的。在第3版中,服务器可以用多个连续响应消息来回应一个索取请求,其间无需再穿插请求。当单个记录太长、无法放入
19、单个消息中时,出现更为严重的分段问题。第3版引入了二级分段:一个记录可以跨越多个响应消息。客户机或服务器可以选择支持任何一级的分段,或不分段(第2版规则适用这种情况)。索取工具。为支持各种索取应用、特别是文献索取应用,ZIG用了两年多时间开发出具有丰富索取功能的一个扩展模型及一套工具。附录N对该模型作了详细描述。Z39.50-1995指定了几种新的对象类(模式、标签集和变量),并根据这些对象类和其他类定义了一些特定对象。该附录提供了这些对象的详细语义,描述了如何将它们结合起来使用提供多种文献索取功能。下面是几个例子:一条数据库记录可以包括多篇文献。客户机可以找到并索取某篇指定文献,而不是整个数
20、据库记录。客户机可以索取某篇文献逻辑上或者物理上的某个特定部分,例如,特定的页、特定的章节、特定的标题、所有标题、或者所有的图像。客户机还可以只索取标题,例如所有章或者所有节的标题。可以用多种格式(如PostScript、SGML)、语言、表示参数(如行长、每页行数和分栏等)以及其他变量获取某篇文献。客户机可以发现某篇文献支持哪些变量,以及与某种特殊变量形式相关的信息:例如,按照特定变量或者文献大小索取文献的费用。最终,客户机可以按照所需变量索取该文献或某个特定部分)。对于某个给定搜索,与某篇文献相关联的可能是命中点:它是指向(文献内)与搜索相关的搜索项的指针。客户机可以索取某篇文献中的命中点
21、,以迅速定位到满意的那些部分。客户机也可以只索取(按重要性排序的)命中点,然后索取指定的满意的那些部分。N GB/T 27702-2011 /ISO 23950: 1998 新的服务与机制扫描和排序。扫描和排序是239.50-1995中新增的服务,前者用于对列表或索引中的搜索项进行扫描,后者用于对结果集进行排序。扫描目前是239.50浏览机制中仅有的一种服务,但拟在今后的版本中增加其他浏览功能。扩展服务群。扩展服务群是239.501995中的一种新机制,它包含一项新的239.50服务,即扩展服务群服务,用于创建239.50会话之外执行的一个特定的扩展服务任务,可以用239.50服务来监督该任务
22、的进度。特定的扩展服务包括:保存结果集、建立周期性查询计划、输出文献、订购文献和更新数据库。解释。新的解释机制允许客户机索取服务器实施情况的细节:一般特性(描述、联系信息、运行时间、限制、使用费用等人可供搜索的数据库、索引、属性集、属性细节、模式、记录语法、排序能力和扩展服务。服务器在一个特定的数据库中维护解释信息,客户机可以利用239.50的搜索和索取机制来访问这个数据库。本标准详细描述了解释信息的格式。有些解释信息对客户机是透明的,以便直接显示给客户机用户,并且也是这样指定的(例如一般特性勺。有些解释信息可由客户机和用户共享。例如,客户机可以索取可搜索数据库的列表;客户机可以为列表中的每个
23、数据库显示一个非正式的名称、一个图标,和一段简要的描述。同时,客户机可以在协议消息中保留使用的真实的数据库名称,并可以不显示这个真名。有些解释信息对用户是完全透明的。例如,客户机可以索取某个数据库支持的属性信息,并在形成一个查询表达式时(即把用户提供的查询转化为一个239.50的Type-1查询时),使用该信息。其他增强的特性终止和重新初始化。第3版包括更为灵活地终止239.50会话的方法,这实际上允许在不中断网络连接的情况下重新初始化。并发操作。第3版允许多个并发操作。而在第2版中,操作是严格按顺序执行的。诊断。大多数239.50服务都包括诊断功能。在第2版中,一个诊断必须与本标准定义的特定
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 27702 2011 信息 文献 检索 Z39 50 应用服务 定义 协议 规范
