GB T 19101-2003 建立术语语料库的一般原则与方法.pdf
《GB T 19101-2003 建立术语语料库的一般原则与方法.pdf》由会员分享,可在线阅读,更多相关《GB T 19101-2003 建立术语语料库的一般原则与方法.pdf(6页珍藏版)》请在麦多课文档分享上搜索。
1、G/T 19101-2003 前言本标准是术i吾数据库的系列国家标准之一。已经发布的系列标准有:GB/T 13726-1992 术语与辞书条目的记录交换用磁带格式GB/T 16785一1997术语工作概念与术语的协调GB/T 16786一1997术语工作计算机应用数据类目GB/T 17532-1998术语工作计算机应用词汇GB/T 18155-2000 术语工作计算机应用机器可读术语交换格式(MARTIF)协商交换GB/T 13725-2001 建立术语数据库的一般原则与方法GB/T 15387.1-2001 术语数据库开发文件编制指南GB/T 15387.2-2001 术语数据库开发指南GB
2、/T 15625-2001 术语数据库技术评价指南GB/T 19102-2003 术语部件库的信息描述规范本标准的附录A是资料性附录。本标准由全国术语标准化技术委员会提出。本标准由中国标准研究中心归口。本标准由中国标准研究中心、北京大学计算语言学研究所等单位起草。本标准主要起草人:陈玉忠、宋敏、何燕、叶盛、穗志方、程永红、肖玉敬。田GB/T 19101-2003 建立术语语料库的一般原则与方法1 范围本标准规定了建立术语语料库的一般原则与方法。本标准运用于术语语料库的研究、开发、维护及有关管理工作。其他涉及语料库建设的工作也可参照使用。2 规范性引用文件下列文件中的条款通过本标准的引用而成为本
3、标准的条款。凡是注目期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。GB/T 13725-2001 建立术语数据库的一般原则与方法GB/T 15237.1-2000术语工作词汇第1部分2理论与应用(eqvISO 1087-1 :2000) 3 术语和定义GB/T 15237.1确立的术语和定义适用于本标准。为了便于使用,本标准重复了其中的部分术语和定义。3.1 3.2 3.3 3.4 术语term 在特定专业领域中一般概念的词语指称.GB/T 152
4、37.1-2000.3.4. 3J 语料库m叩us集中起来供分析用的语言数据集合。GB/T15237.1-2000.3.6. 9J 术语语料库terminol嗨ycorp田分析和研究术语用的语料库。术语语料库系统terminologycorpns system 包含管理框架的术语语料库。注g改自GB/T17532-1998.7.7. 4 基本要求4.1 语料的要求4. 1. 1 一敖性人库语料应是格式致、有效的。4.1.2 适用性语料应从正式出版物或从权威性网站发布的相关专业文献中选择。4. 1. 3 忠实性语料中原来使用的标题、摘要、关键字以及参考文献等各类原始信息和篇章结构应保持完整。GB
5、/T 19101-2003 4. 1. 4 广泛性在特定的领域内研究术语时,宜按各个子领域数量相对平衡的原则收集语料。对于自各个子领域发展的不均衡性造成新术语分布的不均衡,宜在领域收集语料总数不变的情况下,容许部分子领域间的语料数量进行适当调配,以增加所收集语料对新术语的覆盖量。语料来源宣考虑题材多样性的原则,应综合考虑其专业性、代表性和客观性的应用需求。在翻译和原创作品类型的收集上,应确定合适的比例。在选取语料时还应适当考虑地域分布原则,即适当收取港、澳、台和海外华人的学术文章。4.1.5 适时性应及时补充和更新语料。4.2 置标语言的要求4.2.1 通用性应采用广泛使用且具备相应的软件工具
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 19101 2003 建立 术语 语料库 一般 原则 方法
