GB T 12200.2-1994 汉语信息处理词汇 02部分 汉语和汉字.pdf
《GB T 12200.2-1994 汉语信息处理词汇 02部分 汉语和汉字.pdf》由会员分享,可在线阅读,更多相关《GB T 12200.2-1994 汉语信息处理词汇 02部分 汉语和汉字.pdf(25页珍藏版)》请在麦多课文档分享上搜索。
1、中华人民共和国国家标准汉语信息处理词汇部分汉语和汉字发布实施国家技术监督局发布中华人民共和国国家标准汉语信息处理词汇部分汉语和汉字国家技术监督局批准实施本词汇涉及汉语信息处理的各个主要方面 其中包括基本术语 汉语和汉字 汉字编码 汉字识别汉语语音处理 汉语理解 机器翻译 汉语信息处理设备 汉语信息处理系统软件 汉语信息处理技术应用及其他等部分 在学科方面 本词汇具有相对的独立性和系统性主题内容与适用范围主题内容本标准 部分 规定了汉语信息处理中最重要的或最基本的汉语 汉字术语 也收入了一些必要的 通用的语言文字术语适用范围本标准适用于有关汉语信息处理领域的科研 设计 生产 使用 维护 管理 教
2、学和出版等方面引用标准信息交换用汉字编码字符集 基本集信息交换用汉字 点阵字模集信息交换用汉字 点阵字模集遵循的原则和规则词条词条是本标准为使用者提供的便于检索和参阅的基本单元词条的组成本标准的词条一般由下述几部分构成索引号 不同语种文本都是一致的术语术语的缩写允许用的同义术语术语的英译名术语的英文缩写术语的定义以 例 开头的一个或几个示例以 注 开头的一个或几个注释 用以说明术语应用的特殊情况图 图表或表格多义术语当一个术语有几个不同的意义时 分别在不同的词条中给予定义 以便于译成其他语种缩写有些术语具有常用的缩写 但在定义 示例及注释中 不采用这种缩写符号的用法圆括号的用法有些术语使用时
3、在不引起误解的情况下 可以省略掉其中一部分 可省略的部分为黑体字 并用圆括号括起 在定义 示例和注释中 只用完整的术语有些术语后圆括号内的非黑体字 不是术语的组成部分 而是用来说明该术语的使用须知和特殊应用形式或语法形式的方括号的用法当几个术语使用同一个定义格式 个别词不相同 时 可将它们合并在一个词条中 个别不相同的词放在方括号中 表示可以替换方括号前面的词 方括号及其中的词在术语及定义中出现的顺序必须一致黑体字与星号术语在定义 示例和注释中用黑体字印刷时 表示该术语已在本词汇的其他词条中给过定义 并且只有当它在另一词条中首次出现时才印成黑体字如果有两个已分别在不同的词条中给过定义的术语连在
4、一起使用时 则用星号 将这两个术语隔开英译名术语所对应的英文采用美国习用的拼法索引本标准附有汉语索引和英文索引 索引包括本部分的全部术语根据汉语索引或英文索引 可查出术语正文的索引号术语和定义汉语和汉字一般术语言语语言的运用及其结果 是语言的具体体现书面语语言的书面变体口语语言的口头变体方言一般指语言的地方变体有时也指语言的社会变体或个人变体共时历史发展中某一时间断面的情况历时历史发展中不同时间断面的连续分布某一语言成分能够出现的语境集合层面语言结构中相互关联的不同方面例语音层面语法层面语义层面语用层面层次语言的不同层面中的结构的等级区别特征将一个语言成分与另一个语言成分区别开来的要素例汉语的
5、 和 都是双唇清塞音 利用 不送气 送气 这一对语音区别特征可以将它们区别开来例 男人 和 女人 都是指人 可以用 阳性 阴性 这一对语义区别特征将它们区别开来特征矩阵用区别特征的结合来描写某种语言成分的图表例 图表汉语塞辅音的特征矩阵不送气 送气双唇舌尖舌根图表 一些指人名词的语义特征矩阵阳性 阴性成年 男人 女人未成年 男孩 女孩变体在一定语境中同一语言成分的若干个变化形式 可分为自由变体和条件变体例现代汉语的音位就有 等变体有标记一对语言成分中 对于某区别特征取正值 带有该区别特征的标记的成分 称作有标记的例 这一对音素中 带有区别特征 浊音 是有标记的无标记一对语言成分中 不带有表示某
6、正值区别特征的标记的成分称作无标记的例 这一对音素中 不带有区别特征 浊音 是无标记的组合关系构成线性序列的语言成分之间的关系例 在 马 这个词的音位序列 中 这两个音位之间有组合关系例 在 看电视 这个短语中 看 和 电视 之间也有组合关系聚合关系在结构的一定位置上可以相互替换的语言成分之间的关系例 在 的空位上可以相互替换的音位有 分别相当于汉语拼音字母 这些音位之间就有一种聚合关系 在 我 书 的空位上可相互替换的动词有读 看 写 等等 这些词之间也就有一种聚合关系功能某语言成分在包含它的结构中所起的作用 也泛指某些语言成分与别的语言成分的组合能力 例如 在音节 拿 中的功能是作声母在音
7、节 满 中的功能是作韵尾伟大 在 祖国伟大 中的功能是作谓语在 伟大祖国 中的功能是作定语结构在同一系统中各种语言成分之间的有机联系文字字母拼音文字或注音符号的最小书写单位例汉语拼音方案的字母 汉字注音字母 也叫注音符号 的字母 字体同一汉字由于各种原因 历史演变 书写 印刷等 而形成的各种不同体式例印刷体宋体仿宋体黑体楷体等手写体古体 繁体 简体正体异体俗体 讹体等手写体用于日常交际的人工书写的字体一般使用各种笔作为书写工具印刷体用于印刷的字体现代汉字的印刷体以 年发布的现代汉语通用字表 为准 八十年代又产生了用于计算机显示和打印的国家标准印刷体例 和宋体现代最通行的汉字印刷体由宋代刻版所用
8、字体发展而来例 夜来风雨声仿宋体汉字主要印刷体之一 模仿宋体产生的字体例未央前殿月轮高楷体汉字主要印刷体之一 由手写的正规楷书发展而来例金屋无人见泪痕黑体汉字主要印刷体之一字体粗黑醒目例寒食东风御柳斜字号印刷体依据字体大小所编的号例初号国小初号国一号国二号国国国国三号国国国国四号国国国国小四号 新四号国国国国五号国国国国国国国国国小五号 新五号国国国国国国国国国六号国国国国国国国国国国国国国国国国计算机用字也以字号为标准 但激光照排系统以 级 为标准 有些系统可以无级放大或缩小字模点阵以点阵形式所表示的规范化的字形例如 字模点阵等古代汉字秦以前的汉字包括甲骨文金文篆书六国文字等甲 骨 文刻在龟
9、甲兽骨上的古代汉字例金 钟鼎 文铸在青铜器上的古代汉字例篆书秦和六国通行的笔画圆转的古代汉字也是一种字体秦代早期通行的篆书叫大篆 秦代统一中国后规范的篆书叫小篆例大篆小篆隶书由篆书简化演变而成的一种汉字字体其笔画由圆转变成方折 具有波磔 有古隶 汉隶之分例古隶汉隶草书一种书写便捷的汉字字体笔画简约 多用连笔 有章草 今草 狂草之分例楷书汉隶在草书影响下形成的一种字体形体方正笔画平直例行书同时具有楷书和草书特点的一种中间字体笔势简易而流畅例正体同一个汉字的各种不同形体中规范的标准形体例注 括号内为异体异体汉字中正体之外的其他形体例注 括号内为正体字形特指构成每个方块汉字的二维图形 构成汉字字形的
10、要素是笔画笔数及汉字部件的位置关系等笔画构成楷书汉字字形的最小连笔单位 汉字最基本笔画有横 一 竖 撇 丿 点 折乙 等笔顺书写每个汉字时的笔画的次序和方向 现代汉字的笔顺可参见现代汉语通用字表笔数构成一个汉字或汉字部件的笔画数汉字部件由笔画组成的具有组配汉字功能的构字单位 现代汉字部件按是否成字可分为成字部件与非成字部件例成字部件 木心口也非成字部件 氵亻刂礻部首一部分可以成批构字的部件 凡含有某一部件构成的字在字典中均排列在一起 该部件作为领头单位排在开头 成为查字的依据 称为部首 部首多由形旁构成例木 松 柏 杨 架 杏 林 相偏旁合体字的构字单位的传统称呼 旧称合体字 由两个或两个以上
11、汉字部件构成 左为偏 右为旁 现在统称偏旁 偏旁本为独体字 在古代汉字中偏旁一般与单独成字时形状相同 现代汉字偏旁有一些变化 如 心 在左为 忄 刀 在右为 刂 火 在下为 灬 左边的 阜 和右边的 邑 均作 阝 等汉字结构部件构成汉字时的方式和规则 最基本的汉字结构是独体结构和合体结构合体结构又分为左右结构 上下结构 包围结构等类例 独体结构 人 山 火左右结构 相 休 江上下结构 思 吕 杏包围结构 句 问 国字量在一定集合中汉字的数量例现代汉语通用字表 字量为 个信息交换用汉字编码字符集基本集字量为 个汉语大字典 字量约有 个字频在一定数量的语料中同一个字出现的频度 一般用字的出现次数或
12、覆盖率来表示字音字的读音汉字中有的一字一音 有的一字多音例 安 好 说 字序汉字在一定的集合中按一定规则排列的次序 汉字的序列原则主要有以下几种 音序 如 按汉语拼音字母顺序 形序 如 按部首按笔数按笔顺按笔形等顺序 频序 如 按字的频度降频或升频顺序信息交换用汉字编码字符集 基本集中华人民共和国国家标准 标准号 其中一级汉字个 二级汉字 个 标准规定了汉字信息处理用的基本图形字符及二进制编码表示 适用于一般汉字处理 汉字通信等系统之间的信息交换 在 之外 另有若干辅助集正写法文字符号形体的规范和使用规则 包括正字法和正词法汉字正字法可依据简化字总表修订后的 第一批异体字整理表现代汉语通用字表
13、 等汉语正词法可参照汉语拼音正词法基本规则 和 信息处理用现代汉语分词规范检字法在汉字的一定子集中检索汉字的规则 汉字的检字法可依音序 形序等不同规则编排 通用的检字法有汉语拼音检字法部首检字法笔画检字法 四角号码检字法等语音音素语音的最小单位 不同特点的发音动作构成语音中不同的音素 音素分元音辅音两大类音位一种语言里能区别意义的最小语音单位 一个音位常包含有一个或一个以上的音位变体音位变体一个音位所包含的不能区别意义的不同的音素音系某种语言或方言的全部音位及其结构音高声音的高低 由声波的振动频率决定音强声音的强弱 由声波的振幅大小决定音长声音的长短 即发音动作持续时间的相对长短音量声音的大小
14、音质声音的本质性特色 不同的音质 声波的波形不同元音发音时气流不受阻 声带振动 发音器官肌肉均衡紧张的一类音素辅音发音时气流受阻 发音器官肌肉紧张程度不均衡的一类音素语图由语图仪将语音信号分析出的一种时间 频率 幅度三维图形语调话语中语音的高低 强弱 长短 快慢的变化语流 连续 音变连续发音中的语音变化重音语流中某一音节上的音强音高音长的变化声母汉语音节的起始部分 汉语普通话的声母可分为 大类 塞音 擦音 塞擦音 鼻音 边音零声母零声母汉语直接以元音开始的音节无声母 称为零声母韵母汉语音节中除声母以外的部分 汉语普通话的韵母包括单韵母 复韵母 鼻韵母三类声调一个音节内相对音高及其变化 又称字调
15、调类一种语言或方言中声调的类别例普通话中有阴平 阳平 上声 去声四个调类调值语言里各类声调的实际音值 一般用五度标记法表示例普通话中阴平调值为 阳平调值为 上声调值为 去声调值为变调语流音变中声调发生变化的现象声 调 符 号标记声调的符号例普通话中阴平调号为 阳平调号为 上声调号为 去声调号为轻声 音汉语音节中一种念成又轻又短的调子儿化汉语音节中给韵母加上一种卷舌动作 即 儿 的音色双拼采用声母韵母两部分拼读或拼写汉语音节的一种拼音方式注音符号第一套法定的汉语拼音字母年由读音统一会制定 年公布实行 符号形式根据篆书改变而成威妥玛式英国人威妥玛 编写的汉语课本语言自迩集 年 中使用拉丁字母拼写汉
16、字的一种拼法形式 后被广泛用于拼写中国人名 地名 现已被汉语拼音方案所代替词汇词素具有一定形式和意义的最小的构词单位例 人 玻璃 老虎 的 老 和 虎 桌子 的 桌 和 子词根构词成分中意义比较实在的词素是主要构词成分 词义的基础 例 老虎 的 虎 桌子 的桌 学习 的 学 和 习词缀附着在词根上表示附加意义的词素主要有前缀 后缀例 老虎 的 老 为前缀 桌子 的 子 为后缀单纯词由一个词素构成的词例 人 走 玻璃 迪斯科合成词由两个或两个以上词素构成的词 包括复合词和派生词 附加词 两大类例复合词 人民 走读 学习派生词 老虎 桌子 现代化固定短语由两个或两个以上的词组成的结构稳定的语言使用
17、单位 其意义往往不等于各个组成部分的意义简单迭加 例如成语 惯用语等单音 节 词只含一个音节的词例 书 本儿 双音 节 词含两个音节的词例 毛巾 手绢儿 多音 节 词含两个以上音节的词例 生产力 可口可乐 同音词读音相同而意义不同的词 可分为同形同音词和异形同音词两类例 米 粮食 米 长度单位 同形同音词人世 人氏 人事 异形同音词注 信息处理界也常把声韵母相同而声调不同的词作为同音词异读词写法和意义相同而读音不同的词例 落魄 同形词写法相同而意义不同的词例 清明 清明节 与清明 政治清明 同形同音打 动词 与打 量词 同形异音异体词同一个词的不同写法例 缘故 原故同义词意义相同或相近的词 可
18、分为等义词和近义词两类例 电脑 计算机 等义词勇敢 英勇 近义词反义词意义相反或相对的词例 开 关 相反远 近 相对义项词的相对独立的意义项目单义词只有一个义项的词多义词有两个或两个以上义项的词基本词较稳定 较通用 构造新的词语能力较强的词常用词使用频率较高的词通用词使用范围较广的词专用词只用于专门领域的词词频在一定数量的语料中同一个词出现的频度 一般用词的出现次数或覆盖率来表示词的使用度反映某词的常用性 通用性的综合指标 与它的词频成正比 与它在各类语料中分布的均匀程度成正比注 参看 现代汉语频率词典 编纂说明语法语素最小的音义结合的语言单位 参见词素短语由若干个词按照一定的层次和句法关系组
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 12200.2 1994 汉语 信息处理 词汇 02 部分 汉字
