GB T 5271.29-2006 信息技术.词汇.第29部分 人工智能.语音识别与合成.pdf
《GB T 5271.29-2006 信息技术.词汇.第29部分 人工智能.语音识别与合成.pdf》由会员分享,可在线阅读,更多相关《GB T 5271.29-2006 信息技术.词汇.第29部分 人工智能.语音识别与合成.pdf(22页珍藏版)》请在麦多课文档分享上搜索。
1、ICS 35.240.20 L 60 道昌中华人民共和国国家标准G/T 5271.29一2006/ISO/IEC2382-29: 1999 词汇信息技术第29部分:人工智能语音识别与合成Information technology-Vocabulary-Part 29: Artificial intelligence-Speech recognition and synthesis CISOjIEC 2382-29: 1999 , IDT) 2006-03-14发布中华人民共和国国家质量监督检验检菇总局中国国家标准化管理委员人2006-07-01实施GB/T 5271.29-2006/ISO/
2、IEC 2382-29: 1999 目次前言.1 I 概述.2 术语和定义.2 29.01 一般术语.2 29.02 语音识别,言语识别.29.03 语音合成,言语合成附录A(资料性附录)中文索引.12 附录职资料性附录)英文索引.14 GB/T 5271.29一2006/ISO/IEC2382-29: 1999 前言GB/T 5271(信息技术词汇共分30部分:一一第1部分:基本术语(GB/T527 1. 1) 一一第2部分z算术和逻辑运算(GB/T527 1. 2) 第3部分:设备技术(GB/T527 1. 3) 一一第4部分z数据的组织(GB/T527 1. 4) 一一第5部分:数据的表
3、示法(GB/T527 1. 5) 一一第6部分z数据的准备与处理(GB/T5271.的一一第7部分:计算机程序设计(GB/T5271. 7) 一一第8部分z安全(GB/T5271.的一一第9部分:数据通信(GB/T527 1. 9) 一一第10部分z操作技术和设施(GB/T527 1. 10) 一一第29部分:人工智能语音识别与合成(GB/T5271. 29) 一一第31部分z人工智能机器学习(GB/T527 1. 31) 一一第32部分:电子邮件(GB/T5271. 32) 一一第34部分z人工智能神经网珞(GB/T527 1. 34) 本部分是GB/T5271术语系列国家标准的第29部分。
4、本部分等同采用了ISO/IEC2382-29: 1999(信息技术词汇第29部分:人工智能语音识别(英文版)。本部分的附录A和附录B是资料性附录。本部分由中华人民共和国信息产业部提出。本部分由中国电子技术标准化研究所归口。本部分起草单位:中国电子技术标准化研究所。本部分主要起草人:王有志、王静。I GB/T 5271.29-2006/ISO/IEC 2382-29: 1999 信息技术词汇第29部分:人工智能语音识别与合成1 概述1. 1 范围GBjT 5271的本部分给出了与信息处理领域相关的概念的术语和定义,并明确了这些条目之间的关系。为方便将此标准翻译成其他语言,给出的定义尽可能避免语言
5、上的特殊性。本部分定义了有关语音识别和语音合成的概念。1.2 规范性引用文件下列文件中的条款通过GBjT5271的本部分的引用而成为本部分的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本部分,然而,鼓励根据本部分达成协议的各方研究是否可使用这些文件的最新版本。凡是不住日期的引用文件,其最新版本适用于本部分。GBjT 5271. 1-2o信息技术词汇第1部分:基本术语(idtISOjIEC 2382-1: 1993) GBjT 5271. 28-2002信息技术词汇第28部分:人工智能基本术语和专家系统CidtISOj IEC 2382-28:1995)
6、GBjT 15237.1一2000术语工作词汇第1部分z理论与应用CeqvISO 1087-1:2000) 1.3 遵循的原则和规则1.3. 1 词条的定义第2章包括许多词条。每个词条由几项必需的要素组成,包括索引号,一个术语或几个同义术语和定义一个概念的短语。另外,一个词条可包括举例、注解或便于理解概念的解释。有时同一个术语可由不同的词条来定义,或一个词条可包括两个或两个以上的概念,说明分别见1.3. 5和1.3. 8。本部分使用其他的术语,例如词汇、概念、术语和定义,其意义在GBjT15237.1中有定义。1. 3. 2 词条的组成每个词条包括1.3. 1中规定的必需的要素,如果需要,可增
7、加一些要素。词条按以下的顺序包括如下要素:a) 索引号(对发布的本部分标准所有语言是公共的); b) 术语或某语言中首选的术语,对某语言中的概念若没有首选术语表示,用五个点的符号表示(. . . . . ) ;在一个术语中,一行点用来表示每个特定事例中被选的一个词;c) 某个国家的首选术语(根据GBjT4880规则标明hd) 术语的缩写;e) 许用的同义术语;f) 定义的正文(见1.3.4);g) 以例开头的一个或几个例子;h) 以注开头的概念应用领域标明特殊事例的一个或几个注解;i) 词条共用的图片、图示或表格。1.3.3 词条的分类本标准的每部分被分配两个数字组成的序列号,并以表示基本术语
8、的01开始。GB/T 527 1. 29-2006/ISO/ IEC 2382-29 : 1999 词条按组分类,每组被分配一个四个数字组成的序列号;前两个数字表示该组在本标准中所处的部分。每个词条被分配一个六个数字组成的索引号;前四个数字表示该词条所在的标准部分和组。为使本标准不同语言的版本都是相关联的,分配给标准部分、组和词条的序号都应是相同的。1. 3. 4 术语的选择和定义的用语选择术语和定义用语尽可能按照己规定的用法。当出现矛盾时,采用大多数同意的方法。1. 3. 5 多义术语在一种工作语言中,如果一个给定的术语有几个意义,每个意义则给定一个单独的词条以便于翻译成其他的语言。性,按上
9、述规则放术语的定义只是几个文字的区别,这些术语及其定义川在术语和在走义中的相同的次序放在方括弧中。为避前面的最后一个词可放在方括弧里面,并且每变化一次贝l1.3.9 定义中黑体味端的用法和星号的用法术语在定义、主注解中用黑体字啊4时,贝。电示该术语已本词汇的其是,只有当这些术i首时出现在每一个词条中时1该书语布印成黑l字的形式。黑体也用于一和陆的其他语法J式.jlrf名词复提和勃词汩分向形式。定义在GB/T5在站所有以黑体也现如术语的基本加列邮际分后面的索引伸(见l.3.11)。当在不同的词条中帘的两个术i一位接着另一个,用自扯者分阶(或仅用标点分隔)。以一般字体出现的?或赤F,按一般词典中或
10、权威性技术词汇的弃义理解。1. 3. 10 拼法本标准的英文版本中,术语、在芬、例子和注解的拼写一般按美语的拼写?式。其他正确的拼写可在不与本标准发生冲突的情况之便严。1. 3. 11 索引表的编制、对于使用的每一种i语吾言,在每部、多词术语按字母顺序出现在每个关键宇后。2 术语和定义29 人工智能一一语音识别与合成29 . 01 -般术语29 . 01. 01 声(音)sound 一种能让昕神经感觉到的空气振动或其他介质振动。2 GB/T 5271.29-2006/ISO/IEC 2382-29 : 1999 29.01. 02 话音voice 一种由喉部产生、口中发出的声音。29.01.
11、03 语音speech 古生r五回b目某一给定自然语言的话音关模式,或模拟这类模式的声学信号。29.01. 04 人工语音artificial speech 29. 01 . 05 29.01. 06 29.01.07 29.01. 09 29 . 01.10 29.01. 11 话音输入voice input 一种由某一功能单元接收的话音信号序列。29.01.12 语音输入speech input 一种由某一功能单元接收的语音信号序列。29.01. 13 语音输出speech output 话音输出(不推荐使用)voice output(deprecated) 一种由某一功能单元产生的或者复
12、现的,采用预录或合成形式的语音信号序列。3 GB/T 5271.29-2006/ISO/IEC 2382-29: 1999 29.0 1. 14 语音模板speech template 一组预录的或基于规则的话音特性:存储在某一功能单元之内,供将来参比或匹配使用。29.01. 15 语音处理speech processing 对语音信号所作的处理(如语音分析、语音压缩、语音识别及语音合成)。29.01.16 语音分析speech analysis 对某一语音信号的各特征参数的提取。注:特征参数包括:单个声段(元音与辅音)的性质,音节结构,韵律特征,形素结构,词素,语段,短语,子句及长话语段的约
13、束。29.0 1. 17 音素phoneme 在给定的某一自然语言中,可识别的最小语音单位。29.01. 18 双音子diphone 一种如下语音段:从一个音素的稳定部分,延伸至紧接音素的稳定部分,其间的过渡部分也包括在内。29.0 1. 19 语音谱圈speech spectrogram 讲话谱圄utterance spectrogram 语音频率特征的一种图形表示。注:在语音识别中,语音谱图通常是基本的研究工具。29.01.20 声固sonogram 将某一声学信号的频率与相应振幅作为时间的函数来表征的一种图形表示。29.0 1. 21 共振峰formant 在语音频带中,因人的声道共振而
14、形成的一种频率突显区域。29.01.22 语音数字化speech digitizing; speech digitization 由模拟祷语音信号到数字信号的转换。29.01.23 语音编码speech coding; speech encoding 语音波形编码speech waveform coding 按照一组能合理重构语音信号的规则,由经数字化的语音信号到离散的数据元序列的转换。注:语音数字化可与用于语音压缩的某一编码相结合。因此,语音编码这一术语常指这种组合运算。29.01.24 预测编码(用于语音识别与合成)prediction coding( in speech recognit
15、ion and synthesis) 在一固定持续期的时间窗上,用于对输入养信号与某一预测的信号之差进行编码的语音编码。29.01.25 线性预测编码Iinear prediction coding 以先前样本的线性组合来预测出信号样本的预测编码。4 GB/T 5271.29-2006/ISO/IEC 2382-29: 1999 注:此类线性组合的系数,一般由对输入信号与由先前鼓据预测的信号之间的均方误差求极小值得到。29.01.26 子带编码sub-band coding 先以滤波器组对信号滤波,再对各输出信号分开编码的语音编码。29.01.27 语音压缩speech compression
16、 用于在较窄的频带上传输或存储语音信号,或者采用比正常情况下所必需的比特量少的一种语音处理技术。例:预测编码,子带编码,利用共振峰的编码。29.01.28 语音可懂度speech intelligibility 某一语音输出被正确理解的能力(通常以语音单位的百分比度量)。29.01. 29 语音削波speech clipping 是一种处理技术:使峰值信号以某最大幅值为限界,或者,将低于某一幅值的信号归约到零。29.01. 30 语音识别speech recognition 自动语音识别automatic speech recognition ASR(缩略语)利用功能单元进行的,从语音信号到语
17、音内容的某一表示的转换。注1:拟识别的内容能由词或音素的适当序列表达。注2:此条目是对GB/T527 1. 28-2002中28.01.15释文的改进。29.01. 31 语音识别voice recognition 利用功能单元进行的,表示从话音信号到话音某些声学特征的某一的转换。注:话音识别用于说话人识别。29.01.32 说话人识别speaker recognition 通过对其话音的某些声学特征的分析,来获得该特定说话人的信息过程。29.01. 33 话音特征标记voice signature 话音签名声纹voiceprint 用于对某一特定说话人加以辨识的一种话音样本。29.01.34
18、 说话人验证speaker verification 说话人鉴别speaker authentication 用于判定某语音样本是否由身份已申明的某人所说的一种说话人识别形式。注:说话人验证主要用于限制对信息、设施或处所的访问。29.01.35 说话人辨认speaker identification 一种说话人识别形式:将某一话音样本与对应于不同人的一组话音特征标记作比较,以确定是由谁所说。5 GB/T 5271.29-2006/ISO/IEC 2382-29: 1999 29.0 1. 36 (对)说话人适应speaker adaptation 一种语音识别方法:让某一系统能基于说话人的附加
19、语音样本,自动修改识别模型。注:另参阅适应性训练与说话人适应性系统。29.0 1. 37 话音命令voice command 口述命令spoken command 能由某一功能单元作为一条命令来识别的语音输入。注:用户发出的话音命令,采用从某一小型词表中抽取隔离式词组的或词序列的形式。29.0 1. 38 话音控制Uvoice control 语音控制speech contr91 29.0 1. 42 适应性训练为改进性能29.0 1. 43 口语辨认spokt有从某人的语音样棋29 . 01. 44、- 口语翻译s川崎lan等仕alslation口译为在说不同语言的人们之间提供奕流手段的过程
20、:先识别跟1吾言的i吾音,再把消息内容翻译成目标、语言,并将适当的口述消息融入该目标语言。29.02 语音识别,言语识别29. 02.01 语音-文本转换speech-t命textconversion STT转换STT conversion 由语音输入到文本的转换。29. 02. 02 语音-模式匹配speech-pattern matching 从i吾音样品中提取的特征参数,与用识别词表预录的语音模板的特征参数之间的匹配。6 GB/T 527 1.29-2006/ISO/IEC 2382-29 : 1999 29. 02 . 03 语音理解speech understanding 对语音信号
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 5271.29 2006 信息技术 词汇 29 部分 人工智能 语音 识别 合成
