GB T 3358.1-2009 统计学词汇及符号 第1部分 一般统计术语与用于概率的术语.pdf
《GB T 3358.1-2009 统计学词汇及符号 第1部分 一般统计术语与用于概率的术语.pdf》由会员分享,可在线阅读,更多相关《GB T 3358.1-2009 统计学词汇及符号 第1部分 一般统计术语与用于概率的术语.pdf(60页珍藏版)》请在麦多课文档分享上搜索。
1、ICS 0312030A 41 囝亘中华人民共和国国家标准GBT 33581-2009IS0 3534-1:2006代替GBq33581 1993统计学词汇及符号第1部分:一般统计术语与用于概率的术语Statistics-Vocabulary and symbols-Part 1:General statistical terms and terms used in probability20091015发布(IS0 35341:2006,IDT)2010-02-01实施丰瞀髅零瓣訾箍警瞥星发布中国国家标准化管理委员会厘11目 次前言引言-范围1一般统计术语2用于概率的术语附录A(资料性附录)
2、符号附录B(资料性附录)统计概念图附录C(资料性附录)概率概念图附录D(资料性附录) 定义标准中的术语所使用的方法参考文献索引-汉语拼音索引英文对应词索引GBT 33581-2009ISO 35341:2006M弘u蛎堪曲跎刖 罱GBT 33581-2009IS0 3534-1:2006GBT 3358统计学词汇及符号分为以下部分:第1部分:一般统计术语与用于概率的术语;第2部分:应用统计;第3部分:实验设计。本部分为GBT 3358的第1部分,等同采用1S0 3534 1:2006统计学词汇及符号第1部分:一般统计术语与用于概率的术语。与ISO 3534 1:2006相比,订正了原文的错误,
3、修正原文中概念表述不够准确的部分,主要变化如下:删去了124原文中的注1; 。238示例中变异系数的计算式“09909950994 97”更正为“0995091105 56”;269中“事件o-代数砖”中,要求满足的性质a)“属于始”修订为“0属于捧”。为便于使用,本部分作了下列编辑性修改:删去了Iso前言;为术语的简练起见,在少数术语中,使用中括号表示其中可省略部分。例如:25中,事件A的概率(probabilityof an event A),表示此术语实际定义的是“概率(probability)”,其中“事件A的”在许多场合可省略。又如234“r阶原点矩 (moment of order
4、 r)”表示原文的“r阶矩(moment of order r)”也称为“r阶原点矩”。本部分代替GBT 33581 1993统计学术语 第一部分 一般统计术语,与GBT 33581-1993相比,主要变化如下:名称改为统计学词汇及符号第1部分:一般统计术语与用于概率的术语;对术语条目作了较大的调整:增加了一般统计术语及用于概率的术语;将GBT 335811993中第4章“观测和测试结果的一般术语”及第5章“抽样方法的一般术语”中的内容移至GBT 3358的第2部分;增加了大量的示例及注释;增加了术语概念图(附录B、附录c)及定义标准中的术语所使用的方法的附录D,并将关于符号的附录A改为资料性
5、附录。本部分的附录A、附录B、附录c和附录D均为资料性附录。本部分由全国统计方法应用标准化技术委员会提出并归口。本部分主要起草单位:中国科学院数学与系统科学研究院、中国标准化研究院、北京师范大学、中国科学技术大学、苏州大学。本部分主要起草人:冯士雍、陈敏、于丹、崔恒建、吴耀华、丁文兴、汪仁官、于振凡。本部分于1993年首次发布,本次为第一次修订。GBT 33581-2009150 35341:2006引 言目前版本的GBT 33581和GBT 33582是兼容的,其共同目标是在一致、准确而简洁的前提下,将定义所需的数学程度限制在最低水平。由于GBT 33581是概率和统计的基础术语,所以有必要
6、用相对严格而复杂的数学语言来表述。考虑到GBT 33582及其他统计方法应用标准的使用者有时需要查询GBT 33581中术语的定义,因此本部分的术语尽可能用通俗的方式来描述,并辅以注释及示例。尽管这些非正式的描述并不能取代正式的定义,但为统计专业以外的人员提供了有效的概念性的定义,能满足这些术语标准的大多数用户的需要。为了进一步适应经常使用GBT 33582或GBT 6379等标准的用户,通过注释和示例使GBT 33581更易于理解。一套明确定义的,且相对完整的概率统计术语对统计标准的编制及有效使用是必需的。定义必须足够准确、且具备数学意义上的严格性,使在编制其他统计标准时避免出现概念模糊。当
7、然,对概念的更详细的解释、背景和应用领域可在初等概率统计教材中找到。资料性附录B与附录c分别为一般统计术语与用于概率的术语提供了系列概念框图。其中一般统计术语包含六个概念图;用于概率的术语包含四个概念图。某些术语同时出现在几个不同的框图中,从而起到一组概念与另一组概念的联系作用。附录D提供了关于概念图的简要介绍及其解释。这些框图有助于本次修订,因为它们有助于描述不同术语之间的相互联系。这些框图也有助于标准文本的翻译。除非另有说明,本标准中大部分术语均在一维(单变量)场合下定义。这避免了许多术语在类似条件下进行重复定义。范围GBT 335812009Is0 35341:2006统计学词汇及符号第
8、1部分:一般统计术语与用于概率的术语GBT 3358的本部分规定了用于标准起草的一般统计术语、用于概率的术语的定义及部分术语的符号。本部分中的术语分为:a)一般统计术语(第1章);b)用于概率的术语(第2章)。附录A列出了本部分推荐使用的符号。附录B和附录C是本部分所有术语条目的概念框图。1一般统计术语11总体population所考虑对象的全体。注1:总体可是真实有限或无限的,也可是完全虚构的。有时,特别是在调查抽样中也使用“有限总体”;在一些流程性物质抽样中也使用“无限总体”。在第2章中,从概率的角度,总体在一定意义上可看作是样本空间(21)。注2:对于虚构的总体,允许人们想象在不同假定条
9、件下的数据所具有的属性。因此,虚构总体在统计研究的设计阶段,特别是确定适宜样本量时非常有用。虚构总体所含对象数目可以是有限的也可以是无限的。在统计推断中,这是一个对评价统计研究证据强度特别有用的概念。注3:下面的例子能帮助理解总体这一概念:若有三个村庄被选中作人口统计或健康研究,总体即由这三个村庄的全体居民构成;若这三个村庄是从某个特定区域中的所有村庄中随机抽选出来的,则总体由该区域中的所有居民构成。1 21314抽样单元sampling unit总体(11)划分成若干部分中的每一部分。注:抽样单元依赖于具体问题中所感兴趣的最小部分。抽样单元可以是一个人、一个家庭、一个学校或个行政单位等。样本
10、sample由一个或者多个抽样单元(12)组成的总体(11)的子集。注l:根据所研究总体的情况,样本中的每个单元可是真实或抽象的个体,也可是具体的数值。注2:在GBT 3358 2关于样本的定义中,包括一个抽样框的示例。抽样框在从有限总体中抽取随机样本时是必须的。观测值observed value由样本(13)中每个单元获得的相关特性的值。注1:常用的同义词是“实现”和“数据”。GHT 33581-2009IS0 35341:2006注2:本定义并没有指明值的来源或如何被获得。观测值可表示某随机变量(2 10)的一次实现,但并不一定如此。它可以是相继用于统计分析的若干值中的一个。正确的推断需要
11、一定的统计假定,但首先要做的是对观测值的计算概括或图形描述。仅当需要解决进一步的问题,如确定观测值落人某一指定集合的概率,统计机制才是重要而本质的。观测值分析的初始阶段通常称为数据分析。1描述性统计量descriptive statistics观测值(14)的图形、数值或其他概括性描述。示例1:数值描述包括样本均值(1 15)、样本极差(1 10)、样本标准差(1 17)等。示例2:图形描述包括箱线图、示意图、Q Q图、正态分位图、散点图、多元散点图和直方图等。16随机样本random sample由随机抽取的方法获得的样本(13)。注1:本定义比GBi 3358 2给出的定义限制要少,样本允
12、许来自无限总体。注2:当从有限样本空间(2 1)中抽取”个抽样单元组成样本时,N个抽样单元的任意一种组合都会必特定的概率(2 5)被抽中。对于调查抽样方案而言,每一种可能组合被抽中的概率可事先计算。注3:对有限榉卒空间的调查抽样,随机样本可以通过不同的抽样方法得到,如分层随机抽样、随机起点的系统抽样、整群抽样、与辅助变量的大小成比例的概率抽样以及其他可能的抽样。注4:本定义一般是指实际观测值(14)。这些观测值被认为是随机变量(2 10)的实现,其中每个观测值都对应于一个随机变量。当由随机样本构造估计量(1 12)、统计检验(148)的检验统计量或置信区间(128)时,本定义是指从样本中的抽象
13、个体得到的随机变量而不是这些随机变量的实际观测值。注5:无限总体中的随机样本一般是从样本空间中重复抽取产生的。根据注4的解释,此时样本由独立同分布的随机变量组成。17简单随机样本simple random sample(有限总体给定样本量的每个子集都有相等的被抽选概率的随机样本(16)。注:此处的定义与GBT 33582中的定义是一致的,仅在措辞上稍有不同。18统计量statistic由随机变量(210)完全确定的函数。注1:在1 6注4的意义下,统计量是随机样本(16)中随机变量的函数。沣2:按注1。若X,x:。,x,)是来自未知均值(235)和未知标准差(2 37)一的正态分布(2 50)
14、的随机样本,则样本均值(1 15)(X,+Xz+x。)n是一个统计量;而(X。+X z-一X。)”一F不是统计量,因为它包含了未知参数(29)F。注3:相应于数理统计中的表述,此处给出的是统计量的一种技术性定义。英语中,统计量(statistic)的复数形式就是统计学(statistics),它是一门包括了统计方法应用标准中所叙述的分析方法的技术学科。19次序统计量order statistic由随机样本(16)中的随机变量(210)的值,依非降次序排列所确定的统计量(18)。示例:假设样本观测值为9,13,7,6,13,7,19,6,10,7,则次序统计照的观测值为:6,6,7,7,7,9,
15、lo,1 3,1 3,1 0。这些值是x,x。的一次实现。注l:假设随机样本(16)的观测值(1 4)为,z:,按非降的次序排列为zzz,则(-,r,z。)是次序统计量(x,xt,x)的观测值,。为第k个次序统计量的观测值。注2:在实际应用中,为获得一组数据的次序统计量,即是将数据按照注1中所述方式进行排序。将一组数据按上述方法排序后,还可获得其他几个术语定义的有用的统计量,如1 1 0、1 11等。注3:次序统计量涉及按照非降次序排列后的位置来识别的样本值。正如示例所示,将样本值(随机变量的实现)排序比将未观测的随机变量排序更容易理解。它可以通过按照非降次序排列的随机样本(1 6)来理解随机
16、变2GBT 33581-2009ISO 3534-1:2006量;比如”个随机变量的最大值可以先于它的实现值来研究。沣4:单个次序统计量是随机变量的个特定函数。这个函数可以简单地由其在随机变量排序集合中的位置或序状【称为秩)来确定。注5:结点值会引起一些潜在的问题特别屉对丁二离散随机变量或者是低分辨的实现。用“非降”而不是“递增”的说法可解决这个问题。需要强捌的是结点值都要保留而不能合并成一个。在上面的示例中,“6”有两个实现,所以“6”是结点值。注6:排序按照随机变量的实数值进行而小足按照其绝对值进行。注7:次序统计量(X,x,X。,)组成”维随机变量”是样本中观测值的个数。注8:次序统计量
17、的分量也是次序统汁量,而且保持其在原样本排序中的位置标识。注9:最小值,摄大值咀及样本量为奇数时的样本中位数(1 13)都是特殊的次序统计量。比如样本量为lI,那幺x是最小值,x、是最大值x是样本中位数。110样本极差sample range最大次序统计量(19)与最小次序统汁量的差;示例:在l 9中的示例中样本极差的观测值为196一l 3。沣:在统计过程控制中尤其当样本萱相对比较小刚,样本极差通常用来监测过程的离散程度随时问的变化。111中程数midrange最大和最小次序统计量(19)的平均值(115)。示例:l 9的示例巾中程数的观测值为(6+19)2=l 2 j。沣:中程数能够对较小数
18、据集的中心提供一种快捷而简单的估计。1 12估计量estimator日用于对参数0估计(136)的统计量(18)。沣j:样本均值t1 15)是总体均值L2 35)p的一个估计量。例如对于正态分布L2 50),样本均值是总体均值p的估计甚。注2:要估计总体的特征(如一维(元)分布(2 16)的众数(2 27)个合适的估计鼍可以足分布参数估计量时函数,也可以是随机样本(1 6)的复杂函数。注3:此处所讲的“估计量”是一个宽泛的概念。它包括某参数的点估h也包括用十预测的区间估计。估计量也包括该估计量和其他特殊形式的统计量。另见136注的训论。113样本中位数sample median若样本量(见GB
19、T 33582 20091 226)”为奇数,则是第(”+1)2个次序统计量(19);若样本量”是偶数则是第n2与第(n2)+1个次序统计量之和除以2。月i例:续1 9的示例8为样本中位数的一个实现,此时样本量为10(偶数),第5和第6个次序统计量分别为7和9,其甲均值为8。尽管严格来说样本中位数是作为一个随机变量来定义的,但在实际中也说“样本中位数为8”。注I:财十样本量为”的随机样本(1 6)其随机变量(2 10)按照非降顺序从l到”排列,如果样本量为奇数,则样本中位数为第(”】)2个随机变量,如果样本量为偶数则样本中忙数为第(n2)个与第(”+1)2个随机变董的平均值。注2:从概念上讲对
20、 个没有观测到的随机变量进行排序似乎是不可能的。但不经观测也可理解次序统计量的结构。在实际中通过获得观测值并对其进行排序,从而得到次序统计量的实现。这些实现值可用于解释次序统计量的结构。注3:样本中位数是分布中间位置的一个估计各有一半的样本单元大于等于或小于等于它。注1:样本中位数在实际问题中是有用的,它提供r一个对数据极端值不敏感的估计量。例如,中位收入和中位房价都是常用的统计指标。3GBT 33581-2009IS0 3534-1:2006114k阶样本矩sample moment of order k随机样本(16)中随机变量(210)的次幂的和除以和中的项数。注1:对于样奉量为n的随机
21、样本x,XX,阶样本矩为:上y搿 “j注2:本术语也称为女阶样本原点矩。注3:一阶样本矩即为样本均值(1 15)。注4:虽然本定义中女可取任意值,但在实际中常用的是一l样本均值(115),=2与样本方差(1 16)和样本标准差(1 17)有关女一3与样本偏度系数(120)有关和k=4 L与样本峰度系数(1 21)有关的情形。115样本均值sample mean平均数average算术平均值arithmetic mean随机样本(16)中随机变量(210)的和除以和中的项数。示例:续l 9中的示例,观测值的和为97,样本量为10,样本均值的实现为9 7。注1:在1 8中注3的意义下,样本均值作为
22、统计量是随机样本中随机变量的函数。必须区分统计量与由随机样本中观测值(14)计算得出的样本均值的数值。注2:样本均值作为统计量,常用作总体均值(235)的估计量。算术平均值是它的同义词。注3:对样本量为”的随机样本x,x:,墨,样本均值为:贾=1Y,。i一1注4:样本均值就是一阶样本矩。注5:样本量为2时,样本均值、样本中位数(1 1 3)和中程数“11)皆相同。116样本方差sample varianceS2随机样本(16)中随机变量(210)与样本均值(115)差的平方和用和中项数减1除。示例:续19中的示例,样本观测值与样本均值差的平方和为15810,样本量10减1为9,计算得样本方差为
23、1 7 57。注1:样本方差S2作为统计量(8),是随机样本中随机变量的函数。必须区分这个统计量与根据随机样本观测值(1 4)计算得出的样本方差的数值,该值称为经验样本方差或观测样本方差,通常记作52。注2:对样本量为”的随机样本x、,x。,x。,样奉均值为x,则s2一i与(x,叉)2。注3:样本方差作为一个统计量“差不多”等于该随机变量(2 1 0)与样本均值(1 15)差的平方的平均数(其中“差不多”是指这里平均用”一1而不是用”作分母),用” 1作分母是为总体方差(2 36)提供一个无偏估计量(134)。注4:”一1称为自由度(254)。注5:样本方差可以近似认为是中,b化样本随机变量(
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 3358.1 2009 统计学 词汇 符号 部分 一般 统计 术语 用于 概率
