GB T 3358.1-1993 统计学术语 第1部分 一般统计术语.pdf
《GB T 3358.1-1993 统计学术语 第1部分 一般统计术语.pdf》由会员分享,可在线阅读,更多相关《GB T 3358.1-1993 统计学术语 第1部分 一般统计术语.pdf(30页珍藏版)》请在麦多课文档分享上搜索。
1、中华人民共和国国家标准统计第一部分学术语一般统计术语Terms for statistics Part I : Terms for general statistics 1 主题内容与适用范围本标准规定r常用的数理统计术语。G!T 3358.1.93 1-持B马3:-.尽币本标准i重用于各类标准与技术文件中涉及的数理统计术语,对作类研究技术报告和:写作,l涉及的数理统I斗生活也应参照使用。2 概率论术语2. 1 概率probability 度?过-!启机)r件发生riJ能性大小的实数,其值介j0与1之间。注随矶F件的慨1. .XJ联告分布函数。(马j相l果是维随机变茧的分布函数F(Jj.I:
2、. .:n)可表示为一非负函数f(.1川.1 )的积分FJi h, dJzj jfh f(rl hU叶dtmlJ称该是维随机变量f.)k维连续随机变量,I (町,一. Ik )利、为它的f榄率密度雨吉1-/维ji缕随tt变iff的分布的、卫Ik 1佳连续分布。只能取有限或叮列组值(.r.),日,l川的L维随机变量称为走继离散随机变故.给LHC取在f!Il可jtffi(J,j .-(X(_0称为分布的自由度。泣,自由用:r.为止整贯立时的r分布是两+烛立随机变量之商的分布-分于是标准止15随机变址,外F,足lll1_It勺的x分布随机变量被真自由度除所得商的正平厅恨。F分布F-distribut
3、ion 种连续概芋分布,其密度函数为.尸(认,)/2J. u 工川:0-1f(JJ-一一一一一-J叫1/2吟/一一一.r(v,/2)r(片/2),一(lI+Hrvt+咐2式中1 ).i为正整被.分别称为分布的第-自由度与第二自由度。在自由度为叭,的F分布是两个强、工的随机变应之商的分布,分f和分BJC都是2分布随机4:fitFILif令红的自由Lfi,陀对数正态分布log- normal distribution d种连续概率分布.其密度函数为:f(J) 式,j 1 lrCJ.:(机。1 1 I ln.x一尸1, XOI一!一一,-11.1. ,rz;:;rL 2,JJ , 3358.1-93
4、 GB/T b若X是对数正态分布,则lnX的概率分布是期望为,标准差;与的f态分布。也、/(.r)中的自然对数ln可用常用对数191替,此时,(乓n,r川I (r) 百四PGKF主密度函数中可用x-r(:l二?;Y)代替X,从而得到l推广。此时,Y为位置参数。指数分布exponential distriht tlOn一种连续概率分布,其密度函数为22. 39 f (J-) Ae-; ,r 0 , 式中).00注=上述密度函数巾可用x-YCr二三n代替I,从而得到推广e此时,Y为位置参数。r分布gamma distribution 一种连续概率分布,其密度属数为:2.40 f(:r) 一土-;:
5、;xalexpl-号1rc);r -r I 式中aO,O分别称为分布的形状参数与尺度参数,而。1 1d r e a r mo FIll-J ) ( r 注ziC上述分布密度函数中可用x-Y(X?Y)代替h从而得到推广,此时称为位置卷数。Li参数为/2,卢2的F分布.即是自由度为的x分布。beta distribution B分布种连续分布,其密度函数为:2.41 1(十卢)_a-I/1 _1O,为分布的形状参数。I电极值分布type 一种连续概率分布,其分布函数为:I 2.42 F(x) expe-(.r-J)勺,0,一O.O,一0 cn,:_r O.O0。注。泊松分布的期望和方差都是。越几何
6、分衔hypergeometric dst ribu1ion 种离散概率分布.其概率函数为2.48 (干)(吧二?iI(X二x)二二二一二一.二i N, 1, n ,1 式巾N.M(运N).n(三N)是正整数,工为斗在数,其取值程围为max(口.n十二M-Nh.川江nlTl(Af,n)。工维正态分布一种连续二维概率分布,其密度函数为bivar1e normal distribution 2.49 1 I 1 11:r一,11i 1年刁兰7xpE=77Ll丁7Jf (.r .y) = 2rv 一叫气生l气坠)+(弓子)J). -cX)0,O.-I2)维情形。multinmia.l distribu
7、tion 多项分布斗中离散多维概率分布,其概率函数为2. 50 P(X凡= zU1忖川川.川.川川.-.l k .Y. - 0. 1. ,n , (i二l,.,k),二;JJ灯,36 GB/T 3358.1 93 式中户,?O(i1,2,剖,工p,-L3 基本统计术语3. 1 3. 2 3. 3 3. 4 3. 5 3.6 3. 7 3. 8 3.9 个体item. indvidual 可以单独观测和研究的个物体、一定量的材料或寸欠服务。也指点示上述物体、材料或眼好的个定量成定性的特性值。总体population 一个统计问题中所涉及个体的全体U总体分布population distribut
8、ion 当个体理解为定量特惋值时,总体的每一个体可看成是某一确定的随机坠茧的个观测值刷:这个随机变量的分布为总体分布。特性ch racte口8tIC 所考察的定性或定量的性戚或指标。注:特性在任一特定个体上的值称为特性值。样本sample 按一定程序从总体中抽取的一组(一个或多个)个体(或抽样单兀,见5.2)。注:样丰巾的每个个体有时也称为样品。手若样本是按某种随机方式抽取的,贝1)样本可以看成是一组随机变量,具中每个随机变M也树下却样本分量。抽样sampling 从总体中抽取样本。样本量tiample sizt 样本中所包含的个体(或抽样单元)的数目。独立同分布样本indcpendently
9、 identcal1 y distributed sample 分莹的分布与总体分布相同且各分量相互独立的样本。注.在数理统计中,独1司分布样丰通常称为简单随机样丰(Rimplerandom Rample) 0在使用此本ma,!.赞注意与5. 7中的术语相区别。观i则值observed valuc 作为4次观测结果而确定的特性值。3. 10 且class3. 11 3. 12 3. 13 3. 14 3. 15 对于定量特性,将该特性的整个变化区间分成相连接而不噎叠的若干小区间.这种小区1)称为主旺。组限class limits 组的十、F界限。注应明确规定上、l限巾的哪一个属于该组。组中值m
10、id-point of class 组的上、下限的算术f均值。mMIi dass width 组的l、下限之差。顿数absolute frequency 多次观测中一给定事件发生的次数,或落入一特定组的:xli值个数。累积部!数cumulative absolulC fn:quency 在定量特性情形,小于或等于某给定值,或某给定组的上限的现测值个数n-GB!T 3358.1- 93 3. 16 频率relative fr叫uencyj切数与试验或观Imj总次数之比。3. 17 累积频率cumulative relative frequency 累积频数与试验或观测总次数之比。3. 18 直方
11、罔h川ogram连续随机变量观测H宦分布状况的一种图形表示。在横坐标轴上将该随机变量的取fJHZI间分YJm.分别以各组为底作矩形,其面积等于相应组的频率(锁数)。t主以加1率(频数)衷心的直方图称为频率(频数)直方图。3. 19条Ii)图barchart 离散随机变量观测值分布状况的一种阁形表示,在一坐标轴上点出观测值的数值.分别从这J略t旦出发向同一方向作与该借标轴垂直的线条,其长度等于相应的观测值的频率(顿数k3. 20散网scattcrdiagram 两个随机变量的每一对观测值用直角y,标平面t的一个点表示所成的图形。3. 21 9J耳其表contingency table 观测数据;
12、按两个或更多定性特性分类时所列出的频数表Git 对于定量特性,若将行1按其值分成绍,也可列出列联丧。3.22 统计量statlstlc 样本的函数,它不依赖于未知参数。3.23 样本均值sample rncan 祥牛二丸,X,的算术平均数:3.24 次序统计量order statistcs 主二1安x.-on-EZi 将样本的各分量从小到大排列成X(I)?X,X川,称(X川.X(21,X川)为次序统计址.X(,称为第2个次序统tt量。3. 25 样木中位数sample median 当样木垦n为奇数时,样本中位数是第(n+ll/2个次序绪计量:当n为偶数时,是第n/24、与?在tI/2十l个次
13、序统计量的算术平均数。3.26 中程数midrange 样本中最大值与最小值的1)术均数(X, + X ,) /2。3. 27 极差range 样本巾最大值与最小值之差X、川一Xq)0 3. 28 平均绝对差mean dev川lon样木分监与样本均值之绝对差的算术平均数:tz|X一支|。3. 29 样牛;方羔sample variance lS 3358.1-93 G/T 样本分址与样本均值之差的平方和,I涂以样本量减1:12z兰市l(XU,其中,-J为自由度。ikz当涉注-个随机变量时.可用F标表明相应的随机变过咱例如记X的h去;bsto样本标准差sample standard dcviat
14、ion 样本方差的lE平方根。样木变异系数sample codficient of variatn 样本标准差与样本均值的绝对值之比。样本协方差sarnple covariance 维样木(XY,),(XY,.l,(XY.)的样木协方注是.3. 30 3. 32 3. 31 snt占2(Xbdbc样本相关系数samplc correlation cefficient -维样本(X1,Y1) , (X2Yz) , (x.,Y.)的样本相关系数是:3.33 :z:; (X, -X)(Y,十于)J主(X,-X)主?-YY经验分布iempirical distribution 对样本儿X2,X.的每个
15、分量凡赋予相等概率l/n所得的概率分布。经验分布的分布函数称为经验分布函数:3. 34 。,.r P土,丸。三三x=l咽r二兰X(川注:;1)对取定的J组样丰观测值.:rj,12X 经验分布是一个确定的离散分布。也对任意给定的数值:r,F,(.r)是样本的雨蚊,宫是一个统计量。样本矩sample moment 经验分布的矩。例l对样本XXZ!,X.放正整数q,样本q阶原点矩是指3. 35 士二12,斗q=l时,即样本均值Xo例2对样本Xi,X2 ,X及正整数q,样本q阶中心组足指X X 二可, : , 主i斗q=2时,p,p样本二阶中心矩3.36 3. 37 3. 38 3. 39 3.40
16、3. 41 3.42 3. 43 3.44 3. 45 3.46 3. 47 3. 48 3. 49 GB/T 3358.1 93 L三(X,一支)二飞_ls. ft中S2是样本方差。生毛收回归方程crnpirit:al regres川0日el川tlOn根据样木,对囚归厅程所作的估计(见3.40)。其图形称为经验回归曲币.!-1):经验回归内线)经验回归系数empiral regressin coefficlent 经验1叶归方程中相成变量的系数。它是根据样本对11归系数作出的估计。游再run 在属性观测的系列中,同-属性的不间断的完整子系列。例:在表及为十J一l两种属性的以F观测系列中十十一
17、十一一十一十一十十斗只有4个怕卡游程电3个游程。i古i-!-I:ti ma t ion 根据样牛二推断总体分布的未知成分,例如参数。估计量estlmator 用以估if总体分布未知量的统计量。估计值estlmate 根据样本观测值,对估计量的叶算结果。估汁量的偏倚bias of estimator 11i计茧的期望与被估未知最真值之差。均方误差mean square error 伯i十量勺被f占未知量真值之差平方的期望。注2估计量的均1误差等于估计量的方差与其偏奇的干h之租,抽样误是sampling enor 内佯本的随机性而产生的设差G龙偏估计量unbiased凹t1mator期望等于被估未
18、知量真值的估计量。标准误差standard error 估计量的标准差。注z际J准误差通常用于估计量是无偏的或近似无偏的情形。f,J_仰lFf信区间two-sided confdence nterval 荐。是要估计的总体分布未知量,1豆凡是两个统计量,使区间T1,T2:J以一定概率包含仇则称此区问是0的一个双侧贵信区i词。T,和T1分别称为置信区间的上、下限。J单仰I主f吉区!lJone-sided confidence intCIval 在琵信区间TT,J中,当上限I飞为m或知莹的上限,或者当F限T1克I也或未知i址的F限时.称该民信区间主l单侧置信区间。此时,对于前者,Tj称为置们下限;
19、对f后者,7二称为回信1:限。i哇占水平confidcnce level LTT,l是0的一个双侧或单侧置信区间,1一是0和1之间的常数.若对们,打P(Tj 三世三五T,)二二1一,则称l一为该置信区间的背信水于。注。币1当P(71548512)l 咐,1-a也常利为置信系数或民信度。LNl信ij(千1通常取接近于l的值,如0.90,0.95.0.99等j l) GB/T 3358.1-93 3. 50 !-允iI覆盖区I口Jstalstical coverage nterval 出满足715ZT2的两个统计量构成的区|可1,.1,1.它以不低于Y的概率至少包含总体的确尘比例.np PFi1,
20、) - F(1,) ? l f;二三Y. O(IJ fij(此区间为总体分布F(.,.)的(卢.n统计覆盖区间.T,.Tt分别称为该统计暖盖flbJ的士、FplL 3. 51 拟合优度goodncss of fit 观测值与李先假定的分布(模型)之间的符合程度的数值刻画们3.52 离群值。utl町样本中的个PE几个观测值,它们离开其他观测值较远,暗示它们可能来自不同的总体。3. 53 统汁假设stat istical hYPOl hesis 关于一个戎多个总体分布的命题.它可以通过悴牛二去进行检验。3. 54 统计检验stat川icaltest 根据样木,决定某个统计假设应该被拒绝或不被拒绝(
21、接受)的h法和步骤。3. 55 1反假设与备择假设null hypothesis and alternative hypothesis !点假设I!,是个特定的统计假设.对它要作出拒绝或接受的决定。异于原假设电且在原假设被拒绝时可能采用的统计假设称为备择假设。例1关于假设期塑不小于给定值ILI的检验问题可表述为HIJ : 二三PO-Hl: 丸。相iJ2,关于假设两批产品不合格品率相等(但未知)的检验问题口J表述为.110 :户1=卢2-HI:卢1芋扣。ii且,关于假设总体分布为正态分布(参数不确定)的检验问题,备悴假设为总体分布不是iE态的。例4,关f的松分布中参数A等于给定值。(0)的检验问
22、题可表述为:Ilc, , =UHfIi z 弓,响。3. 56 简单假设simple h均l可yp】X川t完全确定了总体分布的统i汁f假设。f门注1芷,3己5f条量的例4中的1l是简单假设。s 3.5盯7复合假设Comp归08凹11坦eh均yp归01由he臼Sl阻不完全确定总体分布的统计假设。例Iz在正态分布N(1)的假定下.标准差己知时,假设二如是简单假段,而a未知时,贝h复合假设。例2:在3.55条的例中给出的前三个统计假设都是复合假设。3. 58 检验统计量test statlstlc 取信决定一个统计假设被拒绝与否的统计量。3. 59 j七参数检验non-parametric test
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 3358.1 1993 统计学 术语 部分 一般 统计
