GB T 3358.3-2009 统计学词汇及符号 第3部分 实验设计.pdf
《GB T 3358.3-2009 统计学词汇及符号 第3部分 实验设计.pdf》由会员分享,可在线阅读,更多相关《GB T 3358.3-2009 统计学词汇及符号 第3部分 实验设计.pdf(35页珍藏版)》请在麦多课文档分享上搜索。
1、ICS 03.120.30 A 41 中华人民=H工.、和国国家标准GB/T 3358.3-2009/ISO 3534-3: 1999 代替GB/T3358.3-1993 2009-10-15发布统计学词汇及符号第3部分:实验设计Statistics-Vocabulary and symbols一Part 3: Design of experiments CISO 3534-3: 1999 , IDT) 中华人民共和国国家质量监督检验检茂总局中国国家标准化管理委员会2010-02-01实施发布GB/T 3358.3-2009/180 3534-3: 1999 目次I 引言. . II 范围.1
2、 一般术语12 实验安排术语73 分析方法术语19参考文献. 24 索引25汉语拼音索引25英文对应词索引27GB/T 3358.3-2009/ISO 3534-3: 1999 目。吕GB/T 3358(统计学词汇及符号分为以下部分:一一第1部分:一般统计术语与用于概率的术语第2部分:应用统计一一第3部分:实验设计本部分为GB/T3358的第3部分,等同采用ISO3534-3: 1999(统计学词汇及符号第3部分:实验设计。GB/T 3358的本部分与ISO3534-3: 1999相比,订正了原文的错误,修正了原文中概念表述不够准确的部分,主要变化如下:一一将1.10处理(treatment)
3、的定义改为每个因子的特定水平或不同因子水平的组合;将1.27重复(replication)的定义改为对给定的处理实施多于一次的实验,并删去了注;一一在1.21残差(residual) 的定义中在(响应变量的)预测值前增加基于假定模型的一词,以与1.22剩余误差(residual error) 的定义相对应;在2.1. 2. 1 2k析因实验中增加了关于用1,2分别替代+一,表示因子两个水平的注;一一将2.3区组设计(blockdesign)的定义改为将全部实验单元分成若干个区组的实验设计等。与ISO3534-3: 1999相比,本部分作了必要的编辑性的修改,例如:-一为与第1部分和第2部分相一
4、致,在术语定义中增加了其他术语(包括条目编号)的引用;一一一对ISO3534-3: 1999引用ISO3534-1: 1993与ISO3534-2: 1993的条目,按等同采用ISO3534-1:2006与ISO3534-2: 2006的GB/T3358. 1-2009与GB/T3358. 2-2009的相应内容,作适当的更改。本部分代替GB/T3358.31993(统计学术语第三部分试验设计术语),与GB/T3358. 3-1993相比,主要变化如下:一一一名称改为统计学词汇及符号第3部分:实验设计); 二一在全文中用实验替代试验,作为相应英文词experiment的优先选用词,但将试验一词
5、保留为实验的同义词;调整了术语条目设置;一一增加了大量的示例及注释。本部分由全国统计方法应用标准化技术委员会提出并归口。本部分主要起草单位:中国科学院数学与系统科学研究院、北京大学、中国标准化研究院、苏州大学。本部分主要起草人:冯士雍、陈敏、石坚、艾明要、丁文兴、汪仁官、于振凡。本部分于1993年首次发布,本次为第一次修订。I GB/T 3358.3-2009/ISO 3534-3: 1999 引实验设计实质上即是对实验的策划,以便有效和经济地得到正确和相关的结论。选择具体的实验方案依赖于所涉及问题的类型、结论的普遍性程度,以及可利用的资源、(实验材料、人员与时间)。一个经过恰当设计和实施的实
6、验,常导致相对简明的统计分析和对结果的解释。近年来,实验设计的应用得到蓬勃发展,主要是由于认识到实验设计对于提高产品和服务的质量非常重要。虽然统计质量控制、管理目标(menegementresolve)、检验和其他质量工具也有此功能,实验设计代表了一种在复杂的、变化的和交互的环境中进行选择的方法。在历史上,实验设计在农业领域得到发展与繁荣,医学领域也经历了悠久历史的精心实验设计。目前,工业环境中目睹了实验设计带来的可观效益,因为实验设计便于开展工作(界面友好的软件),改进了培训,得到有影响力的倡导推广,也积累了许多成功的案例。析因实验(见2.1)为实验者提供了研究所关心的多因子之间相互关系的方
7、法。这些类型的实验,远比简单的一次仅分析一个因子的实验更为有效。析因实验特别适用于确定在其他因子取不同水平时有不同响应的因子。通常,分析质量的突破来自研究交互作用(见1.17)所揭示的内在联系。如果考虑的因子数量比较多,析因实验可能要占用过多资源而难以实施。不过,部分析因设计(见2.1. 1)提供了一种可能的折衷办法。实际上,如果最初的目标是找出哪些因素需要进一步研究,筛选设计(见2.2) 就比较可行。在计划一个实验中,有必要对由于实验条件或实验单元处理的配置造成的偏倚进行控制。随机化(见1.29)和分区组(见1.28)之类的技术即是用来最小化讨厌的、外来的因素的影响。具体分区组技术包括随机化
8、区组设计(见2.3.1)、拉丁方设计(见2.3.2)、平衡不完全区组设计-(见2.3.4.1)等。实验设计是一个渐进的过程,以不断完善为目标,响应曲面设计(见2.的扮演了举足轻重的角色。通过对关键因子的不同水平的考察,响应曲面设计方法巧妙地解释了最优点附近的曲线效应。混料设计(2.5)处理各因子在整体中比例的情况,例如合金中的成分。嵌套设计(见2.6)尤其适用于多个实验室间进行的实验。如果实验完全按方案实施,对实验数据的分析方法将是直接的。图方法(见3.1)对揭示大体结论尤为有效。根据模型进行参数估计(见1.1及其后)常使用回归分析(见3.3)。回归分析方法也可用来处理缺失数据,识别离群值,以
9、及其他问题所带来的困难。优良的实验设计应该:a) 结合在因子及其水平的选择、描述假定条件等方面的先验知识和经验;b) 以最少的精力处理相关信息;c) 实验前能确保该实验的设计可以实现实验的目标及所需的精度;d) 体现调查的连续性;e) 明确实验处理的安排及其次序,以避免实验过程中的误解。E GB/T 3358.3-2009/ISO 3534-3: 1999 统计学词汇及符号第3部分:实验设计范围GB/T 3358的本部分规定了实验设计领域和起草其他标准中常用的术语。1 一般术语. . . 模型model 关于晌应变量(1.2)与预测变量(1.3)关系及其附带假定的描述。注1:模型由三个部分组成
10、:第一部分是建模的晌应(1.2) ,第二部分是包含预测变量(1.3)的模型的确定性或系统性的部分,第三部分是模型的随机部分或随机误差,其描述可以十分详细。例如,误差项可以结合成散度效应(1.14),使响应值的变异随着响应值的增大而增加。示例1:一个零件的寿命与它所处的环境条件有关。示例2:一个典型模型:Yij =+z十岛十ij其中Yij是在因子A的i水平和因子B的j水平时的响应,是响应的总平均,Qi是因子A在i水平时的附加效应,A是因子B在j水平时的附加效应,ij是误差项。模型的响应部分仅是Yij;模型的预测部分是十z十品,由一项响应的总平均和两项因子效应组成;模型的随机或误差部分是Eij,它
11、表示产生该响应的过程的固有变异。示例3.一个常用模型:y 训= 龟E十j号+ 飞马ij十E乌zI其中Y头汕y凡与zJ卅k是第h次重复(1.27)的响应,z是由因子1造成的调整,码是由因子2造成的调整,rij是由两因子的交互效应(1.16)所造成的调整,ij是误差项。此处的典型模型中不包含总平均项,所以用术语调整代替示例2中的附加效应;此外,采用Yijk(ijk )而不是Yij(ij ) ,表明可能存在的重复。示例4:另一个典型模型:Yi = e!o+1 Xi+.卢12X;十i其中Yi是对应于Xi的响应,e!o+卢f1Z+马zj表示对应于Xi的平均响应,i是误差项。注2:模型的上述描述不仅适用于
12、带有可加误差的经典线性模型,也适用于误差可以用各种分布描述的广义线性模型,这些分布包括二项分布、泊松分布、指数分布、伽玛分布和正态分布。1. 2 响应变量response variable 表示实验结果的变量。注1:同义词是输出变量。注2:不推荐把术语因变量也作为一个同义词,避免可能与自变量混淆(见GB/T3358.1一2009的1.11)。注3:从每一个实验单元(1.9)记录多个响应时,响应变量可为向量。1. 3 预测变量predictor variable 可用来解释实验结果的变量。注1:常用同义词有输入变量、描述变量和解释变量。注2:在一个经设计的实验中,预测变量的可控程度表明了它在其中
13、所起的潜在作用。预测变量可以是可控的(固定的)、可修正的(仅在短期内或在花费昂贵代价后可控的)或不可控的(随机的)。GB/T 3358.3-2009/ISO 3534-3: 1999 1. 4 1. 5 1. 6 注3.预测变量可以包含一个随机元素,也可以是没有随机误差的可观测或设置的一些定性组。注4:不推荐把术语自变量作为一个同义词,避免可能与因变量混淆(见GB/T3358.1-2009,1.11)。设计区域design region 设计空间design space 预测变量(1.3)容许值的集合。因子factor 为评估对晌应变量(1.2)的效应而在实验中需变化的预测变量(1.3)。注1
14、:因子对实验的结果可能提供一种可解释的原因。注2:与预测变量(1.3)的使用更为一般相比,此处因子的使用则有特定含义。注3:因子可与区组(1.11)的建立有关。水平level 因子(1.5)可能的设置、取值或安排。注1:同义词是预测变量的取值。注2:术语水平形式上与定量特性有关,但它也用来描述定性特征的状态或设置。示例:表示催化剂的水平可能是有或没有;表示加热处理的有序尺度温度的四个水平可能是:100 .C、120.C、140.C和160.C;表示实验室的名义尺度变量可能为对应于不同设备的三种水平:A,B和C。1. 7 1. 8 1. 9 2 注3:在因子不同水平观测的响应提供了实验水平范围内
15、决定因子效应的信息。如果没有模型关系假定的可靠根据,在水平范围以外作外推通常是不合适的。在水平范围以内的插值可能依赖于水平个数和水平间距。内插通常认为是合理的,尽管在不连续或多峰的情况下会造成实验范围内的突然变化。水平的选取可能仅限于某些特定的固定值(已知或未知),也可以在研究范围内随机选择。实验误差experimental error 实验晌应变量(1.2)在实施中,除因子(1.5)、区组(1.11)或其他可归属原因外,不能解释的变异。注1:实验误差是实验的普遍特征。当实验重复时,尽管非常精细地控制了实验材料、环境条件和实验操作,每次实验结果仍会变化。因此实验误差是普遍存在的。实验误差给从实
16、验结果得出的结论带来了一定程度的不确定性,从而在下结论时应予以考虑。注2:将比本术语较为广泛的概念用于某单个响应变量时,术语残差(1.21)、残余误差(1.22)和纯误差(1.23)提供了更为精细的描述。注3:与实验误差有关的的术语有重复性标准差(GB/T 3358. 2-2009 , 3. 3. 7)和再现性标准差(GB/T 3358. 2 2009,3.3.12)。如果实验的实际设计符合重复性条件(GB/T3358. 2-2009 , 3. 3. 6)或再现性条件(GB/T 3358.2一2009,3.3.11),这些术语可直接用于实验设计中。方差分量variance component
17、描述因子(1.5)效应或实验误差(1.7)的随机变量的方差。注1:考虑模型Y十ri+Cij 其中句是从可能取值的元限集合中随机选择的一个水平(的效应),ri和勺的分布独立,Ti和Cij都是随机变量。一旦从可能水平的元限集合中作出了随机选择,就根据ri的实现继续进行分析。鉴于这种概率结构,考虑以下方差等式是合理的:Var(Y;j)二Var(口)十Var(Cij)。右端也可表示成;+0;,其中碍和?是Yij的方差分量。实验单元experimental unit 接收一个特定处理(1.10)、随后产生晌应变量(1.2)值的个体。注:一个实验单元对应于一次实验。GB/T 3358.3-2009/ISO
18、 3534-3: 1999 1. 10 处理treatment 每个因子(1.5)的特定水平(1.6)或不同因子水平的组合。1. 11 区组block 比实验单元(1.9)的全体更具齐性的实验单元的集合(见1.28)。注1:术语区组来源于农业实验。作实验的田地被分为若干块每块有相同条件的小区域,如有相同或相似的风的位向、地下水状况及可耕层的深度等。其他情况下,区组可根据原材料的批、操作员、一天内考察的单元数等来确定。注2:通常,识别出区组的存在会影响处理(1.10)安排到实验单元的方式。1. 12 单因子实验one-factor experiment 只考察一个因子(1.5)对晌应变量(1.2
19、)的效应(如有的话)的实验。示例:考虑模型:y=严z十E其中y是响应变量,z是在因子的i水平时的平均响应,是一个包涵所有其他效应和变异来源的随机变量。该模型将响应变量y与效应!1i(依赖于因子水平)和误差项E联系起来。中的变化反映了因子对响应变量的影响(此时平均响应值是因子水平的函数)。该模型的另一种表示形式是:y=+z十E其中y是响应变量,是总平均响应,z是因子的i水平所造成的附加效应,是一个包涵所有其他效应和变异来源的随机变量。1. 13 主效应main effect 单个因子(1.5)对晌应变量(1.2)均值的影响。注:对于两水平(1.6)因子,主效应描述了从一个水平到另一个水平时响应的
20、变化。如果水平设置为一1c低水平)和+1C高水平),那么因子的主效应可估计成因子水平为十1时的平均响应减去因子水平为一1时的平均响应。考虑模型:y=+卢X十E其中y,和E与1.12中定义一致,X是前述的+1或-l,表示因子X的调整。注意卢的估计是因子X主效应(1. 13)的一半。如果=0,那么X不影响响应变量的均值(不管X的水平是十1或一1都一样),从而X的主效应为0。1. 14 .散度效应dispersion effect 单个因子(1.5)对晌应变量(1.2)方差的影响。注:认识到对平均响应没有太大影响,但可能对响应的变异有显著效应的因子是很重要的。在此情形,使响应变异较小、数值比较一致的
21、因子的某个特定水平(1.6)正是最想要的。当然对响应变量的均值和方差都有影响的因子也是可能的。1. 15 两因子实验two-factor experiment 同时考察两个不同因子(1.5)对晌应变量(1.2)的可能效应的实验。注:如果两个因子的作用互不影响,术语主效应(1.13)仍可适用。即每个因子的主效应是它对响应变量均值的贡献。1. 16 k因子实验k-factor experiment 同时考察走(是二三2)个不同因子(1.5)对晌应变量(1.2)的可能效应的实验。注:同义词是多因子实验。3 GB/T 3358.3-2009/180 3534-3: 1999 1. 17 交互效应int
22、eraction 一个因子(1.5)对晌应变量(1.2)的影响依赖于其他一个或多个因子的效应。注1:交互效应表明一个因子对响应的主效应依赖于另一个因子水平而表现出来的不一致性。下面图形表示了这些现象。强交互效应有效互效应: /+ 低水平高水平低水平高水平无交互效应气.s十、.B一低水平中水平高水平注2:最常见的情况是考虑仅包含两个因子的交互效应,这种交互效应更准确地称为两向交互效应或一阶交互效应。也可考虑三个因子如A,B和C中,可能存在A,B的一阶交互效应依赖于因子C的水平的情况,这称为二阶交互效应。类似地,可以考虑三阶、四阶或更高阶的交互效应。注3:1. 1中示例3提供了包含两个因子和它们的
23、两向或一阶交互效应马实验的典型模型表示。1. 18 混杂confounding 有意将两个或多个效应(主效应(1.13)或交互效应(1.16)相混合,使其不可区分。注:混杂是一项重要的技术,比如在一些实验设计中,它可有效地利用指定的区组(1.11)。为应用这种技术,在设计时应有意将那些没有兴趣的效应(主效应或交互效应)与区组效应混杂,而同时避免与其他较重要的效应混杂。利用混杂技术可以减少实验方案(1.30)的实验次数。然而,混杂有时是因为实验过程中对设计的无意识改变或对设计的不完善造成的,从而程度不等地降低了实验的效率。1. 19 别名alias 统计学出实验本质造成的与其他主效应(1.13)
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 3358.3 2009 统计学 词汇 符号 部分 实验设计
