第 6章 方差分析.ppt
《第 6章 方差分析.ppt》由会员分享,可在线阅读,更多相关《第 6章 方差分析.ppt(41页珍藏版)》请在麦多课文档分享上搜索。
1、云南财经大学统计信息学院,第 6章 方差分析,学习目标 6.1 方差分析的基本问题 6.2 单因素方差分析 6.3 双因素方差分析,云南财经大学统计信息学院,学习重点,解释方差分析的概念 解释方差分析的基本思想和原理 掌握单因素方差分析的方法及应用 4. 掌握双因素方差分析的方法及应用,云南财经大学统计信息学院,6.1 方差分析的基本问题,什么是方差分析(ANOVA)?,检验多个总体均值是否相等 通过分析数据的误差判断各总体均值是否相等 研究分类型自变量对数值型因变量的影响 一个或多个分类型自变量 两个或多个 (k 个) 处理水平或分类 一个数值型因变量 有单因素方差分析和双因素方差分析 单因
2、素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量,云南财经大学统计信息学院,什么是方差分析? (例题分析),【 例 】某饮料企业研制出的一种新型饮料。饮料有四种颜色,分别为桔黄色、粉色、绿色和无色透明。随机从五家超市上收集前一期该饮料的销售量,如下表所示:,云南财经大学统计信息学院,什么是方差分析? (例题分析),分析饮料颜色对其销售量是否有显著差异。 即检验这四种颜色饮料的销量的均值是否相等 若它们的均值相等,则意味着饮料颜色对其销售量是没有影响的,即它们之间的销量没有显著差异;若均值不全相等,则意味着饮料颜色对其销售量是有影响的,它们之间的销售量有显著差异,云南财经大
3、学统计信息学院,方差分析中的有关术语,因素或因子(factor) 所要检验的对象 要分析颜色对饮料的销量是否有影响,颜色是要检验的因素或因子 水平或处理(treatment) 因子的不同表现 无色、粉色、桔黄色、绿色就是因子的水平 观察值 在每个因素水平下得到的样本数据 每种颜色饮料的销量就是观察值,云南财经大学统计信息学院,方差分析的基本思想和原理 (两类误差),随机误差 因素的同一水平(总体)下,样本各观察值之间的差异 比如,同一颜色下不同销售地点的销量是不同的 这种差异可以看成是随机因素的影响,称为随机误差 系统误差 因素的不同水平(不同总体)下,各观察值之间的差异 比如,不同颜色饮料销
4、量之间的差异 这种差异可能是由于抽样的随机性所造成的,也可能是由于行业本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差,云南财经大学统计信息学院,方差分析的基本思想和原理,1. 比较两类误差,以检验均值是否相等 2. 比较的基础是方差比 3. 如果系统(处理)误差明显地不同于随机误差,则均值就是不相等的;反之,均值就是相等的 4. 误差是由各部分的误差占总误差的比例来测度的,云南财经大学统计信息学院,方差分析的基本思想和原理 (误差平方和),数据的误差用平方和(sum of squares)表示 组内平方和(within groups) 因素的同一水平(同一个总体)下样本数据的
5、平方和 组内平方和只包含随机误差 组间平方和(between groups) 因素的不同水平(不同总体)下各样本之间的平方和 组间平方和既包括随机误差,也包括系统误差,云南财经大学统计信息学院,方差分析的基本思想和原理 (误差的比较),若原假设成立,组间平方和与组内平方和经过平均后的数值就应该很接近,它们的比值就会接近1 若原假设不成立,组间平方和平均后的数值就会大于组内平方和平均后的数值,它们之间的比值就会大于1 当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自变量对因变量有影响 判断颜色对饮料销量是否有显著影响,也就是检验销量的差异主要是由于什么原因所引起的。如果这种
6、差异主要是系统误差,说明不同颜色对饮料销量有显著影响,云南财经大学统计信息学院,6.2 单因素方差分析,设因素有k个水平,每个水平的均值分别用1 , 2, , k 表示 要检验k个水平(总体)的均值是否相等,需要提出如下假设: H0 : 1 2 k H1 : 1 , 2 , ,k 不全相等 设1为无色饮料销量的均值,2为粉色饮料销量的均值,3为桔黄色饮料销量的均值,4为绿色饮料销量的均值,提出的假设为 H0 : 1 2 3 4 H1 : 1 , 2 , 3 , 4 不全相等,云南财经大学统计信息学院,单因素方差分析的数据结构 (one-way analysis of variance),云南财
7、经大学统计信息学院,分析步骤,提出假设 构造检验统计量 统计决策,云南财经大学统计信息学院,提出假设,一般提法 H0 : m1 = m2 = mk 自变量对因变量没有显著影响 H1 : m1 ,m2 , ,mk不全相等 自变量对因变量有显著影响 注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等,云南财经大学统计信息学院,构造检验的统计量,构造统计量需要计算 水平的均值 全部观察值的总均值 误差平方和 均方(MS),云南财经大学统计信息学院,构造检验的统计量 (计算水平的均值),假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部
8、观察值总和除以观察值的个数 计算公式为,式中: ni为第 i 个总体的样本观察值个数xij 为第 i 个总体的第 j 个观察值,云南财经大学统计信息学院,构造检验的统计量 (计算全部观察值的总均值),全部观察值的总和除以观察值的总个数 计算公式为,云南财经大学统计信息学院,构造检验的统计量 (计算总离差平方和 SST),全部观察值 与总平均值 的离差平方和 反映全部观察值的离散状况 其计算公式为,前例的计算结果:SST = (26.5-28.695)2+(32.8-28.695)2=115.9295,云南财经大学统计信息学院,构造检验的统计量 (计算水平项平方和 SSA),各组平均值 与总平均
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析 PPT
