版选修2_3.doc
《版选修2_3.doc》由会员分享,可在线阅读,更多相关《版选修2_3.doc(20页珍藏版)》请在麦多课文档分享上搜索。
1、13.1 回归分析的基本思想及其初步应用学习目标 1.了解随机误差、残差、残差图的概念.2.会通过分析残差判断线性回归模型的拟合效果.3.掌握建立线性回归模型的步骤知识点一 线性回归模型思考 某电脑公司有 5 名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5工作年限 x/年 3 5 6 7 9推销金额 y/万元 2 3 3 4 5请问如何表示推销金额 y 与工作年限 x 之间的相关关系? y 关于 x 的线性回归方程是什么?答案 画出散点图,由图可知,样本点散布在一条直线附近,因此可用回归直线表示变量之间的相关关系设所求的线性回归方程为 x ,y b a 则 0.
2、5,b 5i 1xi xyi y5i 1xi x2 1020 0.4.a y b x所以年推销金额 y 关于工作年限 x 的线性回归方程为 0.5 x0.4.y 梳理 (1)函数关系是一种确定性关系,而相关关系是一种非确定性关系(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法(3)对于一组具有线性相关关系的数据( x1, y1),( x2, y2),( xn, yn),回归直线y bx a 的斜率和截距的最小二乘估计公式分别为2 , ,其中( , )称为样本点的中心b ni 1xi xyi yni 1xi x2ni 1xiyi nx yni 1x2i nx2 a y b x
3、x y(4)线性回归模型 y bx a e,其中 a 和 b 是模型的未知参数, e 称为随机误差,自变量 x称为解释变量,因变量 y 称为预报变量知识点二 线性回归分析具有相关关系的两个变量的线性回归方程为 x .y b a 思考 1 预报变量 与真实值 y 一样吗?y 答案 不一定思考 2 预报值 与真实值 y 之间误差大了好还是小了好?y 答案 越小越好梳理 (1)残差平方和法 i yi i yi xi (i1,2, n)称为相应于点( xi, yi)的残差e y b a 残差平方和 (yi i)2越小,模型的拟合效果越好ni 1 y (2)残差图法残差点比较均匀地落在水平的带状区域中,
4、说明选用的模型比较合适这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高(3)利用相关指数 R2刻画回归效果其计算公式为: R21 ,其几何意义: R2越接近于 1,表示回归的效果越好ni 1yi y i2ni 1yi y2知识点三 建立回归模型的基本步骤1确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量2画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等)3由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程)4按一定规则(如最小二乘法)估计回归方程中的参数5得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随
5、机的规律性等)若存在异常,则检查数据是否有误,或模型是否合适等31求线性回归方程前可以不进行相关性检验( )2在残差图中,纵坐标为残差,横坐标可以选为样本编号( )3利用线性回归方程求出的值是准确值( )类型一 求线性回归方程例 1 某研究机构对高三学生的记忆力 x 和判断力 y 进行统计分析,得下表数据:x 6 8 10 12y 2 3 5 6(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程 x ;y b a (3)试根据求出的线性回归方程,预测记忆力为 9 的同学的判断力(相 关 公 式 : b ni 1xiyi nxyni 1x2i
6、 nx2, a y b x)考点 线性回归方程题点 求线性回归方程解 (1)如图:(2) iyi6283105126158,4i 1x 9,x6 8 10 124 4,y2 3 5 6446 28 210 212 2344,4i 1x2i 0.7,b 158 494344 492 1420 40.792.3,a y b x故线性回归方程为 0.7 x2.3.y (3)由(2)中线性回归方程可知,当 x9 时, 0.792.34,预测记忆力为 9 的同学的y 判断力约为 4.反思与感悟 (1)求线性回归方程的基本步骤列出散点图,从直观上分析数据间是否存在线性相关关系计算: , , , iyi.x
7、yni 1x2ini 1y2ini 1x代入公式求出 x 中参数 , 的值y b a b a 写出线性回归方程并对实际问题作出估计(2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归方程毫无意义跟踪训练 1 假设关于某设备的使用年限 x(年)和所支出的维修费用 y(万元)有如下的统计数据:x 2 3 4 5 6y 2.2 3.8 5.5 6.5 7.0由此资料可知 y 对 x 呈线性相关关系(1)求线性回归方程;(2)求使用年限为 10 年时,该设备的维修费用为多少?考点 线性回归方程题点 求线性回归方程解 (1)由上表中的数据可得4, 5, 90, iy
8、i112.3,x y5i 1x2i5i 1x5 b 5i 1xiyi 5xy5i 1x2i 5x2 1.23,112.3 54590 542 51.2340.08.a y b x线性回归方程为 1.23 x0.08.y (2)当 x10 时, 1.23100.0812.38.y 即使用年限为 10 年时,该设备的维修费用约为 12.38 万元类型二 回归分析命 题 角 度 1 线 性 回 归 分 析例 2 在一段时间内,某种商品的价格 x 元和需求量 y 件之间的一组数据为:x 14 16 18 20 22y 12 10 7 5 3求出 y 对 x 的线性回归方程,并说明拟合效果的程度考点 残
9、差分析与相关指数题点 残差及相关指数的应用解 (1416182022)18,x15 (1210753)7.4.y1514 216 218 220 222 21 660,5i 1x2iiyi14121610187205223620,5i 1x可得回归系数 b 5i 1xiyi 5x y5i 1x2i 5x2 1.15,620 5187.41 660 51826所以 7.41.151828.1,a 所以线性回归方程为 1.15 x28.1.y 列出残差表:yi iy 0 0.3 0.4 0.1 0.2yi y 4.6 2.6 0.4 2.4 4.4则 (yi i)20.3, (yi )253.2.
10、5i 1 y 5i 1 yR21 0.994.5i 1yi y i25i 1yi y2所以回归模型的拟合效果很好反思与感悟 (1)该类题属于线性回归问题,解答此类题应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助线性回归方程对实际问题进行分析(2)刻画回归效果的三种方法残差图法,残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适残差平方和法:残差平方和 (yi i)2越小,模型的拟合效果越好ni 1 y 相关指数法: R21 越接近 1,表明回归的效果越好ni 1yi y i2n
11、i 1yi y2跟踪训练 2 关于 x 与 y 有如下数据:x 2 4 5 6 8y 30 40 60 50 70有如下的两个线性模型:(1) 6.5 x17.5;(2) 7 x17.试比较哪一个拟合效果更好y y 考点 残差分析与相关指数题点 残差及相关指数的应用7解 由(1)可得 yi i与 yi 的关系如下表:y yyi iy 0.5 3.5 10 6.5 0.5yi y 20 10 10 0 20 (yi i)2(0.5) 2(3.5) 210 2(6.5) 20.5 2155,5i 1 y (yi )2(20) 2(10) 210 20 220 21 000.5i 1 y R 1 1
12、 0.845.215i 1yi y i25i 1yi y2 1551 000由(2)可得 yi i与 yi 的关系如下表:y yyi iy 1 5 8 9 3yi y 20 10 10 0 20 (yi i)2(1) 2(5) 28 2(9) 2(3) 2180,5i 1 y (yi )2(20) 2(10) 210 20 220 21 000.5i 1 y R 1 1 0.82.25i 1yi y i25i 1yi y2 1801 000由于 R 0.845, R 0.82,0.8450.82,21 2 R R .21 2(1)的拟合效果好于(2)的拟合效果命 题 角 度 2 非 线 性 回
13、 归 分 析例 3 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费 x(单位:千元)对年销售量 y(单位:t)和年利润 z(单位:千元)的影响对近 8 年的年宣传费 xi和年销售量8yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值x y w(xi )28i 1 x (wi )28i 1 w (xi )8i 1 x(yi )y(wi )8i 1 w(yi )y46.6 563 6.8 289.8 1.6 1 469 108.8表中 wi , i.xi w188i 1w(1)根据散点图判断, y a bx 与 y c d 哪一个适宜作为年销售量 y 关于年宣传费 x
14、 的x回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程;(3)已知这种产品的年利润 z 与 x, y 的关系为 z0.2 y x.根据(2)的结果回答下列问题:年宣传费 x49 时,年销售量及年利润的预报值是多少?年宣传费 x 为何值时,年利润的预报值最大?附:对于一组数据( u1, v1),( u2, v2),( un, vn),其回归直线 v u 的斜率和截距的最小二乘估计分别为 , . ni 1ui uvi vni 1ui u2 v u考点 非线性回归分析题点 非线性回归分析解 (1)由散点图可以判断, y c d 适宜作为
15、年销售量 y 关于年宣传费 x 的回归方程类x型(2)令 w ,先建立 y 关于 w 的线性回归方程x9由于 68,d 8i 1wi wyi y8i 1wi w2 108.81.6 563686.8100.6,c y d w所以 y 关于 w 的线性回归方程为 100.668 w,y 因此 y 关于 x 的回归方程为 100.668 .y x(3)由(2)知,当 x49 时,年销售量 y 的预报值 100.668 576.6,y 49年利润 z 的预报值 576.60.24966.32.z 根据(2)的结果知,年利润 z 的预报值0.2(100.668 ) x x13.6 20.12.z x
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 选修 _3DOC
