版选修2_3.doc
《版选修2_3.doc》由会员分享,可在线阅读,更多相关《版选修2_3.doc(12页珍藏版)》请在麦多课文档分享上搜索。
1、1三 统计案例1最小二乘法对于一组数据( xi, yi),i1,2, n,如果它们线性相关,则线性回归方程为 y b x ,a 其中 =b 222 列联表22 列联表如表所示:B B 总计A a b a bA c d cd总计 ac bd n其中 n a bcd 为样本容量3 K2检验常用随机变量 K2 来检验两个变量是否有关系n( ad bc) 2( a b) ( c d) ( a c) ( b d)1回归分析的两个关注点(1)回归分析是建立在两个具有相关性的变量之间的一种模拟分析,因此先判断其是否具有相关性(2)并非只有线性相关关系,还可能存在非线性相关关系2独立性检验的两个注意点(1)通
2、过独立性检验得到的结论未必正确,它只是对一种可靠性的预测(2)22 列联表中,当数据 a, b,c,d 都不小于 5 时,才可以用 K2检验主题 1 回归分析某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费 x(单位:千元)对2年销售量 y(单位: t)和年利润 z(单位:千元)的影响对近 8 年的年宣传费 xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值(1)根据散点图判断, y a bx 与 y c d 哪一个适宜作为年销售量 y 关于年宣传费 xx的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立 y 关于
3、 x 的回归方程;(3)已知这种产品的年利润 z 与 x, y 的关系为 z0.2 y x.根据(2)的结果回答下列问题:年宣传费 x49 时,年销售量及年利润的预报值是多少?年宣传费 x 为何值时,年利润的预报值最大?附:对于一组数据( u1, v1),( u2, v2),( un, vn),其回归直线 v u 的斜率和截距的最小二乘估计分别为【解】 (1)由散点图可以判断, y c d 适宜作为年销售量 y 关于年宣传费 x 的回归方x程类型(2)令 w ,先建立 y 关于 w 的线性回归方程x 563686.8100.6,c y d w 所以 y 关于 w 的线性回归方程为 y100.6
4、68 w,3因此 y 关于 x 的回归方程为 100.668 .y x(3)由(2)知,当 x49 时,年销售量 y 的预报值 100.668 576.6,y 49年利润 z 的预报值 576.60.24966.32.z 根据(2)的结果知,年利润 z 的预报值0.2(100.668 ) x x13.6 20.12.z x x所以当 6.8,即 x46.24 时, 取得最大值x13.62 z 故年宣传费为 46.24 千元时,年利润的预报值最大解决回归分析问题的一般步骤(1)画散点图根据已知数据画出散点图(2)判断变量的相关性并求回归方程通过观察散点图,直观感知两个变量是否具有相关关系;在此基
5、础上,利用最小二乘法求回归系数,然后写出回归方程(3)回归分析画残差图或计算 R2,进行残差分析(4)实际应用依据求得的回归方程解决问题 在一段时间内,某种商品的价格 x 元和需求量 y 件之间的一组数据为:x(元) 14 16 18 20 22y(件) 12 10 7 5 3且知 x 与 y 具有线性相关关系,求出 y 关于 x 的回归直线方程,并说明拟合效果的好坏解: (1416182022)18,x 15 (1210753)7.4,y 15所以 7.41.151828.1,a 4所以 y 对 x 的回归直线方程为 1.15 x28.1.y 列出残差表为yi iy 0 0.3 0.4 0.
6、1 0.2yi y 4.6 2.6 0.4 2.4 4.4主题 2 独立性检验某学生对其 30 位亲属的饮食习惯进行了一次调查,并用茎叶图表示 30 人的饮食指数,如图所示(说明:图中饮食指数低于 70 的人,饮食以蔬菜为主;饮食指数大于等于70 的人,饮食以肉类为主)(1)根据茎叶图,帮助这位同学说明其 30 位亲属的饮食习惯;(2)根据以上数据完成如表所示的 22 列联表主食蔬菜 主食肉类 总计50 岁以下50 岁以上总计(3)能否在犯错误的概率不超过 0.01 的前提下认为“其亲属的饮食习惯与年龄有关”?【解】 (1)30 位亲属中 50 岁以上的人饮食多以蔬菜为主,50 岁以下的人饮食
7、多以肉类为主(2)22 列联表如表所示:5主食蔬菜 主食肉类 总计50 岁以下 4 8 1250 岁以上 16 2 18总计 20 10 30(3)随机变量 K2的观测值 k 106.635,30( 42 816) 212182010所以在犯错误的概率不超过 0.01 的前提下认为“其亲属的饮食习惯与年龄有关” 独立性检验问题的求解策略(1)等高条形图法:依据题目信息画出等高条形图,依据频率差异来粗略地判断两个变量的相关性(2)K2统计量法:通过公式K2 先计算观测值 k,再与临界值表作比较,最后得n( ad bc) 2( a b) ( c d) ( a c) ( b d)出结论 在考查黄烟是
8、否经过药物处理与发生青花病的关系时,得到如下数据:在试验的 470 株黄烟中,经过药物处理的黄烟有 25 株发生青花病,60 株没有发生青花病;未经过药物处理的有 185 株发生青花病,200 株没有发生青花病试推断经过药物处理跟发生青花病是否有关系解:由已知,得 22 列联表如下:经过药物处理 未经过药物处理 总计青花病 25 185 210无青花病 60 200 260总计 85 385 470提出假设 H0:经过药物处理跟发生青花病无关系根据列联表中的数据,可以求得随机变量 K2的观测值为k 9.788.470( 25200 18560) 221026085385因为当 H0成立时, K
9、27.879 的概率约为 0.005,而此时 K2的观测值 k9.7887.879,所以在犯错误的概率不超过 0.005 的前提下认为经过药物处理跟发生青花病是有关系的, A 基础达标61对两个变量 y 和 x 进行回归分析,得到一组样本数据:( x1, y1),( x2, y2),( xn, yn),则下列说法中不正确的是( )A由样本数据得到的回归方程 x 必过样本点的中心( x, y)y b a B 残差平方和越小的模型,拟合的效果越好C用相关指数 R2来刻画回归效果, R2的值越小,说明模型的拟合效果越好D 若变量 y 和 x 之间的相关系数 r0.936 2,则变量 y 与 x 之间
10、具有线性相关关系解析:选 C.R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选 C.2下列说法中正确的有:( )若 r0,则 x 增大时, y 也相应增大;若 r0,则 x 增大时, y 也相应增大;若 r1 或 r1,则 x 与 y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上A BC D解析:选 C.若 r0,表示两个相关变量正相关, x 增大时, y 也相应增大,故正确,r0,表示两个变量负相关, x 增大时, y 相应减小,故错误| r|越接近 1,表示两个变量相关性越高,| r|1 表示两个变量有确定的关系(即函数关系),故正确3若两个变量的残差平
11、方和是 325, 923,则随机误差对预报变量的贡献率约为( )A64.8% B60%C35.2% D40%解析:选 C.由题意可知随机误差对预报变量的贡献率约为 0.352.3259234有下列数据x 1 2 3y 3 5.99 12.01下列四个函数中,模拟效果最好的为( )A y32 x1 B ylog 2xC y3 x D y x2解析:选 A.分别把 x1,2,3,代入求值,求最接近 y 的值,即为模拟效果最好,故选 A.5通过随机询问 100 名性别不同的小学生是否爱吃零食,得到如下的列联表:男 女 合计爱吃 10 40 507不爱吃 20 30 50合计 30 70 100P(K
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 选修 _3DOC
