版选修2_3.doc
《版选修2_3.doc》由会员分享,可在线阅读,更多相关《版选修2_3.doc(15页珍藏版)》请在麦多课文档分享上搜索。
1、1第三章 统计案例章末复习学习目标 1.会求线性回归方程,并用回归直线进行预报.2.理解独立性检验的基本思想及实施步骤1最小二乘法对于一组数据( xi, yi), i1,2, n,如果它们线性相关,则线性回归方程为 x ,其中 , .y b a b ni 1xi xyi yni 1xi x2ni 1xiyi nx yni 1x2i nx2 a y b x222 列联表22 列联表如表所示:B B 总计A a b a bA c d c d总计 a c b d n其中 n a b c d 为样本容量23独立性检验常用随机变量K2 来检验两个变量是否有关系nad bc2a bc da cb d类型一
2、 回归分析例 1 (2016全国改编)如图是我国 2008 年到 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图注:年份代码 17 分别对应年份 20082014(1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加以说明;(2)建立 y 关于 t 的回归方程(系数精确到 0.01),预测 2019 年我国生活垃圾无害化处理量附注:参考数据: i9.32, iyi40.17, 0.55, 2.646.7i 1y7i 1t7i 1yi y2 7参考公式:相关系数 r ,ni 1ti tyi yni 1ti t2ni 1yi y2回归方程 t 中斜率和截距的最小二乘估
3、计公式分别为:y a b , .b ni 1ti tyi yni 1ti t2 a y b t考点 线性回归分析题点 线性回归方程的应用3解 (1)由折线图中数据和附注中参考数据得4, (ti )228, 0.55,t7i 1 t7i 1yi y2(ti )(yi ) iyi i40.1749.322.89,7i 1 t y7i 1t t7i 1yr 0.99.2.8922.6460.55因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当高,从而可以用线性回归模型拟合 y 与 t 的关系(2)由 1.331 及(1)得y9.327 0.103,b 7i 1ti
4、tyi y7i 1ti t2 2.8928 1.3310.10340.92.a y b t所以 y 关于 t 的回归方程为 0.920.10 t.y 将 2019 年对应的 t12 代入回归方程得0.920.10122.12.y 所以预测 2019 年我国生活垃圾无害化处理量约为 2.12 亿吨反思与感悟 解决回归分析问题的一般步骤(1)画散点图根据已知数据画出散点图(2)判断变量的相关性并求回归方程通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程(3)回归分析画残差图或计算 R2,进行残差分析(4)实际应用依据求得的回归方程解决实际问题
5、跟踪训练 1 经分析预测,美国通用汽车等 10 家大公司的销售总额 xi(i1,2,10,单位:百万美元)与利润 yi(i1,2,10,单位:百万美元)的近似线性关系为0.026 x ,经统计 i623 090, i29 300.y a 10i 1x 10i 1y(1)求 ;a 4(2)若通用汽车公司的销售总额 x1126 974(百万美元),残差 1387,估计通用汽车的e 利润;(3)福特公司的销售总额为 96 933 百万美元,利润为 3 835,比较通用汽车公司与福特公司利润的解释变量对于预报变量变化的贡献率说明了什么?(以上答案精确到个位)考点 残差分析与相关指数题点 残差及相关指数
6、的应用解 (1)由 i623 090, i29 300,10i 1x10i 1y得样本点中心为(62 309,2 930),所以 2 9300.02662 3091 310.a (2)由(1)知 0.026 x1 310,y 当 x1126 974 时,10.026126 9741 3104 611,y 所以 y1 1 14 611(387)4 224,y e 估计通用汽车公司的利润为 4 224 百万美元(3)由(1)(2)可得通用汽车公司利润的解释变量对于预报变量变化的贡献率为 R ,21则 R 1 1 0.91191.1%.21y1 y 12y1 y2 38721 2942设福特公司利润
7、的解释变量对于预报变量变化的贡献率为 R ,2由 0.026 x1 310 得y 20.02696 9331 3103 830,y 则 R 1 1 0.999 9723 835 3 83023 835 2 9302 52905299.997%.由 R R 知,用 0.026 x1 310 作为解释变量与预报变量的关系,预报通用汽车公司的21 2 y 效果没有预报福特公司的效果好,或者说预报通用汽车公司的精确度低于预报福特公司的精确度类型二 独立性检验例 2 奥运会期间,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了 60 人,结果如下:5是否愿意提供志愿者服务性别 愿意
8、 不愿意男生 20 10女生 10 20(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取 6 人,其中男生抽取多少人?(2)你能否在犯错误的概率不超过 0.01 的前提下认为该校高中生是否愿意提供志愿者服务与性别有关?下面的临界值表供参考:P(K2 k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828独立性检验统计量 K2 ,其中 n a b c d.nad bc2a bc da cb d考点 独立性检验思想的应用题点 分类变量与统计、概率的综合性问题解 (1)由题意
9、,男生抽取 6 4(人)2020 10(2)K2 6.667,由于 6.6676.635,所以能在犯错误的概602020 1010230303030率不超过 0.01 的前提下认为该校高中生是否愿意提供志愿者服务与性别有关反思与感悟 独立性检验问题的求解策略(1)等高条形图法:依据题目信息画出等高条形图,依据频率差异来粗略地判断两个变量的相关性(2)通过公式 K2nad bc2a bc da cb d先计算观测值 k,再与临界值表作比较,最后得出结论跟踪训练 2 某学生对其亲属 30 人的饮食习惯进行了一次调查,并用茎叶图表示 30 人的饮食指数,如图所示(说明:图中饮食指数低于 70 的人,
10、饮食以蔬菜为主;饮食指数高于70 的人,饮食以肉类为主)6(1)根据茎叶图,帮助这位同学说明其亲属 30 人的饮食习惯;(2)根据以上数据完成下列 22 列联表;主食蔬菜 主食肉类 合计50 岁以下50 岁以上总计 (3)在犯错误的概率不超过 0.01 的前提下,是否能认为“其亲属的饮食习惯与年龄有关”?考点 独立性检验思想的应用题点 独立性检验在分类变量中的应用解 (1)30 位亲属中 50 岁以上的人多以食蔬菜为主,50 岁以下的人多以食肉类为主(2)22 列联表如表所示:主食蔬菜 主食肉类 合计50 岁以下 4 8 1250 岁以上 16 2 18总计 20 10 30(3)K2 106
11、.635,308 128212182010故在犯错误的概率不超过 0.01 的前提下认为“其亲属的饮食习惯与年龄有关” 1甲、乙、丙、丁四位同学各自对 A, B 两变量进行线性相关检验,并用回归分析方法分别求得相关系数 r 如下表:甲 乙 丙 丁r 0.82 0.78 0.69 0.857则这四位同学的试验结果能体现出 A, B 两变量有更强的线性相关性的是( )A甲 B乙C丙 D丁考点 线性相关系数题点 线性相关系数的应用答案 D解析 由相关系数的意义可知,相关系数的绝对值越接近于 1,相关性越强,结合题意可知丁的线性相关性更强故选 D.2为了解高中生作文成绩与课外阅读量之间的关系,某研究机
12、构随机抽取了 60 名高中生,通过问卷调查,得到以下数据:作文成绩优秀 作文成绩一般 总计课外阅读量较大 22 10 32课外阅读量一般 8 20 28总计 30 30 60由以上数据,计算得到 K2的观测值 k9.643,根据临界值表,以下说法正确的是( )A没有充足的理由认为课外阅读量大与作文成绩优秀有关B有 0.5%的把握认为课外阅读量大与作文成绩优秀有关C有 99.9%的把握认为课外阅读量大与作文成绩优秀有关D有 99.5%的把握认为课外阅读量大与作文成绩优秀有关考点 独立性检验及其基本思想题点 独立性检验的方法答案 D解析 根据临界值表,10.8289.6437.879,在犯错误的概
13、率不超过 0.005 的前提下,认为课外阅读量大与作文成绩优秀有关,即有 99.5%的把握认为课外阅读量大与作文成绩优秀有关3某化妆品公司为了增加其商品的销售利润,调查了该商品投入的广告费用 x 与销售利润y 的统计数据如下表:广告费用 x(万元) 2 3 5 6销售利润 y(万元) 5 7 9 11由表中数据,得线性回归方程 l: x ,则下列结论正确的是( )y b a 8A. 0 B. 0b a C直线 l 过点(4,8) D直线 l 过点(2,5)考点 线性回归方程题点 样本点中心的应用答案 C解析 因为 1.40, 81.442.40,所以排除 A,B;因为b a y b x1.4
14、x2.4,所以 1.422.45.25,所以点(2,5)不在直线 l 上,所以排除 D;因为y 4, 8,所以回归直线 l 过样本点的中心(4,8),故选 C.x y4在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁为了考察某种埃博拉病毒疫苗的效果,现随机抽取 100 只小鼠进行试验,得到如下列联表:感染 未感染 总计服用 10 40 50未服用 20 30 50总计 30 70 100附表:P(K2 k0) 0.10 0.05 0.025k0 2.706 3.841 5.024参照附表,在犯错误的概率不超过_(填百分比)的前提下,认为“小鼠是否被感染与服用疫苗有关” 考点 独
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 选修 _3DOC
