2018高中数学第1章统计案例1.2回归分析学案苏教版选修1_2.doc
《2018高中数学第1章统计案例1.2回归分析学案苏教版选修1_2.doc》由会员分享,可在线阅读,更多相关《2018高中数学第1章统计案例1.2回归分析学案苏教版选修1_2.doc(15页珍藏版)》请在麦多课文档分享上搜索。
1、- 1 -12 回归分析学习目标 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.3.了解回归分析的基本思想和初步应用知识链接1什么叫回归分析?答 回归分析是对具有相关关系的两个变量进行统计分析的一种方法2回归分析中,利用线性回归方程求出的函数值一定是真实值吗?答 不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等预习导引1线性回归方程(1)对于 n 对观测数据( xi, yi)(i1,2,3, n),直线方程 x 称为这 n
2、对数据的线y a b 性回归方程其中 称为回归截距, a y b x b ni 1(xi xto(x)(yi xto(y)ni 1(xi xto(x)2称为回归系数, 称为回归值ni 1xiyi nx yni 1x2i n(xto(x)2 y (2)将 y a bx 称为线性回归模型,其中 a bx 是确定性函数, 称为随机误差2相关系数 r 的性质(1)|r|1;(2)|r|越接近于 1, x, y 的线性相关程度越强;(3)|r|越接近于 0, x, y 的线性相关程度越弱3显著性检验(1)提出统计假设 H0:变量 x, y 不具有线性相关关系;(2)如果以 95%的把握作出判断,可以根据
3、 10.950.05 与 n2 在附录 2 中查出一个 r 的- 2 -临界值 r0.05(其中 10.950.05 称为检验水平);(3)计算样本相关系数 r ni 1(xi xto(x)(yi xto(y)ni 1(xi xto(x)2ni 1(yi xto(y)2ni 1xiyi nxy(isu(i 1,n,x)oal(2,i) n(xto(x)2)(isu(i 1,n,y)oal(2,i) n(xto(y)2);(4)作出统计推断:若| r| r0.05,则否定 H0,表明有 95%的把握认为 x 与 y 之间具有线性相关关系;若| r| r0.05,则没有理由拒绝原来的假设 H0,即
4、就目前数据而言,没有充分理由认为 x 与 y 之间有线性相关关系.要点一 线性相关的判断例 1 某校高三(1)班的学生每周用于数学学习的时间 x(单位: h)与数学平均成绩 y(单位:分)之间有表格所示的数据.x 24 15 23 19 16 11 20 16 17 13y 92 79 97 89 64 47 83 68 71 59(1)画出散点图;(2)作相关性检验;(3)若某同学每周用于数学学习的时间为 18h,试预测其数学成绩解 (1)根据表中的数据,画散点图,如图从散点图看,数学成绩与学习时间线性相关(2)由已知数据求得 17.4, 74.9, 3182,x y10i 1x2i- 3
5、-58375, iyi13578,10i 1y2i10i 1x所以相关系数 r 10i 1xiyi 10x y(isu(i 1,10,x)oal(2,i) 10(xto(x)2)(isu(i 1,10,y)oal(2,i) 10(xto(y)2)0.920.而 n10 时, r0.050.632,所以| r| r0.05,所以有 95%的把握认为数学成绩与学习时间之间具有线性相关关系(3)用科学计算器计算,可得线性回归方程为 3.53 x13.44.y 当 x18 时, 3.531813.4477,故预计该同学数学成绩可得 77 分左右y 规律方法 判断变量的相关性通常有两种方式:一是散点图;
6、二是相关系数 r.前者只能粗略的说明变量间具有相关性,而后者从定量的角度分析变量相关性的强弱跟踪演练 1 暑期社会实践中,小闲所在的小组调查了某地家庭人口数 x 与每天对生活必需品的消费 y 的情况,得到的数据如下表:x/人 2 4 5 6 8y/元 20 30 50 50 70(1)利用相关系数 r 判断 y 与 x 是否线性相关;(2)根据上表提供的数据,求出 y 关于 x 的线性回归方程解 (1)由表中数据,利用科学计算器计算得:r 5i 1xiyi 5xy(isu(i 1,5,x)oal(2,i) 5(xto(x)2)(isu(i 1,5,y)oal(2,i) 5(xto(y)2)0.
7、975.因为 r r0.050.878,所以 y 与 x 之间具有线性相关关系(2)根据以上数据可得, 8.5,b 5i 1xiyi 5x y5i 1x2i 5(xto(x)2 448.551.5,a y b x所求的线性回归方程为 1.58.5 x.y - 4 -要点二 求线性回归方程例 2 某班 5 名学生的数学和物理成绩如下表:学生编号 1 2 3 4 5学科编号 A B C D E数学成绩( x) 88 76 73 66 63物理成绩( y) 78 65 71 64 61(1)画出散点图;(2)求物理成绩 y 对数学成绩 x 的线性回归方程;(3)一名学生的数学成绩是 96,试预测他的
8、物理成绩解 (1)散点图如图(2) (8876736663)73.2,x15 (7865716461)67.8.y15iyi887876657371666463615i 1x25054.88 276 273 266 263 227174.5i 1x2i所以 0.625.b 5i 1xiyi 5x y5i 1x2i 5(xto(x)2 25054 573.267.827174 573.22 67.80.62573.222.05.a y b x所以 y 对 x 的线性回归方程是 0.625 x22.05.y (3)x96,则 0.6259622.0582,即可以预测他的物理成绩是 82.y 规律方
9、法 (1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析- 5 -(2)求线性回归方程,首先应注意到,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义跟踪演练 2 某研究机构对高三学生的记忆力 x 和判断力 y 进行统计分析,得下表数据:x 6 8 10 12y 2 3 5 6请画出上表数据的散点图(要求:点要描粗);请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程 x ;y b a 试根据求出的线性回归方程,预测记忆力为 9 的同学
10、的判断力解 如图: xiyi6283105126158,n i 1 9,x6 8 10 124 4,y2 3 5 64x 6 28 210 212 2344,n i 12i 0.7,b 158 494344 492 1420 40.792.3,a y b x故线性回归方程为 0.7 x2.3.y 由中线性回归方程当 x9 时, 0.792.34,故预测记忆力为 9 的同学的判断力y 为 4.要点三 非线性回归分析例 3 某种书每册的成本费 y(元)与印刷册数 x(千册)有关,经统计得到数据如下:x 1 2 3 5 10y 10.15 5.52 4.08 2.85 2.11x 20 30 50
11、100 200- 6 -y 1.62 1.41 1.30 1.21 1.15检验每册书的成本费 y 与印刷册数的倒数 之间是否具有线性相关关系;如有,求出 y 对 x1x的回归方程解 令 u ,原题中所给数据变成如下表示的数据:1xu 1 0.5 0.33 0.2 0.1y 10.15 5.52 4.08 2.85 2.11u 0.05 0.03 0.02 0.01 0.005y 1.62 1.41 1.30 1.21 1.150.2245, 3.14, 10( )20.9088,u y10i 1u2i uiyi10 8.15525, 10( )273.207,10i 1u uy10i 1y2
12、i y r 0.9998,8.155250.908873.207查表得 r0.050.632,因为 r r0.05,从而认为 u 与 y 之间具有线性相关关系回归系数 8.974,b 8.155250.90883.148.9740.22451.125,a 所以 8.974 u1.125,y 所以 y 对 x 的回归方程为 1.125.y 8.974x规律方法 对非线性回归问题,若给出经验公式,采用变量代换把问题转化为线性回归问题若没有经验公式,需结合散点图挑选拟合得最好的函数跟踪演练 3 在试验中得到变量 y 与 x 的数据如下表:试求 y 与 x 之间的回归方程,并预测 x40 时, y 的
13、值.x 19 23 27 31 35y 4 11 24 109 325解 作散点图如图所示,- 7 -从散点图可以看出,两个变量 x, y 不呈线性相关关系,根据学过的函数知识,样本点分布的曲线符合指数型函数 y c1ec2x,通过对数变化把指数关系变为线性关系,令 zln y,则z bx a(aln c1, b c2)列表:x 19 23 27 31 35z 1.386 2.398 3.178 4.691 5.784作散点图如图所示,从散点图可以看出,两个变量 x, z 呈很强的线性相关关系由表中的数据得到线性回归方程为 0.277 x3.998.z 所以 y 关于 x 的指数回归方程为:
14、e 0.277x3.998 .y 所以,当 x40 时, ye0.277403.9981190.347.1在下列各量之间,存在相关关系的是_正方体的体积与棱长之间的关系;一块农田的水稻产量与施肥量之间的关系;人的身高与年龄之间的关系;家庭的支出与收入之间的关系;某户家庭用电量与电价之间的关系答案 2如图是 x 和 y 的一组样本数据的散点图,去掉一组数据_后,剩下的 4 组数据的相关指数最大- 8 -答案 D(3,10)解析 经计算,去掉 D(3,10)这一组数据后,其他 4 组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大3对具有线性相关关系的变量 x 和 y
15、,由测得的一组数据已求得回归直线的斜率为 6.5,且恒过(2,3)点,则这条回归直线的方程为_答案 106.5 xy 解析 由题意知 2, 3, 6.5,所以 36.5210,即回归直线的方x y b a y b x程为 106.5 x.y 4某电脑公司有 6 名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5工作年限 x/年 3 5 6 7 9推销金额 y/万元 2 3 3 4 5(1)求年推销金额 y 关于工作年限 x 的线性回归方程;(2)若第 6 名推销员的工作年限为 11 年,试估计他的年推销金额解 (1)设所求的线性回归方程为 x ,y b a 则 0.
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2018 高中数学 统计 案例 12 回归 分析 学案苏教版 选修 _2DOC
