2020版高考数学一轮复习10.4相关性、最小二乘估计与统计案例课件理北师大版.pptx
《2020版高考数学一轮复习10.4相关性、最小二乘估计与统计案例课件理北师大版.pptx》由会员分享,可在线阅读,更多相关《2020版高考数学一轮复习10.4相关性、最小二乘估计与统计案例课件理北师大版.pptx(45页珍藏版)》请在麦多课文档分享上搜索。
1、10.4 相关性、最小二乘估计 与统计案例,-2-,知识梳理,考点自诊,1.相关性 (1)散点图:在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的 . (2)线性相关:若两个变量x和y的散点图中,所有点看上去都在_附近波动,则称变量间是线性相关的,此时,我们可以用 来近似. (3)非线性相关:在两个变量x和y的散点图中,若所有点看上去都在某条 附近波动,则称此相关为非线性相关的.此时,可以用一条 来拟合.如果所有的点在散点图中没有显示任何关系,则称变量间是 .,散点图,一条直线,一条直线,曲线,
2、曲线,不相关的,-3-,知识梳理,考点自诊,2.最小二乘法与线性回归方程 (1)最小二乘法:如果有n个点:(x1,y1),(x2,y2),(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:y1-(a+bx1)2+ y2-(a+bx2)2+yn-(a+bxn)2. 使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种方法称为 .,a= .这样得到的直线方程称为线性回归方程,a,b是线性回归方程的系数.,最小二乘法,-4-,知识梳理,考点自诊,3.独立性检验 (1)22列联表,构造一个随机变量2= , 其中n= 为样本容量. (2)独立性检验 利用随机变量来判断
3、“两个变量 ”的方法称为独立性检验.,a+b+c+d,有关联,-5-,知识梳理,考点自诊,(3)当数据量较大时,在统计中,用以下结果对变量的独立性进行判断 当22.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的; 当22.706时,有90%的把握判定变量A,B有关联; 当23.841时,有95%的把握判定变量A,B有关联; 当26.635时,有99%的把握判定变量A,B有关联.,-6-,知识梳理,考点自诊,1.判断下列结论是否正确,正确的画“”,错误的画“”. (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系. ( ) (2)利用散点图可以直观判断两
4、个变量的关系是否可以用线性关系表示. ( ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值. ( ) (4)事件X,Y关系越密切,则由观测数据计算得到的2的值越大. ( ) (5)通过回归方程y=bx+a可以估计和观测变量的取值和变化趋势. ( ),-7-,知识梳理,考点自诊,2.(2018黑龙江仿真模拟七,3)为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:(x1,y1),(x2,y2), (x3,y3),(x4,y4),(x5,y5).根据收集到的数据可知x1+x2+x3+x4+x5=150,由最小二乘法求得回归直线方程为y=0.67x+54
5、.9,则y1+y2+y3+y4+y5的值为( ) A.75 B.155.4 C.375 D.466.2,A,-8-,知识梳理,考点自诊,3.(2018辽宁丹东二模,5)已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:,根据上表可得回归方程y=bx+a,计算得b=7,则当投入10万元广告费时,销售额的预报值为( ) A.75万元 B.85万元 C.99万元 D.105万元,B,回归直线y=7x+a过样本中心(5,50), 50=75+a,解得a=15,回归直线方程为y=7x+15. 当x=10时,y=710+15=85, 故当投入10万元广告费时,销售额的预报
6、值为85万元,故选B.,-9-,知识梳理,考点自诊,4.(2018山西大同、阳泉二模,文4)某班主任对全班50名学生进行了作业量的调查,数据如表:,若推断“学生的性别与认为作业量大有关”,则( ),-10-,知识梳理,考点自诊,A.有99%的把握判定它们有关联 B.有95%的把握判定它们有关联 C.有90%的把握判定它们无关联 D.没有充分的证据判定它们有关联,答案:B 解析:根据表中数据得到 5.0593.841,所以,若推断“学生的性别与认为作业量大有关”,则有95%的把握判定它们有关联,故选B.,-11-,知识梳理,考点自诊,5.(2018辽宁葫芦岛二模,15改编)下列说法: 线性回归方
7、程y=bx+a必过 ; 相关系数r越接近1,表明两个变量相关性越弱; 在回归直线方程y=-0.5x+2中,当解释变量x每增加一个单位时,预报变量y平均减少0.5个单位; 在一个22列联表中,由计算得2=8.079,则有99%的把握认为这两个变量间有关系; 对分类变量X与Y,它们的随机变量2的值来说,k越小,“X与Y有关系”的把握程度越大. 其中正确的说法是 .(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:,-12-,知识梳理,考点自诊,解析:线性回归方程y=bx+a必过样本中心点 ,故正确; 相关系数r绝对值越接近1,表明两个变量相关性越强,故错误;在回归直线方程y=-0.
8、5x+2中,当解释变量x每增加一个单位时,预报变量y平均减少0.5个单位,故正确;在一个22列联表中,由计算得2=8.079,则有99%的把握认为这两个变量间有关系,故正确;对分类变量X与Y,它们的随机变量2的值来说,2值越小,“X与Y有关系”的把握程度越小;故错误.综上,答案为.,-13-,考点1,考点2,考点3,相关关系的判断 例1(1)(2018北京八中乌兰察布分校期末,10)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )A.r2r40r3r1 B.r4r20r1r3 C.r4r20r3r1 D.r2r40r1r3,A,-14-,考点1,考点2,考点3,(2)(
9、2018福建宁德5月质检,3)下图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是( )A.D B.E C.F D.A,B,-15-,考点1,考点2,考点3,解析: (1)图1和图3是正相关,相关系数大于0;图2和图4是负相关,相关系数小于0;图1和图2的点相对更加集中,所以相关性较强,所以r1接近于1,r2接近于-1,由此可得r2r4r3r1,故选A. (2)因为相关系数的绝对值越大,越接近1,则说明两个变量的相关性越强.因为点E到直线的距离最远,所以去掉点E, 余下的5个点所对应的数据的相关系数最大,故选B.,-
10、16-,考点1,考点2,考点3,思考如何判断两个变量有无相关关系? 解题心得判断相关关系的2种方法 (1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系. (2)相关系数法:利用相关系数判定,当|r|越趋近于1相关性越强.,-17-,考点1,考点2,考点3,对点训练1(1)(2018河北张家口模拟,4)已知x,y是两个变量,下列四个散点图中,x,y呈正相关趋势的是 ( ),A,-18-,考点1,考点2,考点3,(2)(2018湖南长沙模拟,11)某市国庆节7天假期的楼房认购量(单位:套)与成交量(单位:套)
11、的折线图如图所示,小明同学根据折线图对这7天的认购量与成交量作出如下判断:日成交量的中位数是16;日成交量超过日平均成交量的有2天;认购量与日期正相关;10月7日认购量的增量大于10月7日成交量的增量.上述判断中错误的个数为( )A.1 B.2 C.3 D.4,C,-19-,考点1,考点2,考点3,解析: (1)当x,y呈正相关趋势时,散点图应该是从左下到右上趋势,由图可知选项A中的散点图是从左下到右上趋势,描述了y随着x的增加而增加的变化趋势,故选A. (2)将成交量数据按大小顺序排列,中位数为26,所以错;日平均成交量为 ,超过42.7的只有一天,所以错;由图中可以看出,数据点并不是从左下
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2020 高考 数学 一轮 复习 104 相关性 最小 估计 统计 案例 课件 北师大 PPTX
