1、1课时规范练 54 相关性、最小二乘估计与统计案例基础巩固组1.(2018福建莆田模拟,3)设一个线性回归方程 y=3+1.2x,当变量 x每增加一个单位时,则 y的变化情况正确的是( )A.y平均增加约 1.2个单位B.y平均增加约 3个单位C.y平均减少约 1.2个单位D.y平均减少约 3个单位2.(2018黑龙江模拟十,6)下列表格所示的五个散点,原本数据完整,且利用最小二乘法求得这五个散点的线性回归直线方程为 y=0.8x-155,后因某未知原因使第 5组数据的 y值模糊不清,此位置数据记为 m(如下表所示),则利用回归方程可求得实数 m的值为( )x 196 197 200 203
2、204y 1 3 6 7 mA.8.3 B.8.2 C.8.1 D.83.(2018广东佛山二模,5)某同学用收集到的 6组数据对( xi,yi)(i=1,2,3,4,5,6)制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线 l的方程为 y=bx+a,相关系数为 r.现给出以下 3个结论: r 0; 直线 l恰好过点 D;b 1.其中正确结论是( )A. B.C. D.4.(2018辽南协作校一模,3)根据如下样本数据得到回归直线方程 y=bx+a,其中 a=10.5,则当 x=6时, y的估计值是( )x4 2 3 5y49 26 39 54A.57.5 B.6
3、1.5C.64.5 D.67.55.(2018黑龙江仿真模拟十一,5)某研究型学习小组调查研究学生使用智能手机对学习的影响 .部分统计数据如下表:使用智能手机不使用智能手机总计2学习成绩优秀 4 8 12学习成绩不优秀 16 2 18总 计 20 10 30附表:P( 2k0)0.100.050.010k0 2.706 3.841 6.635经计算 2=10,则下列选项正确的是( )A.有 99%的把握认为使用智能手机对学习有影响B.有 99%的把握认为使用智能手机对学习无影响C.有 95%的把握认为使用智能手机对学习有影响D.有 95%的把握认为使用智能手机对学习无影响6.(2018河南洛阳
4、质检,13)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟订的价格进行试销,得到如下数据 .单价x/元 4 5 6 7 8 9销量y/件908483807568由表中数据求得线性回归方程 y=-4x+a,则 x=10元时预测销量为 件 . 7.(2018河南商丘模拟,19)已知具有线性相关关系的两个变量 x,y之间的几组数据如下表所示:x2468 10y36710 12(1)请根据上表提供的数据,用最小二乘法求出 y关于 x的线性回归方程 y=bx+a,并估计当 x=20时,y的值;(2)将表格中的数据看作五个点的坐标,则从这五个点中随机抽取 2个点,求恰有 1个点落在直线2x-y
5、-4=0右下方的概率 .3参考公式: b= ,a= -b .=1- =12-()2 综合提升组8.(2018河北保定一模,3)已知具有线性相关的变量 x,y,设其样本点为 Ai(xi,yi)(i=1,2,8),回归直线方程为 y=x+a,若 + =(6,2),(O为原点),则 a=( )1+2 8A. B.- C. D.-9.(2018安徽合肥一中最后 1卷,文 13)为了研究某班学生的脚长 x(单位:cm)和身高 y(单位:cm)的关系,从该班随机抽取 10名学生,根据测量数据的散点图可以看出 y与 x之间有线性相关关系,设其回归直线方程为 y=bx+a.已知 xi=225, yi=1 60
6、0,b=4.该班某学生的脚长为 24 cm,据此估计10=1 10=1其身高为 cm. 10.(2018安徽蚌埠一模,文 19)某图书公司有一款图书的历史收益率(收益率 =利润 每本收入)的频率分布直方图如图所示:(1)试估计平均收益率;(用区间中点值代替每一组的数值)(2)根据经验,若每本图书的收入在 20元的基础上每增加 x元,对应的销量 y(万本)与 x(元)有较强线性相关关系,从历史销售记录中抽样得到如下 5组 x与 y的对应数据:x元 25 30 38 45 52销量 y万本 7.5 7.1 6.0 5.6 4.8据此计算出的回归方程为 y=10.0-bx. 求参数 b的估计值;4
7、若把回归方程 y=10.0-bx当作 y与 x的线性关系, x取何值时,此产品获得最大收益?求出该最大收益 .11.(2018山东日照 5月校际联考,19)为了缓解日益拥堵的交通状况,不少城市实施车牌竞价策略,以控制车辆数量 .某地车牌竞价的基本规则是: “盲拍”,即所有参与竞拍的人都要网络报价一次,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数; 竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额 .某人拟参加 2018年 5月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的数据,统计了最近 5个月参与竞拍的人数(见下表):月 份 2017.12 2018.01
8、 2018.02 2018.03 2018.04月份编号 t 1 2 3 4 5竞拍人数 y(万人) 0.5 0.6 1 1.4 1.7(1)由收集数据的散点图发现,可用线性回归模型拟合竞拍人数 y(万人)与月份编号 t之间的相关关系 .请用最小二乘法求出 y关于 t的线性回归方程: y=bt+a,并预测 2018年 5月份参与竞拍的人数 .(2)某市场调研机构从拟参加 2018年 5月份车牌竞拍人员中,随机抽取了 200人,对他们的拟报价价格进行了调查,得到如下频数分布表和频率分布直方图:报价区间(万元) 1,2)2,3)3,4)4,5) 5,6)6,7)7,8)频数 10 30 a 60
9、30 20 10 求 a,b的值及这 200位竞拍人员中报价大于 5万元的人数; 若 2018年 5月份车牌配额数量为 3 000,假设竞拍报价在各区间分布是均匀的,请你根据以上抽样的数据信息,预测(需说明理由)竞拍的最低成交价 .参考公式及数据: y=bx+a ,其中 b= ,a= -b ; =55, tiyi=18.8.=1- =12-2 5=12 5=15创新应用组12.(2018黑龙江哈尔滨三中一模,10)千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,哈三中积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计:年份(届) 2014
10、 2015 2016 2017学科竞赛获省级一等奖及以上学生人数 x51 49 55 57被清华、北大等世界名校录取的学生人数 y103 96 108 107根据上表可得回归方程 y=bx+a中的 b为 1.35,我校 2018届同学在学科竞赛中获省级一等奖以上学生人数为 63人,据此模型预报我校今年被清华、北大等世界名校录取的学生人数为( )A.111 B.115 C.117 D.12313.(2018湖北七校联盟 2月联考,19)已知鸡的产蛋量与鸡舍的温度有关,为了确定下一个时段鸡舍的控制温度,某企业需要了解鸡舍的温度 x(单位:),对某种鸡的时段产蛋量 y(单位:t)和时段投入成本 z(
11、单位:万元)的影响,为此,该企业收集了 7个鸡舍的时段控制温度 xi和产蛋量yi(i=1,2,7)的数据,对数据初步处理后得到了如图所示的散点图和表中的统计量的值 .7=1(-)217.40 82.30 3.6 14067=1(-)2(xi-7=1)(yi-)(xi-7=1)(ki-)9.7 2 935.1 35.0其中 ki=ln yi, ki.=177=1(1)根据散点图判断, y=bx+a与 y=c1 哪一个更适宜作为该种鸡的时段产蛋量 y关于鸡舍时段控2制温度 x的回归方程类型?(给判断即可,不必说明理由)(2)若用 y=c1 作为回归方程模型,根据表中数据,建立 y关于 x的回归方程
12、;2(3)已知时段投入成本 z与 x,y的关系为 z=e-2.5y-0.1x+10,当时段控制温度为 28 时,鸡的时段产蛋量及时段投入成本的预报值分别是多少?附: 对于一组具有有线性相关关系的数据( i,vi)(i=1,2,3,n),其回归直线 v=u+ 的斜率和截距的最小二乘估计分别为 = ,= -=1(-)(-)=1(-)2 e-2.5e-0.75 e e3 e70.080.472.7220.091 096.637参考答案课时规范练 54 相关性、最小二乘估计与统计案例1.A 令 x=a,y=3+1.2a,令 x=a+1,则 y=3+1.2(a+1)=4.2+1.2a,所以当变量 x每增
13、加一个单位时,则y平均增加约 1.2个单位,故选 A.2.D 由题意可得: = =200, = = ,回归方程过196+197+200+203+2045 1+3+6+7+5 17+5样本中心点,则: =0.8200-155,解得 m=8,故选 D.17+53.A 由题图可知这些点分布在一条斜率大于零的直线附近,所以为正相关,即相关系数 r0;因为 = =3, = =3,0+1+2+3+5+76 1.5+2+2.3+3+5+4.26所以回归直线 l的方程必过点(3,3),即直线 l恰好过点 D.因为直线 l斜率接近于 AD斜率,而kAD= = 6. 635,据此结合独立性检验的思想可知:有 99
14、%的把握认为使用智能手机对学习有影响,故选 A.6.66 由已知得 = (4+5+6+7+8+9)= , = (90+84+83+80+75+68)=80,132 a= 80+4 =106, 当 x=10 时, y=106-40=66,故答案为 66.1327.解 (1) = (2+4+6+8+10)=6, = (3+6+7+10+12)=7.6, =4+16+36+64+100=220, xiyi=6+24+42+80+120=272,5=125=1b= = = =1.1,a= 7.6-61.1=1,5=1-5 5=12-5()2272-567.6220-562 4440 回归直线方程为 y
15、=1.1x+1,故当 x=20时, y=23.(2)可以判断,落在直线 2x-y-4=0右下方的点满足 2x-y-40,8故符合条件的点的坐标为(6,7),(8,10),(10,12),共有 10种取法,满足条件的有 6种,所以 P= .610358.B 因为 + + =(x1+x2+x8,y1+y2+y8)=(8 ,8 )=(6,2),所以 8 =6,8 =2 =, =,12 8 因此 =+a,即 a=-,故选 B.9.166 由 xi=225, yi=1 600,利用平均值公式求得 =22.5, =160,10=110=1 b= 4,a= 160-422.5=70,从而当 x=24时, y
16、=424+70=166,故答案为 166.10.解 (1)区间中值依次为:0 .05,0.15,0.25,0.35,0.45,0.55,取值的估计概率依次为:0.1,0.2,0.25,0.3,0.1,0.05,故平均收益率为0.050.10+0.150.20+0.250.25+0.350.30+0.450.10+0.550.05=0.275.(2) = = =38, = = =6.2,25+30+38+45+525 1905 7.5+7.1+6.0+5.6+4.85 315将(38,6 .2)代入 y=10-bx,得 b= =0.10.10.0-6.238 设每本图书的收入是 20+x元,则销
17、量为 y=10-0.1x,则图书总收入为f(x)=(20+x)(10-0.1x)=200+8x-0.1x2=360-0.1(x-40)2(万元),当 x=40时,图书公司总收入最大为 360万元,预计获利为 3600.275=99万元 .11.解 (1)易知 = =3, = =1.04,b= =1+2+3+4+55 0.5+0.6+1+1.4+1.755=1-5 5=12-52=0.32,a= -b=1.04-0.323=0.08,18.8-531.0455-532 则 y关于 t的线性回归方程为 y=0.32t+0.08,当 t=6时, y=2.00,即 2018年 5月份参与竞拍的人数估计
18、为 2万人 .(2) 由 =0.20解得 a=40.由频率和为 1,得(0 .052+0.10+2b+0.20+0.30)1=1,解得200b=0.15,200位竞拍人员报价大于 5万元的人数为(0 .05+0.10+0.15)200=60人 . 2018年 5月份实际发放车牌数量为 3 000,根据竞价规则,报价在最低成交价以上人数占总人数比例为 100%=15%;又由频率分布直方图知竞拍报价大于 6万元的频率为3 00020 0000.05+0.10=0.15,所以,根据统计思想(样本估计总体)可预测 2018年 5月份竞拍的最低成交价为 6万元 .12.C 由题意得 = =53, = =
19、103.5.51+49+55+574 103+96+108+10749 数据的样本中心点在线性回归直线上, y=bx+a中的 b为 1.35, 103.5=1.3553+a,即a=31.95, 线性回归方程是 y=1.35x+31.95. 2018届同学在学科竞赛中获省级一等奖以上学生人数为 63人, 今年被清华、北大等世界名校录取的学生人数为 1.3563+31.95=117,故选 C.13.解 (1) y=c1 适宜 .2(2)由 y=c1 得 ln y=c2x+ln c1,令 ln y=k,c2= ,= ln c1,由图表中的数据可知2= = ,=- ,k= x- ,y 关于 x的回归方程为 y= =0.47 .3514014 34 14 34 4-34 4(3)当 x=28时,由回归方程得 y=0.471 096.63=515.4,z=0.08515. 4-2.8+10=48.432.即鸡舍的温度为 28 时,鸡的时段产量的预报值为 515.4,投入成本的预报值为 48.432.