1、1课时作业 58 变量间的相关关系与统计案例基础达标一、选择题12019石家庄模拟下列说法错误的是( )A回归直线过样本点的中心( , )x y B两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于 1C对分类变量 X 与 Y,随机变量 K2的观测值 k 越大,则判断“ X 与 Y 有关系”的把握程度越小D在回归直线方程 0.2 x0.8 中,当解释变量 x 每增加 1 个单位时,预报变量 平x y 均增加 0.2 个单位解析:本题考查命题真假的判断根据相关定义分析知 A,B,D 正确;C 中对分类变量 X 与 Y 的随机变量 K2的观测值 k 来说, k 越大,判断“ X 与 Y 有
2、关系”的把握程度越大,故 C 错误,故选 C.答案:C2为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区 5 户家庭,得到如下统计数据表:收入 x(万元 ) 8.2 8.6 10.0 11.3 11.9支出 y(万元 ) 6.2 7.5 8.0 8.5 9.8根据上表可得回归直线方程 x ,其中 0.76, .据此估计,该社区y b a b a y b x 一户年收入为 15 万元家庭的年支出为( )A11.4 万元 B11.8 万元C12.0 万元 D12.2 万元解析: 10.0, 8.0, 0.76, 80.76100.4,回归方程为x y b a 0.76 x0.4,把 x
3、15 代入上式得, 0.76150.411.8(万元)y y 答案:B3通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 合计爱好 40 20 60不爱好 20 30 50合计 60 50 110由 K2 ,n ad bc 2 a b c d a c b d算得 K2 7.8.110 4030 2020 260506050附表P(K2 k0) 0.050 0.010 0.001k0 3.841 6.635 10.828参照附表,得到的正确结论是( )A在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关”B在犯错误的概率不超过 0.1%的前提下
4、,认为“爱好该项运动与性别无关”C有 99%以上的把握认为“爱好该项运动与性别有关”D有 99%以上的把握认为“爱好该项运动与性别无关”解析:根据独立性检验的定义,由 K27.86.635,可知我们在犯错误的概率不超过0.01 的前提下,即有 99%以上的把握认为“爱好该项运动与性别有关” ,故选 C.2答案:C42017山东卷为了研究某班学生的脚长 x(单位:厘米)和身高 y(单位:厘米)的关系,从该班随机抽取 10 名学生,根据测量数据的散点图可以看出 y 与 x 之间有线性相关关系设其回归直线方程为 x .已知 i225, i1 600, 4.该班某学生y b a 10i 1x 10i
5、1y b 的脚长为 24,据此估计其身高为( )A160 B163C166 D170解析: i225, i22.5.10i 1x x 11010i 1x i1 600, i160.10i 1y y 11010i 1y又 4, 160422.570.b a y b x 回归直线方程为 4 x70.y 将 x24 代入上式得 42470166.y 故选 C.答案:C52019河南安阳模拟已知变量 x 与 y 的取值如下表所示,且 2.55.024,180 6045 3045 2105759090 367所以在犯错误的概率不超过 0.025 的前提下能认为科类的选择与性别有关102019成都检测某项
6、科研活动共进行了 5 次试验,其数据如下表所示:特征量 第 1 次 第 2 次 第 3 次 第 4 次 第 5 次x 555 559 551 563 552y 601 605 597 599 598(1)从特征量 y 的 5 次试验数据中随机地抽取两个数据,求至少有一个大于 600 的概率;(2)求特征量 y 关于 x 的线性回归方程 x ,并预测当特征量 x 为 570 时特征量 yy b a 的值(附:回归直线 x 的斜率和截距的最小二乘估计分别为 y b a b , )ni 1 xi x yi y ni 1 xi x 2 ay b x 解析:(1)记“至少有一个大于 600”为事件 A,
7、则 P(A)1 .C23C25 710(2)由题中表格可知, 556, x 555 559 551 563 5525 y 600.601 605 597 599 5985 b 11 35 5 3 7 1 4 2 1 2 32 5 2 72 4 2 0.3,30100 6000.3556433.2,a y b x 线性回归方程为 0.3 x433.2.y 当 x570 时, 0.3570433.2604.2,y 故特征量 x 为 570 时,特征量 y 的估计值为 604.2.能力挑战112018全国卷某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产
8、方式的效率,选取 40 名工人,将他们随机分成两组,每组 20 人第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:5(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求 40 名工人完成生产任务所需时间的中位数 m,并将完成生产任务所需时间超过m 和不超过 m 的工人数填入下面的列联表:超过 m 不超过 m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有 99%的把握认为两种生产方式的效率有差异?附: K2 ,n ad bc 2 a b c d a c b dP(K2 k) 0.050 0.010
9、0.001k 3.841 6.635 10.828.解析:(1)第二种生产方式的效率更高理由如下:()由茎叶图可知:用第一种生产方式的工人中,有 75%的工人完成生产任务所需时间至少 80 分钟,用第二种生产方式的工人中,有 75%的工人完成生产任务所需时间至多 79分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为 85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为 73.5 分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于 80 分钟;用第二种生产方式的工人完成生产任务平
10、均所需时间低于 80 分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎 8 上的最多,关于茎 8 大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎 7 上的最多,关于茎 7 大致呈对称分布又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少因此第二种生产方式的效率更高以上给出了 4 种理由,考生答出其中任意一种或其他合理理由均可得分(2)由茎叶图知 m 80.79 812列联表如下:超过 m 不超过 m第一种生产方式 15 5第二种生产方式 5 15(3)由于 K2 106.635,所以有 99%的把握认为两种生产40 1515 55 220202020方式的效率有差异6