1、1【课时训练】变量间的相关关系、统计案例一、选择题1(2018 衡水质检)具有线性相关关系的变量 x, y 满足一组数据如下表所示若 y 与x 的线性回归方程为 3 x ,则 m 的值是( )y 32x 0 1 2 3y 1 1 m 8A.4 B. 92C5 D6【答案】A【解析】由已知,得 , 2,x32 y m4又因为点( , )在直线 3 x 上,x y y 32所以 23 ,得 m4.m4 32 322(2018 武汉质检)根据如下样本数据x 3 4 5 6 7 8y 4.0 2.5 0.5 0.5 2.0 3.0得到的回归方程为 x ,则( )y b a A. 0, 0 B. 0,
2、0 D. 0.故 0, 0.y b a b y a a b 23(2018 泰安月考)为了普及环保知识,增强环保意识,某大学从理工类专业的 A 班和文史类专业的 B 班各抽取 20 名同学参加环保知识测试统计得到成绩与专业的列联表:优秀 非优秀 总计A 班 14 6 20B 班 7 13 20总计 21 19 40附:参考公式及数据:(1)统计量:K 2 (n a b cd)n ad bc 2 a b c d a c b d(2)独立性检验的临界值表:P(K2k 0) 0.050 0.010k0 3.841 6.635则下列说法正确的是( )A有 99%的把握认为环保知识测试成绩与专业有关B有
3、 99%的把握认为环保知识测试成绩与专业无关C有 95%的把握认为环保知识测试成绩与专业有关D有 95%的把握认为环保知识测试成绩与专业无关【答案】 C【解析】因为 K2 4.912,3.841K 26.635,所以有40 1413 76 22020211995%的把握认为环保知识测试成绩与专业有关4(2018 云南昆明一中一模)若对于变量 x 的取值为 3,4,5,6,7 时,变量 y 对应的值依次分别为 4.0,2.5,0.5,1,2;若对于变量 u 的取值为 1,2,3,4 时,变量 v 对应的值依次分别为 2,3,4,6,则变量 x 和 y,变量 u 和 v 的相关关系是( )A变量
4、x 和 y 是正相关,变量 u 和 v 是正相关B变量 x 和 y 是正相关,变量 u 和 v 是负相关C变量 x 和 y 是负相关,变量 u 和 v 是负相关D变量 x 和 y 是负相关,变量 u 和 v 是正相关【答案】D【解析】变量 x 增加,变量 y 减少,所以变量 x 和 y 是负相关;变量 u 增加,变量 v增加,所以变量 u 和 v 是正相关,故选 D.5(2018 河南八市质检)为了研究某大型超市当天销售额与开业天数的关系,随机抽取了 5 天,其当天销售额与开业天数的数据如下表所示:开业天数 x 10 20 30 40 50当天销售额y/万元 62 75 81 89根据上表提供
5、的数据,求得 y 关于 x 的线性回归方程为 0.67 x54.9,由于表中有y 一个数据模糊看不清,请你推断出该数据的值为( )3A67 B68 C68.3 D71【答案】B【解析】设表中模糊看不清的数据为 m,因为 30,x10 20 30 40 505又样本中心点( , )在回归直线 0.67 x54.9 上,x y y 所以 0.673054.9,得 m68,故选 B.ym 62 75 81 8956(2018 湖南三校联考)某产品在某零售摊位的零售价 x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:x 16 17 18 19y 50 34 41 31由上表可得线性回归
6、方程 x 中的 4,据此模型预测零售价为 15 元时,每天y b a b 的销售量为( )A51 个 B50 个C49 个 D48 个【答案】 C【解析】由题意,知 17.5, 39,代入线性回归方程,得x y109,10915449,故选 C.a 二、填空题7(2018 合肥二模)某市居民 20102014 年家庭年平均收入 x(单位:万元)与年平均支出 y(单位:万元)的统计资料如下表所示:年份 2010 2011 2012 2013 2014收入 x 11.5 12.1 13 13.3 15支出 y 6.8 8.8 9.8 10 12根据统计资料,居民家庭年平均收入的中位数是_,家庭年平
7、均收入与年平均支出有_相关关系(填“正”或“负”)【答案】13 正【解析】中位数是 13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正相关关系8(2018 西安质检)以下四个命题,其中正确的序号是_ 从匀速传递的产品生产流水线上,质检员每 20 分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近于 1;在线性回归方程 0.2 x12 中,当解释变量 x 每增加一个单位时,预报变量 平均y y 4增加 0.2 个单位;对分类变量 X 与 Y 的随机变量 K2的观测值 k 来说,k 越小, “
8、X 与 Y 有关系”的把握程度越大【答案】【解析】是系统抽样;对于,随机变量 K2的观测值 k 越小,说明两个相关变量有关系的把握程度越小9(2018 长春模拟)在一次考试中,5 名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系)学生的编号 i 1 2 3 4 5数学成绩 x 80 75 70 65 60物理成绩 y 70 66 68 64 62现已知其线性回归方程为 0.36 x ,则根据此线性回归方程估计数学得 90 分的同y a 学的物理成绩为_(四舍五入到整数)【答案】73【解析】 70,x60 65 70 75 805 66,y62 64 66 68 705所
9、以 660.3670 , 40.8,a a 即线性回归方程为 0.36 x40.8.y 当 x90 时, 0.369040.873.273.y 三、解答题10(2018 四川成都一模)某医疗科研项目组对 5 只实验小白鼠体内的 A,B 两项指标数据进行收集和分析,得到的数据如下表:指标 1 号小白鼠 2 号小白鼠 3 号小白鼠 4 号小白鼠 5 号小白鼠A 5 7 6 9 8B 2 2 3 4 4(1)若通过数据分析,得知 A 项指标数据与 B 项指标数据具有线性相关关系试根据上表,求 B 项指标数据 y 关于 A 项指标数据 x 的线性回归方程 x ;y b a (2)现要从这 5 只小白鼠
10、中随机抽取 3 只,求其中至少有一只小白鼠的 B 项指标数据高于 3 的概率5(参 考 公 式 : b ni 1 xi x yi yni 1 xi x 2ni 1xiyi nx yni 1x2i nx2, a y b x)【解】(1)由题意,可得 7, 3,x yiyi110, 255,5i 1x5i 1x2i .b 5i 1xiyi 5x y5i 1x2i 5x2 12 , .a y b x a 12所求线性回归方程为 x .y 12 12(2)设 1 号至 5 号小白鼠依次为 a1, a2, a3, a4, a5,则在这 5 只小白鼠中随机抽取 3只的抽取情况有a1a2a3, a1a2a4
11、, a1a2a5, a1a3a4, a1a3a5, a1a4a5, a2a3a4, a2a3a5, a2a4a5, a3a4a5,共 10 种随机抽取的 3 只小白鼠至少有一只的 B 项指标数据高于 3 的情况有a1a2a4, a1a2a5, a1a3a4, a1a3a5, a1a4a5, a2a3a4, a2a3a5, a2a4a5, a3a4a5,共 9 种,从这 5 只小白鼠中随机抽取 3 只,其中至少有一只的 B 项指标数据高于 3 的概率为.91011(2018 黑龙江大庆质量检测)为了解高校学生平均每天使用手机的时间长短是否与性别有关,某调查小组随机抽取了 25 名男生,10 名女
12、生进行为期一周的跟踪调查,调查结果如表所示:(1)在参与调查的平均每天使用手机不超过 3 小时的 7 名女生中,有 4 人使用国产手机,从这 7 名女生中任意选取 2 人,求至少有 1 人使用国产手机的概率;(2) 根据列联表,是否有 90%的把握认为学生使用手机的时间长短与性别有关(K 2的观测值 k 精确到 0.01)6附:P(K2k 0) 0.400 0.250 0.150 0.100 0.050 0.025k0 0.708 1.323 2.072 2.706 3.841 5.024参考公式: K 2 (n a b cd)n ad bc 2 a c b d a b c d【解】(1)设
13、7 名女生中,使用国产手机的 4 人分别为 a1, a2, a3, a4,使用非国产手机的 3 人为 b1, b2, b3.从 7 人中任选 2 人,共有 21 种情况,分别是a1a2, a1a3, a1a4, a2a3, a2a4, a3a4, b1b2, b1b3, b2b3, a1b1, a1b2, a1b3, a2b1, a2b2, a2b3, a3b1, a3b2, a3b3, a4b1, a4b2, a4b3.其中,事件 A “至少有 1 人使用国产手机”包含 18 种情况, 所以 P(A) ,1821 67所以至少有 1 人使用国产手机的概率为 .67(2)由列联表得,K 2 2.57.35 157 103 218172510 17568由于 2.572.706,所以没有 90%的把握认为学生使用手机的时间长短与性别有关