1、1单元检测十 算法、统计与统计案例(提升卷)考生注意:1本试卷分第卷(选择题)和第卷(非选择题)两部分,共 4 页2答卷前,考生务必用蓝、黑色字迹的钢笔或圆珠笔将自己的姓名、班级、学号填写在相应位置上3本次考试时间 100 分钟,满分 130 分4请在密封线内作答,保持试卷清洁完整第卷(选择题 共 60 分)一、选择题(本题共 12 小题,每小题 5 分,共 60 分在每小题给出的四个选项中,只有一项是符合题目要求的)1( 2018上 海 十 四 校 联 考 )若 x1, x2, x3, , x10的 平 均 数 为 3, 则 3(x1 2), 3(x2 2),3(x3 2), ,3( x10
2、2)的平均数为( )A3B9C18D27答案 A解析 由题意得 x1 x2 x3 x1030,所以 3(x12)3( x22)3( x32)3( x102)3( x1 x2 x3 x10)6030,所以所求平均数 3,故选3x 23010A.2( 2018青 岛 模 拟 )一 个 公 司 有 8名 员 工 , 其 中 6位 员 工 的 月 工 资 分 别 为 5 200,5 300,5 500,6 100,6 500,6 600, 另两位员工数据不清楚,那么 8 位员工月工资的中位数不可能是( )A5800B6000C6200D6400答案 D解析 由题意知,当另外两位员工的工资都小于 520
3、0 时,中位数为(53005500)25400;当另外两位员工的工资都大于 6600 时,中位数为(61006500)26300,所以 8 位员工月工资的中位数的取值区间为5 400,6 300,所以这 8 位员工月工资的中位数不可能是 6400,故选 D.3若 x1, x2, x2019的平均数为 3,标准差为 4,且 yi3( xi2),i1,2,2019,则新数据 y1, y2, y2019的平均数和标准差分别为( )A9,12 B9,36C3,36 D3,12答案 D解析 由平均数和标准差的性质可知,若 x1, x2, x3, xn的平均数为 ,标准差为 s,则xkx1 b, kx2
4、b, kx3 b, kxn b 的平均数为 k b,标准差为| k|s,据此结合题意可x2得 y1, y2, y2019的平均数为3(32)3,标准差为 3412,故选 D.4执行如图所示的程序框图,若输出的结果为 1,则输入 x 的值为( )A2 或1 或 3 B2 或2C3 或1 D3 或2答案 D解析 由2 x31 ,解得 x2 ,因为22 不成立,所以2 是输入的 x 的值;由log3(x22 x)1 ,即 x22 x3,解得 x3 或 x1(舍去)综上, x 的值为2 或 3,故选 D.5(2018济南模拟)中国诗词大会的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写
5、比赛,班里 40 名学生得分数据的茎叶图如图,若规定得分不小于 85 分的学生得到“诗词达人”的称号,小于 85 分且不小于 70 分的学生得到“诗词能手”的称号,其他学生得到“诗词爱号者”的称号,根据该次比赛的成绩按照称号的不同进行分层抽样抽选 10 名学生,则抽选的学生中获得“诗词能手”称号的人数为( )A2B4C5D6答案 B解析 由茎叶图得班里 40 名学生中,获得“诗词达人”称号的有 8 人,获得“诗词能手”称号的有 16 人,获得“诗词爱好者”称号的有 16 人,则由分层抽样的概念得选取的 10 名学生中,获得“诗词能手”称号的人数为 10 4,故选 B.16406.某市某高中从高
6、三年级甲、乙两个班中各选出 7 名学生参加 2018 年全国高中数学联赛,他们取得的成绩(满分 140 分)的茎叶图如图所示,其中甲班学生成绩的中位数是 81,乙班学生成 绩 的 平 均 数 是 86.若 正 实 数 a, b 满 足 a, G, b 成 等 差 数 列 , 且 x, G, y 成 等 比 数 列 , 则3 的 最 小 值 为 ( )1a 4bA. B2C. D949 94答案 C解析 甲 班 学 生 成 绩 的 中 位 数 是 80 x 81, 解 得 x 1.由 茎 叶 图 可 知 乙 班 学 生 的 总 分 为76 803903(02 y136)598 y,又乙班学生成绩
7、的平均数是 86,所以867598 y,解得 y4.若正实数 a, b 满足 a, G, b 成等差数列,且 x, G, y 成等比数列, 则 2G a b, xy G2, 即 有 a b 4, 则 (a b) 9 ,当且仅当1a4b14 (1a 4b)14(1 4 ba 4ab)14(5 2 ba4ab)14 94a , b 时,取等号故选 C.43 837.某校九年级有 400 名学生,随机抽取了 40 名学生,测试 1 分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,用样本估计总体,下列结论正确的是( )A该校九年级学生 1 分钟仰卧起坐的次数的中位数为 25B该
8、校九年级学生 1 分钟仰卧起坐的次数的众数为 24C该校九年级学生 1 分钟仰卧起坐的次数超过 30 的人数约为 80D该校九年级学生 1 分钟仰卧起坐的次数少于 20 的人数约为 8答案 C解析 第一组数据的频率为 0.0250.1,第二组数据的频率为 0.0650.3,第三组数据的频 率 为 0.085 0.4, 所 以 中 位 数 在 第 三 组 内 , 设 中 位 数 为 25 x, 则x0.08 0.5 0.1 0.3 0.1, 所以 x1.25,所以中位数为 26.25,故 A 错误;最高矩形是第三组数据,第三组数据的中间值为 27.5,所以众数为 27.5,故 B 错误;学生 1
9、 分钟仰卧起坐的成绩超过 30 次的频率为 0.0450.2,所以超过 30 次的人数为 4000.280,故 C 正确;学生 1 分钟仰卧起坐的成绩少于 20 次的频率为 0.0250.1,所以 1 分钟仰卧起坐的成绩少于 20 次的人数为 4000.140,故 D 错误故选 C.8某程序框图如图所示,若输出 S3,则判断框中 M 为( )4A k15?答案 B解析 由程序框图可知 S ,11 2 12 3 1k k 1因为 ,1k k 1 k 1 k所以 S 1,2 1 3 2 4 3 k 1 k k 1所以 S 13,解得 k15,即当 k15 时程序退出,k 1故选 B.9某班一次测试
10、成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息可确定被抽测的人数及分数在90,100内的人数分别为( )A20,2B24,4C25,2D25,4答案 C解析 由频率分布直方图可得分数在50,60)内的频率是 0.008100.08,又由茎叶图可得分数在50,60)内的频数是 2,则被抽测的人数为 25.又由频率分布直方图可得分数20.08在90,100内的频率与分数在50,60)内的频率相同,则频数也相同,都是 2,故选 C.10某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用 22 列联表进行独立性检验,经计算 K26.705,则所得到的统计学结论是认为“学生
11、性别与支持该活动没有关系”的把握是( )P(K2 k0) 0.100 0.050 0.025 0.010 0.001k0 2.706 3.841 5.024 6.635 10.8285A.99.9%B99%C1%D0.1%答案 C解析 因为 6.6356.70510.828,所以有 1%的把握认为“学生性别与支持该活动没有关系” ,故选 C.11设某中学的高中女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相关关系,根据一组样本数据( xi, yi)(i1,2,3, n),用最小二乘法近似得到线性回归方程为0.85 x85.71,则下列结论中不正确的是( )y A y 与 x 具有正
12、线性相关关系B回归直线过样本点的中心( , )x yC若该中学某高中女生身高增加 1cm,则其体重约增加 0.85kgD若该中学某高中女生身高为 160cm,则可断定其体重必为 50.29kg答案 D解析 y 与 x 具有正线性相关关系,A 正确;由线性回归方程的性质可知,B 正确;身高每增 加 1 cm, 体 重 约 增 加 0.85 kg, C 正 确 ; 某 女 生 身 高 为 160 cm, 则 其 身 高 约 为 50.29 kg, D 错 误 , 故 选 D.12以下四个结论,正确的是( )质检员从匀速传递的产品生产流水线上,每间隔 10 分钟抽取一件产品进行某项指标检测,这样的抽
13、样是分层抽样;在频率分布直方图中,所有小矩形的面积之和为 1;在线性回归方程 0.2 x12 中,当变量 x 每增加一个单位时,变量 y 一定增加 0.2 个单y 位;对于两个分类变量 X 与 Y,求出其统计量 K2的观测值 k,观测值 k 越大,我们认为“ X 与Y 有关系”的把握程度就越大ABCD答案 D解析 对于,易得这样的抽样为系统抽样,错误;对于,由频率分布直方图的概念易得正确;对于,由线性回归方程的概念易得变量 y 约增加 0.2 个单位,错误;对于,由独立性检验易得正确综上所述,故选 D.第卷(非选择题 共 70 分)二、填空题(本题共 4 小题,每小题 5 分,共 20 分把答
14、案填在题中横线上)13下表是一个容量为 10 的样本数据分组后的频数分布若利用组中值近似计算本组数据平均数 ,则 的值为_.x x数据 12.5,15.5) 15.5,18.5) 18.5,21.5) 21.5,24.5)6频数 2 1 3 4答案 19.7解析 由题意得平均数 19.7.x142 171 203 2342 1 3 414抽样统计甲、乙两名学生的 5 次训练成绩(单位:分),结果如下:学生 第 1 次 第 2 次 第 3 次 第 4 次 第 5 次甲 65 80 70 85 75乙 80 70 75 80 70则成绩较为稳定(方差较小)的那位学生成绩的方差为_答案 20解析 由
15、数据可得甲的平均数是 (6580708575)75,方差为 (6575)15 152(8075) 2(7075) 2(8575) 2(7575) 250,乙的平均数是(8070758070)75,方差为 (8075) 2(7075) 2(7575) 2(8075)15 152(7075) 22050,故成绩较稳定的学生为乙,其方差为 20.15为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的 200 辆汽车的时速,所得数据均在40,80中,其频率分布直方图如图所示,则在抽测的 200 辆汽车中,时速在40,60)内的汽车有_辆答案 80解析 由频率分布直方图可得时速在40,60
16、)内的频率为(0.010.03)100.4,则时速在40,60)内的汽车有 0.420080(辆)16下列命题中,正确的命题是_(写出所有正确命题的序号)回归直线 x 恒过样本点的中心( , ),且至少过一个样本点;y b a x y将一组数据的每个数据都加一个相同的常数后,方差不变;用 R2来刻画回归效果, R2越接近 0,说明回归的效果越好;7用系统抽样法从 160 名学生中抽取容量为 20 的样本,将 160 名学生从 1160 编号,按编号顺序平均分成 20 组(18 号,916 号,153160 号),若第 16 组抽出的号码为126,则第一组中用抽签法确定的号码为 6.答案 解析
17、回归直线 x 恒过样本点的中心( , ),不一定过样本点,错误;将一组数据y b a x y的每个数据都加一个相同的常数后,数据的波动性不变,故方差不变,正确;用 R2来刻画回归效果, R2越接近 1,说明回归的效果越好,错误;中系统抽样方法是正确的故正确的命题有.三、解答题(本题共 4 小题,共 50 分解答应写出文字说明、证明过程或演算步骤)17(12 分)某网站针对“2019 年法定节假日调休安排”提出的 A, B, C 三种放假方案进行了问卷调查,调查结果如下:支持 A 方案 支持 B 方案 支持 C 方案35 岁以下的人数 200 400 80035 岁以上(含 35 岁)的人数 1
18、00 100 400(1)从所有参与调查的人中,用分层抽样的方法抽取 n 个人,已知从支持 A 方案的人中抽取了 6 人,求 n 的值;(2)从支持 B 方案的人中,用分层抽样的方法抽取 5 人,这 5 人中在 35 岁以下的人数是多少?35 岁以上(含 35 岁)的人数是多少?解 (1)由题意知, ,6100 200 n200 400 800 100 100 400解得 n40.(2)这 5 人中,35 岁以下的人数为 4004,35 岁以上(含 35 岁)的人数为5400 1001001.5400 10018(12 分)每年的春节后,某市市政府都会发动公务员参与到植树活动中去为保证树苗的质
19、量,林管部门在植树前会对树苗进行检测,现从甲、乙两种树苗中各抽取了 10 株树苗,量出的高度如下(单位:厘米)甲:37,21,31,20,29,19,32,23,25,33;乙:10,30,47,27,46,34,26,10,44,46.8(1)根据量出的高度,完成茎叶图;(2)根据你填写的茎叶图,对甲、乙两种树苗的高度作比较,写出两个统计结论解 (1)茎叶图如图所示(2)统计结论:甲种树苗的平均高度小于乙种树苗的平均高度;甲种树苗比乙种树苗长得更整齐;甲种树苗高度的中位数为 27,乙种树苗高度的中位数为 32.19(13 分)某机构就是否支持发展共享单车随机调查了 50 人,他们年龄的分布及
20、支持发展共享单车的人数统计如下表:年龄 15,20) 20,25) 25,30) 30,35) 35,40) 40,45受访人数 5 6 15 9 10 5支持发展共享单车人数4 5 12 9 7 3由以上统计数据填写下面的 22 列联表,并判断能否在犯错误的概率不超过 0.1 的前提下,认为年龄与是否支持发展共享单车有关系.年龄低于 35 岁 年龄不低于 35 岁 合计支持不支持合计参考数据:P(K2 k0) 0.50 0.40 0.25 0.15 0.10 0.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357
21、.87910.828参考公式: K2 ,其中 n a b c d.nad bc2a bc da cb d解 根据所给数据得到如下 22 列联表:9年龄低于 35 岁 年龄不低于 35 岁 合计支持 30 10 40不支持 5 5 10合计 35 15 50根据 22 列联表中的数据,得到 K2的观测值为k 2.382.706.50305 105230 105 530 510 5不能在犯错误的概率不超过 0.1 的前提下,认为年龄与是否支持发展共享单车有关系20(13 分)某农科所对冬季昼夜温差 x()与某反季节新品种大豆种子的发芽数 y(颗)之间的关系进行了分析研究,他们分别记录了 12 月
22、1 日至 12 月 5 日每天的昼夜温差与实验室每天每 100 颗种子的发芽数,得到的数据如下表所示:12 月 1 日 12 月 2 日 12 月 3 日 12 月 4 日 12 月 5 日x() 10 11 13 12 8y(颗) 23 25 30 26 16该农科所确定的研究方案是:先从这 5 组数据中选取 3 组求线性回归方程,剩下的 2 组数据用于线性回归方程的检验(1)请根据 12 月 2 日至 12 月 4 日的数据,求出 y 关于 x 的线性回归方程 x ;y b a (2)若由线性回归方程得到的估计数据与所选的验证数据的误差不超过 2 颗,则认为得到的线性回归方程是可靠的,试问(1)中所得到的线性回归方程是否可靠?如果可靠,请预测温差为 14时种子的发芽数;如果不可靠,请说明理由解 (1)由已知得 12,x11 13 123 27,y25 30 263则 , 3.b 52 a y b x所以 y 关于 x 的线性回归方程为 x3.y 52(2)当 x10 时, 10322,|2223|2;y 52当 x8 时, 8317,|1716|2.y 52所以(1)中所得到的线性回归方程是可靠的10当 x14 时,有 14332,y 52即预测当温差为 14时,每天每 100 颗种子的发芽数约为 32 颗