(新课改省份专用)2020版高考数学一轮复习第九章统计与统计案例第一节统计讲义(含解析).doc
《(新课改省份专用)2020版高考数学一轮复习第九章统计与统计案例第一节统计讲义(含解析).doc》由会员分享,可在线阅读,更多相关《(新课改省份专用)2020版高考数学一轮复习第九章统计与统计案例第一节统计讲义(含解析).doc(16页珍藏版)》请在麦多课文档分享上搜索。
1、1第一节 统计突破点一 随机抽样基 本 知 识 1简单随机抽样(1)定义:设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本( n N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样(2)最常用的简单随机抽样的方法:抽签法和随机数法2系统抽样在抽样时,将总体分成均衡的几个部分,然后按照事先确定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样(也称为机械抽样)3分层抽样在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样4
2、三种抽样方法的比较类别 共同点 各自特点 相互联系 适用范围简单随机抽样 从总体中逐个抽取是后两种方法的基础总体中的个数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分中抽取在起始部分抽样时采用简单随机抽样元素个数很多且均衡的总体抽样分层抽样均为不放回抽样,且抽样过程中每个个体被抽取的机会相等 将总体分成几层,分层按比例进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成基 本 能 力 一、判断题(对的打“” ,错的打“”)(1)简单随机抽样是一种不放回抽样( )(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关( )(3)系统抽样在起始部分抽样时采用简单随机抽
3、样( )2(4)要从 1 002 个学生中用系统抽样的方法选取一个容量为 20 的样本,需要剔除 2 个学生,这样对被剔除者不公平( )(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关( )答案:(1) (2) (3) (4) (5)二、填空题1在“世界读书日”前夕,为了了解某地 5 000 名居民某天的阅读时间,从中抽取了200 名居民的阅读时间进行统计分析在这个问题中,5 000 名居民的阅读时间的全体是_答案:总体2某班共有 52 人,现根据学生的学号,用系统抽样的方法,抽取一个容量为 4 的样本,已知 3 号,29 号,42 号学生在样本中,那么样本中还有一个学生的学号是_答案
4、:163甲、乙两套设备生产的同类型产品共 4 800 件,采用分层抽样的方法从中抽取一个容量为 80 的样本进行质量检测若样本中有 50 件产品由甲设备生产,则乙设备生产的产品总数为_件答案:1 8001系统抽样的最基本特征是“等距性” ,一般地,每组内所抽取的号码依据第一组抽取的号码和组距确定每组抽取的号码依次构成一个以第一组抽取的号码 m 为首项、组距d 为公差的等差数列 an,第 k 组抽取的号码为 ak m( k1) d.2分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,抽样比 .样 本 容 量总 体 容 量 各 层 样 本 数 量各 层 个 体 数 量典 例 感 悟 1
5、(2018河北石家庄二中三模)某校为了解 1 000 名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取 40 名同学进行检查,将学生从 11 000 进行编号,现已知第 18 组抽取的号码为 443,则第一组用简单随机抽样抽取的号码为( )A16 B17C18 D19解析:选 C 从 1 000 名学生中抽取一个容量为 40 的样本,系统抽样的分段间隔为 25,设第一组随机抽取的号码为 x,则抽取的第 18 组的号码为1 00040x1725443, x18.故选 C.2(2019吉林通化模拟)分层抽样是将总体分成互不交叉的层,然后按照一定的比例,3从各层独立地抽取一定数量的个体,组
6、成一个样本的抽样方法在九章算术第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱欲以钱多少衰出之,问各几何?”其译文为:今有甲持 560 钱,乙持 350 钱,丙持 180 钱,甲、乙、丙三人一起出关,关税共 100 钱,要按照各人带钱多少的比例进行交税,问三人各应付多少税?则下列说法错误的是( )A甲应付 51 钱41109B乙应付 32 钱24109C丙应付 16 钱56109D三者中甲付的钱最多,丙付的钱最少解析:选 B 依题意由分层抽样可知,100(560350180) ,10109则甲应付: 56051 (钱);10109 411
7、09乙应付: 35032 (钱);10109 12109丙应付: 18016 (钱)10109 56109方 法 技 巧 系统抽样和分层抽样中的计算(1)系统抽样总体容量为 N,样本容量为 n,则要将总体均分成 n 组,每组 个(有零头时要先去掉)Nn若第一组抽到编号为 k 的个体,则以后各组中抽取的个体编号依次为k , k( n1) .Nn Nn(2)分层抽样按比例抽样,计算的主要依据是:各层抽取的数量之比总体中各层的数量之比针 对 训 练 1(2019唐山模拟)用简单随机抽样的方法从含有 100 个个体的总体中抽取一个容量为 5 的样本,则个体 M 被抽到的概率为( )A. B.1100
8、199C. D.120 1504解析:选 C 一个总体含有 100 个个体,每个个体被抽到的概率为 ,用简单随机抽1100样方法从该总体中抽取容量为 5 的样本,则每个个体被抽到的概率为 5 .1100 1202(2019江西八校联考)从编号为 001,002,500 的 500 个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为 007,032,则样本中最大的编号应该为( )A480 B481C482 D483解析:选 C 根据系统抽样的定义可知样本的编号成等差数列,令 a17, a232,则d25,所以 725( n1)500,所以 n20,最大编号为 7251948
9、2.3(2019陕西部分学校摸底检测)某单位有老年人 27 人,中年人 54 人,青年人 81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为 42 的样本,则应分别抽取老年人、中年人、青年人的人数是( )A7,11,18 B6,12,18C6,13,17 D7,14,21解析:选 D 因为该单位共有 275481162(人),样本容量为 42,所以应当按 的比例分别从老年人、中年人、青年人中抽取样本,且应分别抽取的人数是42162 7277,14,21.故选 D.4(2018全国卷)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异为了解客户的评价,该公司准备进行抽样
10、调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是_解析:因为客户数量大,且不同年龄段客户对其服务的评价有较大差异,所以最合适的抽样方法是分层抽样答案:分层抽样突破点二 用样本估计总体基 本 知 识 1频率分布直方图和茎叶图(1)作频率分布直方图的步骤求极差(即一组数据中最大值与最小值的差);决定组距与组数;将数据分组; 列频率分布表;画频率分布直方图(2)频率分布折线图和总体密度曲线5频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图总体密度曲线随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲
11、线,统计中称这条光滑曲线为总体密度曲线(3)茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便2众数、中位数、平均数数字特征 定义与求法 优点与缺点众数 一组数据中重复出现次数最多的数众数体现了样本数据的最大集中点,不受极端值的影响但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有 n 个数据 x1, x2, xn,那么这 n 个数的平均数
12、x x1 x2 xnn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低3.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用 s 表示, s .1n x1 x 2 x2 x 2 xn x 2(2)方差:标准差的平方 s2 (x1 )2( x2 )2( xn )2,其中1n x x x xi(i1,2,3, n)是样本数据, n 是样本容量, 是样本平均数x (3)方差与标准差相比,都是衡量样本数据离散程度的统计量,但方差因为对标准差进行了平方运算,夸大了样本的偏差程度4平均数、方差公式的推广6若
13、数据 x1, x2, xn的平均数为 ,方差为 s2,则数据x mx1 a, mx2 a, mxn a 的平均数为 m a,方差为 m2s2.x 基 本 能 力 一、判断题(对的打“” ,错的打“”)(1)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数( )(2)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的( )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次( )(5)平均数、众数与中位数从不同的角度描述了一组数据的集中趋
14、势( )(6)一组数据的众数可以是一个或几个,中位数也具有相同的结论( )答案:(1) (2) (3) (4) (5) (6)二、填空题1在样本频率分布直方图中,共有 9 个小长方形若中间一个小长方形的面积等于其他 8 个小长方形面积之和的 ,且样本容量为 140,则中间一组的频数为_25答案:402某学校组织学生参加数学测试,成绩(单位:分)的频率分布直方图如图所示,数据的分组依次为20,40),40,60),60,80),80,100,若低于 60 分的人数是 15,则该班的学生人数是_答案:503如图是某班 8 位学生诗词比赛得分的茎叶图,那么这 8 位学生得分的众数和中位数分别为_答案
15、:93,924已知一组正数 x1, x2, x3的方差 s2 (x x x 12),则数据13 21 2 23x11, x21, x31 的平均数为_7答案:3全 析 考 法 考法一 折线图、饼图的应用 例 1 (1)(2018全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( )A新农村建设后,种植收入减少B新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半(2
16、)(2019昆明市高三质检)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标搜索指数越大,表示网民搜索该关键词的次数越多,对该关键词相关的信息关注度也越高如图是 2018 年 9 月到 2019 年 2 月这半年来,某个关键词的搜索指数变化的统计图根据该统计图判断,下列结论正确的是( )A这半年来,网民对该关键词相关的信息关注度呈周期性变化B这半年来,网民对该关键词相关的信息关注度不断减弱C从该关键词的搜索指数来看,2018 年 10 月的方差小于 11 月的方差D从该关键词的搜索指数来看,2018 年 12 月的平均值大于 2019 年 1 月的平均值解析 (1)
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 新课 省份 专用 2020 高考 数学 一轮 复习 第九 统计 案例 第一节 讲义 解析 DOC
