1、专题9 概率与统计,第2讲 综合大题部分,考情考向分析 1结合概率,求随机变量的分布列、期望与方差 2结合统计,进行回归分析,独立性检验,考点一 定义法求解随机变量的分布列、期望、方差,(1)求该部门恰好有一次抽中动物饲料这一产品的概率; (2)设X表示三次抽查所记的数字之和,求随机变量X的分布列和数学期望 解析:记“恰好抽中一次动物饲料这一产品”为事件A,“在甲企业抽中”为事件B,“ 在乙企业第一次抽中”为事件C,“在乙企业第二次抽中”为事件D,,(2)根据题意,X的所有可能取值为0,1,2,3,4,5.,破解此类离散型随机变量的分布列与数学期望问题的思维切入口是:先利用两个计数原理,排列、
2、组合知识,以及古典概型的概率公式求基本事件的概率;再依题意判断随机变量的所有可能取值,求出随机变量X取每个值时的概率,即可得随机变量X的分布列;最后利用随机变量X的数学期望的定义进行计算,考点二 超几何分布的期望、方差(2018福州市高三质检)质检过后,某校为了解理科班学生的数学、物理学习情况,利用随机数表法从全年级600名理科生的成绩中抽取100名学生的成绩进行统计分析,已知学生考号的后三位分别为000,001,002,599.(1)若从随机数表的第4行第7列的数开始向右读,请依次写出抽取的前7人的后三位考号;(2)如果第(1)问中随机抽取到的7名同学的数学、物理成绩(单位:分)依次对应如下
3、表:,从这7名同学中随机抽取3名同学,记这3名同学中数学和物理成绩均为优秀的人数为,求的分布列和数学期望(规定成绩不低于120分为优秀) 附:(下面是摘自随机数表的第3行到第5行) 16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10 12 56 85 99 26 96 96 68 27 31 05 03 72 93 15 57 12 10 14 21 88 26 49 81 76 55 59 56 35 64 38 54 82 46 22 31 62 43 09 90 06 18 44 32 53
4、 23 83 01 30 30 解析:(1)抽出的前7人的后三位考号分别为:310,503,315,571,210,142,188. (2)的所有可能取值为0,1,2,3.依题意知,服从超几何分布H(7,3,3),,考点三 二项分布的期望、方差(2018高考全国卷)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验设每件产品为不合格品的概率都为p(0p1),且各件产品是否为不合格品相互独立(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p
5、)的最大值点p0;(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用,若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX; 以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验? 解析:(1)20件产品中恰有2件不合格品的概率为令f(p)0,得p0.1. 当p(0,0.1)时,f(p)0; 当p(0.1,1)时,f(p)0. 所以f(p)的最大值点为p00.1.,(2)由(1)知,p0.1. 令Y表示余下的180件产
6、品中的不合格品件数,依题意知YB(180,0.1),X202 25Y, 即X4025Y. 所以EXE(4025Y)4025EY490. 若对余下的产品作检验,则这一箱产品所需要的检验费用为400元 由于EX400,故应该对余下的产品作检验,考点四 用频率估计总体某市为了解“防震减灾”教育活动的成效,对全市公务员进行一次“防震减灾”知识测试,根据测试成绩评定“合格”“不合格”两个等级,同时对相应等级进行量化:“合格”记5分,“不合格”记0分,现随机抽取部分公务员的答卷,统计结果如下,对应的频率分布直方图如图所示.,(1)求x,y,c的值; (2)用分层抽样的方法,从评定等级为“合格”和“不合格”
7、的公务员中选取10人进行座 谈,现再从这10人中任选4人,记所选4人的量化总分为,求的数学期望E();,解析:(1)由频率分布直方图可知,得分在20,40)的频率为0.005200.1,由频率分布直方图可知,得分在80,100的频率为0.01200.2, 所以y1200.224, 又12xy48120,所以x36.,(2)因为(12x)(48y)487223, 所以抽取的10人中“不合格”的有4人,“合格”的有6人 的所有可能取值为20,15,10,5,0,,故我们认为该市的“防震减灾”教育活动是有效的,不需要调整“防震减灾”教育方 案,考点五 回归分析(2018高考全国卷)如图是某地区200
8、0年至2016年环境基础设施投资额y(单位:亿元)的折线图,(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由,(2)利用模型得到的预测值更可靠理由如下:,()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型看到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠 (以上给出了2种理由,考生答出其中任意一种或其他合理理由均可),求线性回归方程、预报变量的值,计算残差等求解此类题的关键点如下: (1)作图,根据所给样本数据画出散点图,判断两变量之
9、间是否呈线性相关关系若 呈非线性相关关系,则可通过恰当变换转化成线性相关关系,考点六 独立性检验近年来我国电子商务行业迎来了发展的新机遇.2017年“双11”期间,某购物平台的交易额突破1 682亿元人民币,与此同时,相关管理部门推出了针对电商的商品和服务的评价体系现从评价系统中选出200次成功交易,并对其评价进行统计,统计结果显示这200次交易中买家对商品的满意率为0.6,对服务的满意率为0.75,其中对商品和服务都满意的交易有80次(1)完成下列关于商品和服务评价的22列联表,再判断能否在犯错误的概率不超过0.1%的前提下,认为买家对商品满意与对服务满意有关.,(2)若将频率视为概率,某人
10、在该购物平台上进行了3次交易,设其对商品和服务都 满意的次数为随机变量X: 求X的分布列; 求X的数学期望和方差 附:,解析:(1)由题意填写关于商品和服务评价的22列联表如下:假设买家对商品满意与对服务满意无关,(先假设两变量无关) 由列联表中数据可得K2的观测值故能在犯错误的概率不超过0.1%的前提下,认为买家对商品满意与对服务满意有 关,故X的分布列为,(1)买家对商品的满意率为0.6,则买家对商品满意的交易有120次,因此买家对商品满意但对服务不满意的交易有40次,从而买家对服务满意但对商品不满意的交易有70次,填写22列联表,然后将表中数据代入K2公式求出观测值,比较临界值表中的数据
11、得结论,1用频率分布直方图解题时误把纵轴当作频率 典例1 超市为了了解某分店的销售情况,在该分店的电脑小票中随机抽取200张进行统计,将小票上的消费金额(单位:元)分成6组,分别是0,100),100,200),200,300),300,400),400,500),500,600,制成如图所示的频率分布直方图(假设抽到的消费金额均在0,600内),(1)求消费金额在300,600内的小票张数; (2)为做好2018“双十二”促销活动,该分店设计了两种不同的促销方案 方案一:全场商品打八五折, 方案二:全场购物满100元减20元,满300元减80元,满500元减120元,以上减免只 取最高优惠,
12、不重复减免 利用频率分布直方图中的信息,分析哪种方案优惠力度更大,并说明理由 解析 (1)由频率分布直方图可知,消费金额在300,600内的频率为0.003 0100 0.001 01000.000 51000.45. 所以消费金额在300,600内的小票张数为0.4520090.,(2)由频率分布直方图可知,各组频率依次为0.1,0.2,0.25,0.3,0.1,0.05. 若采用方案一,则购物的平均费用为 085(500.11500.22500.253500.34500.15500.05) 0.85275233.75(元) 若采用方案二,则购物的平均费用为 500.1(15020)0.2(
13、25020)0.25(35080)0.3(45080)0.1(550 120)0.05228(元) 因为233.75228,所以方案二的优惠力度更大,2混淆回归直线的斜率和截距致误 典例2 随着移动互联网的快速发展,基于互联网的共享单车应运而生某市场研究人员为了了解共享单车运营公司M的经营状况,对该公司2016年10月至2017年3月这六个月内的市场占有率进行了统计,并绘制了相应的折线图(如图所示),(1)由折线图可以看出,可用线性回归模型拟合月度市场占有率y与月份代码x之间的关系求y关于x的线性回归方程,并预测M公司2017年4月份(x7)的市场占有率; (2)为进一步扩大市场,M公司拟再采
14、购一批单车现有采购成本分别为1 000元/辆和1 200元/辆的A,B两款车型可供选择,按规定每辆单车最多使用4年,但由于多种原因(如骑行频率)会导致车辆报废年限各不相同考虑到公司运营的经济效益,该公司决定先对两款车型的单车(各100辆)进行科学模拟测试,得到两款单车的使用寿命频数表如下:,经测算,平均每辆单车每年可以带来收入500元不考虑除采购成本之外的其他成本,假设每辆单车的使用寿命都是整年,且以频率作为每辆单车使用寿命的概率如果你是M公司的负责人,以每辆单车产生利润的平均值为决策依据,你会选择采购哪款车型? 解析 (1)由折线图中所给的数据,,故预计M公司2017年4月份的市场占有率为2
15、3%.,(2)由频率估计概率,每辆A款车可使用1年、2年、3年和4年的概率分别为 0.2,0.35,0.35和0.1,由频率估计概率,每辆B款车可使用1年、2年、3年和4年的概率分别为0.1,0.3,0.4和 0.2,,3不理解独立性检验的思想致误 典例3 2018年6月9日11日,上合组织峰会在山东青岛开幕为了解哪些人更关注上合组织会议,某机构随机抽取了年龄在2075岁之间的100人进行调查,经统计“青年”与“中老年”的人数之比为911.(1)根据已知条件完成下面的22列联表,并判断能否有99%的把握认为关注国际教育信息化会议与年龄有关;,(2)现从抽取的“青年”中采用分层抽样的方法选取9人
16、进行问卷调查,在这9人中再选取3人进行面对面询问,记选取的3人中关注上合组织会议的人数为X,求X的分布列及数学期望 附:,补全22列联表如下:,因为P(K26.635)0.010,9.0916.635, 所以有99%的把握认为关注国际教育信息化会议与年龄有关 (2)根据题意知选出的9人中关注该会议的人数为3,不关注该会议的人数为6,在这9人中再选取3人进行面对面询问,则X的所有可能取值为0,1,2,3,,所以X的分布列为,易错防范 K2是用来判断两个分类变量X和Y是否有关系的统计量若K210.828,则可在犯错误的概率不超过0.1%的前提下认为“X与Y有关系”;若K27.879,则可在犯错误的
17、概率不超过0.5%的前提下认为“X与Y有关系”,4离散型随机变量取值求错 典例4 (2018张掖模拟)一个不透明的袋子中装有4个形状、大小、质地相同的小球,分别标有不同的数字2,3,4,x.现从袋中随机摸出2个球,并计算摸出的这2个球上的数字之和,记录后将小球放回袋中搅匀,进行重复试验,记事件A为“数字之和为7”试验数据如下表所示:,(1)根据上表数据,可知若试验继续下去,则出现“数字之和为7”的频率将稳定在它的概率附近,试估计事件A的概率,并求x的值; (2)在(1)的条件下,设定一种游戏规则:每次摸出2个球,若这2个球上的数字之和为7,则可获得奖金7元,否则需交5元某人摸球3次,设其获利金
18、额为(单位:元),求随机变量的所有可能取值,并求出的数学期望和方差,所以342x,解得x5. (2)设表示3次摸球中事件A发生的次数,则的所有可能取值为0,1,2,3.(注意取 值不重不漏) 因为75(3)1215, 所以的所有可能取值为15,3,9,21.(注意随机变量与函数的本质区别),所以E()12E()153,D()122D()96.(利用随机变量的性质求 的数学期望和方差),易错防范 (1)求离散型随机变量的取值的关键:细读题目,明晰题意,关注其分类的“度”的选择,从而顺利得出离散型随机变量的所有可能取值,注意做到不重不漏 (2)注意离散型随机变量与函数是两个概念函数研究的是确定性的现象,它可在实数轴上取值,取值是可确定的离散型随机变量研究的是随机现象,它从由全部试验的结果组成的集合中取值,它的取值是不能预知的,但有一定的概率,