1、专题9 概率与统计,第2讲 综合大题部分,考情考向分析 1与概率结合、用频率估计总体 2与概率结合,进行回归分析、独立性检验,考点一 用频率估计总体习近平同志提出:绿水青山就是金山银山截至2017年8月,第四批中央环境保护督察组全部实现督察进驻,实现对全国各省(区、市)环保督察全覆盖,环保督察力度空前某市创业园区新引进一家生产环保产品的公司,已知该公司每售出1件某环保产品得到的利润为3 000元,未售出的产品每件亏损1 000元根据统计资料,该种环保产品的市场需求量的频率分布直方图如图所示,其中a,b,c成等差数列,a,b,ac成等比数列已知该产品的月产量为160件,用x(单位:个,100x2
2、00)表示该市一月内的市场需求量,y(单位:元)表示该公司生产该产品的月利润,(1)求a,b,c的值; (2)将y表示为x的函数; (3)根据频率分布直方图估计月利润y不少于40万元的概率,解析:(1)由频率分布直方图可得,组距为20. 所以(a0.007 5b0.012 5c)201, 所以abc0.030 0. 因为a,b,c成等差数列,所以ac2b.故c2ba20.010 00.005 00.015 0.,(2)因为公司每售出1件该产品获利3 000元,未售出的产品每件亏损1 000元, 所以当x100,160时,y3 000x1 000(160x)4 000x160 000; 当x(1
3、60,200时,y1603 000480 000.(3)由月利润不少于40万元,得4 000x160 000400 000,所以x140. 由频率分布直方图知x140的频率为(0.005 00.010 0)200.3, 所以x140的频率为10.30.7,月利润y不少于40万元的概率为0.7.,频率分布直方图的解题要点,考点二 回归分析某农科所对冬季昼夜温差与某反季节新品种大豆发芽数之间的关系进行研究,他们分别记录了12月1日至12月5日每天的昼夜温差与实验室每天100颗种子中的发芽数,得到如下表格:该农科所确定的研究方案是:先从这5组数据中选取2组数据,然后用剩下的3组数据求线性回归方程,再
4、用被选取的2组数据进行检验,(1)求发芽数的平均数与方差; (2)求选取的2组数据恰好是不相邻2天的数据的概率;,(2)设“选取不相邻2天的数据”为事件A,从5组数据中选取2组数据共有:(1,2), (1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5),共10种 A包含的有6种,由古典概型得,(3)由12月2日至12月4日的数据得,,根据数据描散点图,若是线性相关,通过求回归直线方程,进行回归分析 若是非线性关系,而是其它曲线关系,利用换元法,先求回归直线方程,再求其它 曲线方程,进行回归分析,此类题的关键是计算,考点三 独立性检验近年来我
5、国电子商务行业迎来了发展的新机遇.2017年“双11”期间,某购物平台的交易额突破1 682亿元人民币与此同时,相关管理部门推出了针对电商的商品和服务的评价体系现从评价系统中选出200次成功交易,并对其评价进行统计,统计结果显示这200次交易中买家对商品的满意率为0.6,对服务的满意率为0.75,其中对商品和服务都满意的交易有80次(1)完成下列关于商品和服务评价的22列联表,再判断能否在犯错误的概率不超过0.1%的前提下,认为买家对商品满意与对服务满意有关,(2)若针对商品的满意率,采用分层抽样的方法从这200次交易中选出5次交易,并从 中选择2次交易进行客户回访,求被选中的交易中只有1次是
6、满意的概率 附:,解析:(1)由题意填写关于商品和服务评价的22列联表如下:假设买家对商品满意与对服务满意无关,(先假设两变量无关) 由列联表中数据可得K2的观测值故能在犯错误的概率不超过0.1%的前提下,认为买家对商品满意与对服务满意有 关,(2)若针对商品的满意率,采用分层抽样的方法从这200次交易中选择5次交易,则满意的交易次数为3,不满意的次数为2.设满意的交易为A,B,C,不满意的交易为a,b. 从5次交易中选择2次交易,不同的选法有A,B,A,C,A,a,A,b,B,C,B,a,B,b,C,a,C,b,a,b,共10种,K2是用来判断两个分类变量X和Y是否有关系的统计量若K210.
7、828,则可在犯错误的概率不超过0.1%的前提下认为“X与Y有关系”;若K27.879,则可在犯错误的概率不超过0.5%的前提下认为“X与Y有关系”其关键是列清22列联表及明确数字关系,1混淆回归直线的斜率和截距致误 典例1 随着移动互联网的快速发展,基于互联网的共享单车应运而生某市场研究人员为了了解共享单车运营公司M的经营状况,对该公司2016年10月至2017年3月这六个月内的市场占有率进行了统计,并绘制了相应的折线图(如图所示),(1)由折线图可以看出,可用线性回归模型拟合月度市场占有率y与月份代码x之间的关系求y关于x的线性回归方程,并预测M公司2017年4月份(x7)的市场占有率;
8、(2)为进一步扩大市场,M公司拟再采购一批单车现有采购成本分别为1 000元/辆和1 200元/辆的A,B两款车型可供选择,按规定每辆单车最多使用4年,但由于多种原因(如骑行频率)会导致车辆报废年限各不相同考虑到公司运营的经济效益,该公司决定先对两款车型的单车(各100辆)进行科学模拟测试,得到两款单车的使用寿命频数表如下:,经测算,平均每辆单车每年可以带来收入500元不考虑除采购成本之外的其他成本,假设每辆单车的使用寿命都是整年,且以频率作为每辆单车使用寿命的概率如果你是M公司的负责人,以每辆单车产生利润的平均值为决策依据,你会选择采购哪款车型? 解析 (1)由折线图中所给的数据,,(2)由
9、频率估计概率,每辆A款车可使用1年、2年、3年和4年的概率分别为 0.2,0.35,0.35和0.1,,2不理解独立性检验的思想而致错 典例2 (2018抚州临川一中期中测试)某媒体为调查喜欢节目A是否与观众性别有关,随机抽取了30名男性和30名女性观众,抽查结果用等高条形图表示,如图所示,(1)根据该等高条形图,完成下列22列联表,并用独立性检验的方法分析,能否在犯错误的概率不超过0.05的前提下认为喜欢节目A与观众性别有关?(2)从男性观众中按喜欢节目A与否,用分层抽样的方法抽取5名进行进一步调查从这5名中任选2名,求恰有1名喜欢节目A和1名不喜欢节目A的概率 附:,解析 (1)由题意得2
10、2列联表如下:根据列联表中的数据,得到K2的观测值所以能在犯错误的概率不超过0.05的前提下认为喜欢节目A与观众性别有关,(2)设事件M为“所抽取的观众中恰有1名喜欢节目A和1名不喜欢节目A”被抽取的喜欢节目A的4名男性观众分别记为a,b,c,d,不喜欢节目A的1名男性观众记为B,,则从5名中任选2名的所有可能的结果为:a,b,a,c,a,d,a,B,b,c,b,d,b,B,c,d,c,B,d,B,共10种, 其中恰有1名喜欢节目A和1名不喜欢节目A的有:a,B,b,B,c,B,d,B,共4种,易错防范 理解P(K2k0)的含义,对两个分类变量X与Y是否有关的联系,3对“至少”“至多”的含义理
11、解不透 典例3 2017年双十一购物狂欢节后,快递业务量猛增甲、乙两位快递员从11月12日至18日间每天送件数量的茎叶图如图所示(1)根据茎叶图判断哪位快递员的平均送件数量较多(写出结论即可);(2)求甲的送件数量的平均数;(3)从11月12日到18日这7天中随机抽取2天,求至少有1天乙的送件数量超过甲的平均送件数量的概率,解析 (1)由茎叶图知乙的平均送件数量较多 (2)甲的送件数量的平均数为(3)设事件M为“从11月12日到18日这7天中随机抽取2天,至少有1天乙的送件数量超 过甲的平均送件数量”,(注意题眼“至少有1天”)由(2)知甲的平均送件数量为254. 由茎叶图知11月12日到18
12、日这7天中,乙的送件数量超过254的有5天,分别记为a, b,c,d,e,乙的送件数量低于254的有2天,分别记为A,B,,所以从11月12日到18日这7天中随机抽取2天,可能出现的情况有: a,b,a,c,a,d,a,e,a,A,a,B, b,c,b,d,b,e,b,A,b,B, c,d,c,e,c,A,c,B, d,e,d,A,d,B, e,A,e,B, A,B,共21种,(1)破解茎叶图与统计、概率相交汇题的关键:一是观察茎叶图,能读出相关的数据,并能用数据进行相关计算;二是熟记公式,会利用平均数、方差、标准差、中位数等公式,求相关的数据;三是会利用对立事件与古典概型的概率计算公式,求出概率 (2)解此类题时,对于含有“至少”“至多”等字眼的事件,常先求出其对立事件的概率,再求出所求事件的概率,这可加快解题速度,