1、1第 4 章 点数统计案例1随机对照试验随机对照试验的试验组由随机选出的对象构成,试验组的成员要接受某种特殊的待遇或治疗等,而对照组由那些没有接受这种特殊待遇的对象构成,一个好的试验设计都应当有一个试验组和一个对照组2事件的独立性如果事件 A1, A2, An是相互独立的,则 P(A1 A2 An) P(A1)P(A2)P(A3)P(An)3两个重要参数(1)随机变量 2:随机变量 2是用来判断两个因素在多大程度上相关的变量独立性分析即计算 2的观测值,从而得到两个因素在多大程度上相关(2)相关系数:相关系数是用来刻画两个因素(变量)之间线性相关程度强弱关系的;其值的绝对值越大,其相关性就越强
2、4一元线性回归方程对于一组具有线性相关关系的数据( x1, y1),( x2, y2),( xn, yn),其线性回归方程为:y bx a,其中 b , a b .sxys2x y x事件的独立性例 1 甲、乙、丙三人参加了一家公司的招聘面试,面试合格者可正式签约甲表示只要面试合格就签约乙、丙则约定:两人面试都合格就一同签约,否则两人都不签约设每人面试合格的概率都是 ,且面试是否合格互不影响求:12(1)至少有 1 人面试合格的概率;(2)没有人签约的概率解 用 A, B, C 分别表示事件甲、乙、丙面试合格2由题意知 A, B, C 相互独立,且 P(A) P(B) P(C) .12(1)至
3、少有 1 人面试合格的概率是1 P( )1 P( )P( )P( )1 3 .ABC A B C (12) 78(2)没有人签约的概率为P( B ) P( C) P( )A C AB ABC P( )P(B)P( ) P( )P( )P(C) P( )P( )P( )A C A B A B C 3 3 3 .(12) (12) (12) 38独立事件概率的求法:(1)在求概率问题中,经常遇到“恰有” 、 “至少” 、 “至多”等术语,在此一定要深刻理解其含义,分清它的各种情况,以免计算错误(2)对于含有“至少” 、 “至多”的概率问题,我们通常转化为求其对立事件的概率,即利用公式 P(A)1
4、P( )达到求解的目的A(3)如果事件 A1, A2, An相互独立,对于公式 P(A1A2An) P(A1)P(A2)P(An)中任意多个事件 Ai换成其对立事件后等式仍成立1某项选拔共有四轮考核,每轮设有一个问题,能正确回答者进入下一轮考核,否则即被淘汰已知某选手能正确回答第一、二、三、四轮的问题的概率分别为0.6,0.4,0.5,0.2.已知各轮问题能否正确回答互不影响(1)求该选手被淘汰的概率;(2)求该选手在选拔中至少回答了 2 个问题后最终被淘汰的概率解:记“该选手能正确回答第 i 轮的问题”为事件 Ai(i1,2,3,4),则 P(A1)0.6, P(A2)0.4, P(A3)0
5、.5, P(A4)0.2.(1)法一:该选手被淘汰的概率:P P( 1 A1 2 A1A2 3 A1A2A3 4)A A A A P( 1) P(A1)P( 2) P(A1)P(A2)P( 3)A A AP(A1)P(A2)P(A3)P( 4)A0.40.60.60.60.40.50.60.40.50.80.976.法二: P1 P(A1A2A3A4)1 P(A1)P(A2)P(A3)P(A4)10.60.40.50.210.0240.976.(2)法一: P P(A1 2 A1A2 3 A1A2A3 4) P(A1)P( 2) P(A1)P(A2)P( 3) P(A1)A A A A A3P
6、(A2)P(A3)P( 4)0.60.60.60.40.50.60.40.50.80.576.A法二: P1 P( 1) P(A1A2A3A4)1(10.6)0.60.40.50.20.576.A独立性分析例 2 某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的 55 名学生,得到数据如下表:喜欢“应用统计”课程 不喜欢“应用统计”课程 总计男生 20 5 25女生 10 20 30总计 30 25 55判断是否有 99.5%的把握认为喜欢“应用统计”课程与性别有关?解 由表中数据,得 2 11.9787.879,55 2020 105 230252530所以有 99.
7、5%的把握认为喜欢“应用统计”课程与性别有关独立性分析是对两个因素间是否存在相关关系的一种案例分析方法利用假设检验求随机变量 2的值能更精确地判断两个分类变量间的相关关系2在一次天气恶劣的飞机航程中,有关人员调查了男女乘客在飞机上晕机的情况:男乘客晕机的有 24 人,不晕机的有 31 人;女乘客晕机的有 8 人,不晕机的有 26 人请你根据所给数据判定:能否有 90%的把握认为在天气恶劣的飞机航程中,男乘客比女乘客更容易晕机?(如果 22.706 就有 90%的把握认为有关)解:根据题意,列出 22 列联表如下:晕机 不晕机 总计男乘客 24 31 55女乘客 8 26 34总计 32 57
8、89由列联表中的数据,得 2 3.6892.706,89 2426 318 255343257因此,能以 90%的把握认为在天气恶劣的飞机航程中,男乘客比女乘客更容易晕机.线性回归分析例 3 (全国卷)为了监控某种零件的一条生产线的生产过程,检验员每隔 30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)下面是检验员在一天内依次4抽取的 16 个零件的尺寸:抽取次序 1 2 3 4 5 6 7 8零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04抽取次序 9 10 11 12 13 14 15 16零件尺寸 10.26 9.91 10
9、.13 10.02 9.22 10.04 10.05 9.95经计算得 i9.97, s 0.212, x11616i 1x 11616i 1 xi x 2 116(16i 1x2i 16x2)18.439, (xi )(i8.5)2.78,其中 xi为抽取的第 i 个零件16i 1 i 8.5 216i 1 x的尺寸, i1,2,16.(1)求( xi, i)(i1,2,16)的相关系数 r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若| r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小)(2)一天内抽检零件中,如果出现了尺寸在( 3
10、s, 3 s)之外的零件,就认为这条生x x产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查从这一天抽检的结果看,是否需对当天的生产过程进行检查?在( 3 s, 3 s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生x x产的零件尺寸的均值与标准差(精确到 0.01)附:样本( xi, yi)(i1,2, n)的相关系数r , 0.09.ni 1 xi x yi yni 1 xi x 2 ni 1 yi y 2 0.008解 (1)由样本数据得( xi, i)(i1,2,16)的相关系数为r16i 1 xi x i 8.516i 1 xi x 216i 1 i 8
11、.5 25 0.18. 2.780.2121618.439由于| r|0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(2)由于 9.97, s0.212,由样本数据可以看出抽取的第 13 个零件的尺寸在x( 3 s, 3 s)以外,因此需对当天的生产过程进行检查x x剔除离群值,即第 13 个数据,剩下数据的平均数为 (169.979.22)10.02,115所以这条生产线当天生产的零件尺寸的均值的估计值为 10.02,160.212 2169.97 21 591.134,16i 1x2i剔除第 13 个数据,剩下数据的样本方差为(1 591.1349.22 2
12、1510.02 2)0.008,115所以这条生产线当天生产的零件尺寸的标准差的估计值为 0.09.0.008回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤是先画出散点图,并对样本点进行相关性检验,在此基础上选择适合的函数模型去拟合样本数据,从而建立较好的回归方程,并且用该方程对变量值进行分析;有时回归模型可能会有多种选择3对一质点的运动过程观测了 4 次,得到如表所示的数据,则刻画 y 与 x 的关系的线性回归方程为_.x 1 2 3 4y 1 3 5 6解析:由表可知 2.5,x1 2 3 44 , Sxy , S ,y1 3 5 64 154 178 2x 54所以
13、 b 1.7, a b 1.72.50.5.SxyS2x y x 154故所求线性回归方程为 y1.7 x0.5.答案: y1.7 x0.54某市 5 年中的煤气消耗量与使用煤气户数的历史资料如下:6年份 2013 2014 2015 2016 2017x 用户 (万户 ) 1 1.1 1.5 1.6 1.8y(万立方米) 6 7 9 11 12(1)检验是否线性相关;(2)求回归方程;(3)若市政府下一步再扩大两千煤气用户,试预测该市煤气消耗量将达到多少?解:(1)作出散点图(如图),观察呈线性正相关(2) ,x1 1.1 1.5 1.6 1.85 75 9,y6 7 9 11 1251 21.1 21.5 21.6 21.8 210.26,5i 1x2iiyi161.171.591.6111.81266.4,5i 1x b .a b 9 ,66.4 575910.26 54925 17023 y x 17023 75 3123回归方程为 y x .17023 3123(3)当 x1.80.22 时,代入得 y 2 13.4,17023 3123 30923煤气消耗量约达 13.4 万立方米7