版选修2_3.doc
《版选修2_3.doc》由会员分享,可在线阅读,更多相关《版选修2_3.doc(18页珍藏版)》请在麦多课文档分享上搜索。
1、13.2 独立性检验的基本思想及其初步应用学习目标 1.了解分类变量的意义.2.了解 22 列联表的意义.3.了解随机变量 K2的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法知识点一 分类变量及 22 列联表思考 山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:体育 文娱 合计男生 210 230 440女生 60 290 350合计 270 520 790如何判定“喜欢体育还是文娱与性别是否有联系”?答案 可通过表格与图形进行直观分析,也可通过统计分析定量判断梳理 (1)分类变量变量的不同“值”表示个体所属的不同类别,像
2、这样的变量称为分类变量(2)列联表定义:列出的两个分类变量的频数表,称为列联表22 列联表2一般地,假设有两个分类变量 X 和 Y,它们的取值分别为 x1, x2和 y1, y2,其样本频数列联表(也称为 22 列联表)为下表.y1 y2 总计x1 a b a bx2 c d c d总计 a c b d a b c d知识点二 等高条形图1与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征2如果通过直接计算或等高条形图发现 和 相差很大,就判断两个分类变量之间有aa b cc d关系知识点三 独立性检验1定义:利用随机变量 K2来判断“两个分类变
3、量有关系”的方法称为独立性检验2 K2 ,其中 n a b c d 为样本容量nad bc2a bc da cb d3独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界 ,然后查表确定临界值 k0.(2)利用公式计算随机变量 K2的观测值 k.(3)如果 k k0,就推断“ X 与 Y 有关系” ,这种推断犯错误的概率不超过 ;否则,就认为在犯错误的概率不超过 的前提下不能推断“ X 与 Y 有关系” ,或者在样本数据中没有发现足够证据支持结论“ X 与 Y 有关系” 1列联表中的数据是两个分类变量的频数( )2事件 A 与 B 的独立性检验无关,即
4、两个事件互不影响( )3 K2的大小是判断事件 A 与 B 是否相关的统计量( )类型一 等高条形图的应用例 1 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:3组别 阳性数 阴性数 总计铅中毒病人 29 7 36对照组 9 28 37总计 38 35 73试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?考点 定性分析的两类方法题点 利用图形定性分析解 等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率由图可以直观地看出铅中毒病人与对照组
5、相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系反思与感悟 在等高条形图中,可以估计满足条件 X x1的个体中具有 Y y1的个体所占的比例 ,也可以估计满足条件 X x2的个体中具有 Y y1的个体所占的比例 .两个比例aa b cc d的值相差越大, X 与 Y 有关系成立的可能性就越大跟踪训练 1 网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了 1 000 人调查,发现其中经常上网的有 200 人,这 200 人中有 80 人期末考试不及格,而另外 800 人中有 120 人不及格利用图形判
6、断学生经常上网与学习成绩有关吗?考点 定性分析的两类方法题点 利用图形定性分析解 根据题目所给的数据得到如下 22 列联表:经常上网 不经常上网 总计不及格 80 120 200及格 120 680 800总计 200 800 1 000得出等高条形图如图所示:4比较图中阴影部分的高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关类型二 独立性检验例 2 某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品 不喜欢甜品 合计南方学生 60 20 80北方学生 10 10 20合计 70 30 100根据表中
7、数据,问是否在犯错误的概率不超过 0.05 的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异” 考点 独立性检验及其基本思想题点 独立性检验的方法解 将 22 列联表中的数据代入公式计算,得K2的观测值 knad bc2a bc da cb d1006010 2010270308020 4.762.10021因为 4.7623.841,所以在犯错误的概率不超过 0.05 的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异” 反思与感悟 (1)独立性检验的关注点在 22 列联表中,如果两个分类变量没有关系,则应满足 ad bc0,因此| ad bc|越小,关系越弱;|
8、ad bc|越大,关系越强(2)独立性检验的具体做法根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界 ,然后查表确定临界值 k0.5利用公式 K2 计算随机变量 K2的观测值 k.nad bc2a bc da cb d如果 k k0,推断“ X 与 Y 有关系”这种推断犯错误的概率不超过 ;否则,就认为在犯错误的概率不超过 的前提下不能推断“ X 与 Y 有关系” ,或者在样本数据中没有发现足够的证据支持结论“ X 与 Y 有关系” 跟踪训练 2 某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况
9、进行了问卷调查,共调查了 50 人,其中有老教师 20 人,青年教师 30 人老教师对新课程教学模式赞同的有 10 人,不赞同的有 10 人;青年教师对新课程教学模式赞同的有 24 人,不赞同的有 6 人(1)根据以上数据建立一个 22 列联表;(2)判断是否有 99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系考点 独立性检验及其基本思想题点 独立性检验的方法解 (1)22 列联表如下所示:赞同 不赞同 总计老教师 10 10 20青年教师 24 6 30总计 34 16 50(2)假设“对新课程教学模式的赞同情况与教师年龄无关” 由公式得 K2 4.9636.635,故有 99%的
10、把握认为箱产量与养殖方法有关反思与感悟 两个分类变量相关关系的判断(1)等高条形图法:在等高条形图中,可以估计满足条件 X x1的个体中具有 Y y1的个体所占的比例 ,也可以估计满足条件 X x2的个体中具有 Y y1的个体所占的比例 .两个aa b cc d比例的值相差越大, X 与 Y 有关系成立的可能性就越大(2)观测值法:通过 22 列联表,先计算 K2的观测值 k,然后借助 k 的含义判断“两个分类变量有关系”这一结论成立的可信程度跟踪训练 3 为了解某班学生喜爱打篮球是否与性别有关,对本班 48 人进行了问卷调查得到了如下的 22 列联表:喜爱打篮球 不喜爱打篮球 合计男生 6女
11、生 10合计 48已知在全班 48 人中随机抽取 1 人,抽到喜爱打篮球的学生的概率为 .23(1)请将上面的 22 列联表补充完整(不用写计算过程);8(2)能否在犯错误的概率不超过 0.05 的前提下认为喜爱打篮球与性别有关?说明你的理由;(3)现从女生中抽取 2 人进一步调查,设其中喜爱打篮球的女生人数为 X,求 X 的分布列与均值考点 独立性检验思想的应用题点 分类变量与统计、概率的综合性问题解 (1)列联表补充如下:喜爱打篮球 不喜爱打篮球 合计男生 22 6 28女生 10 10 20合计 32 16 48(2)由 K2 4.286.48220 60228203216因为 4.28
12、63.841,所以,能在犯错误的概率不超过 0.05 的前提下认为喜爱打篮球与性别有关(3)喜爱打篮球的女生人数 X 的可能取值为 0,1,2.其概率分别为P(X0) ,C210C20 938P(X1) ,C10C10C20 1019P(X2) ,C210C20 938故 X 的分布列为X 0 1 2P 938 1019 938X 的均值为 E(X)0 1.1019 9191某机构调查中学生的近视情况,了解到某校 150 名男生中有 80 名近视,140 名女生中有70 名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )A平均数 B方差 C回归分析 D独立性检验9考点
13、独立性检验及其基本思想题点 独立性检验的思想答案 D2对于分类变量 X 与 Y 的随机变量 K2的观测值 k,下列说法正确的是( )A k 越大, “X 与 Y 有关系”的可信程度越小B k 越小, “X 与 Y 有关系”的可信程度越小C k 越接近于 0, “X 与 Y 没有关系”的可信程度越小D k 越大, “X 与 Y 没有关系”的可信程度越大考点 独立性检验及其基本思想题点 独立性检验的思想答案 B解析 k 越大, “X 与 Y 没有关系”的可信程度越小,则“ X 与 Y 有关系”的可信程度越大,k 越小, “X 与 Y 有关系”的可信程度越小3用等高条形图粗略估计两个分类变量是否相关
14、,观察下列各图,其中两个分类变量关系最强的是( )考点 定性分析的两类方法题点 利用图形定性分析答案 D解析 由等高条形图易知,D 选项两个分类变量关系最强4若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据得“吸烟与患肺癌有关”的结论,并且有 99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )A100 个吸烟者中至少有 99 人患有肺癌B1 个人吸烟,那么这个人有 99%的概率患有肺癌C在 100 个吸烟者中一定有患肺癌的人10D在 100 个吸烟者中可能一个患肺癌的人也没有考点 独立性检验及其基本思想题点 独立性检验的方法答案 D解析 独立性检验的结论是一个统计量,统计的结
15、果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生5高中流行这样一句话“文科就怕数学不好,理科就怕英语不好” 下表是一次针对高三文科学生的调查所得的数据.总成绩好 总成绩不好 总计数学成绩好 478 a 490数学成绩不好 399 24 423总计 b c 913(1)计算 a, b, c 的值;(2)文科学生总成绩不好与数学成绩不好有关系吗?考点 独立性检验及其基本思想题点 独立性检验的方法解 (1)由 478 a490,得 a12.由 a24 c,得 c122436.由 b c913,得 b91336877.(2)计算随机变量 K2的观测值k 6.2335.024,913478
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 选修 _3DOC