欢迎来到麦多课文档分享! | 帮助中心 海量文档,免费浏览,给你所需,享你所想!
麦多课文档分享
全部分类
  • 标准规范>
  • 教学课件>
  • 考试资料>
  • 办公文档>
  • 学术论文>
  • 行业资料>
  • 易语言源码>
  • ImageVerifierCode 换一换
    首页 麦多课文档分享 > 资源分类 > DOC文档下载
    分享到微信 分享到微博 分享到QQ空间

    版选修2_3.doc

    • 资源ID:1128924       资源大小:692.50KB        全文页数:18页
    • 资源格式: DOC        下载积分:2000积分
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    二维码
    微信扫一扫登录
    下载资源需要2000积分(如需开发票,请勿充值!)
    邮箱/手机:
    温馨提示:
    如需开发票,请勿充值!快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如需开发票,请勿充值!如填写123,账号就是123,密码也是123。
    支付方式: 支付宝扫码支付    微信扫码支付   
    验证码:   换一换

    加入VIP,交流精品资源
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    版选修2_3.doc

    1、13.2 独立性检验的基本思想及其初步应用学习目标 1.了解分类变量的意义.2.了解 22 列联表的意义.3.了解随机变量 K2的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法知识点一 分类变量及 22 列联表思考 山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:体育 文娱 合计男生 210 230 440女生 60 290 350合计 270 520 790如何判定“喜欢体育还是文娱与性别是否有联系”?答案 可通过表格与图形进行直观分析,也可通过统计分析定量判断梳理 (1)分类变量变量的不同“值”表示个体所属的不同类别,像

    2、这样的变量称为分类变量(2)列联表定义:列出的两个分类变量的频数表,称为列联表22 列联表2一般地,假设有两个分类变量 X 和 Y,它们的取值分别为 x1, x2和 y1, y2,其样本频数列联表(也称为 22 列联表)为下表.y1 y2 总计x1 a b a bx2 c d c d总计 a c b d a b c d知识点二 等高条形图1与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征2如果通过直接计算或等高条形图发现 和 相差很大,就判断两个分类变量之间有aa b cc d关系知识点三 独立性检验1定义:利用随机变量 K2来判断“两个分类变

    3、量有关系”的方法称为独立性检验2 K2 ,其中 n a b c d 为样本容量nad bc2a bc da cb d3独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界 ,然后查表确定临界值 k0.(2)利用公式计算随机变量 K2的观测值 k.(3)如果 k k0,就推断“ X 与 Y 有关系” ,这种推断犯错误的概率不超过 ;否则,就认为在犯错误的概率不超过 的前提下不能推断“ X 与 Y 有关系” ,或者在样本数据中没有发现足够证据支持结论“ X 与 Y 有关系” 1列联表中的数据是两个分类变量的频数( )2事件 A 与 B 的独立性检验无关,即

    4、两个事件互不影响( )3 K2的大小是判断事件 A 与 B 是否相关的统计量( )类型一 等高条形图的应用例 1 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:3组别 阳性数 阴性数 总计铅中毒病人 29 7 36对照组 9 28 37总计 38 35 73试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?考点 定性分析的两类方法题点 利用图形定性分析解 等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率由图可以直观地看出铅中毒病人与对照组

    5、相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系反思与感悟 在等高条形图中,可以估计满足条件 X x1的个体中具有 Y y1的个体所占的比例 ,也可以估计满足条件 X x2的个体中具有 Y y1的个体所占的比例 .两个比例aa b cc d的值相差越大, X 与 Y 有关系成立的可能性就越大跟踪训练 1 网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了 1 000 人调查,发现其中经常上网的有 200 人,这 200 人中有 80 人期末考试不及格,而另外 800 人中有 120 人不及格利用图形判

    6、断学生经常上网与学习成绩有关吗?考点 定性分析的两类方法题点 利用图形定性分析解 根据题目所给的数据得到如下 22 列联表:经常上网 不经常上网 总计不及格 80 120 200及格 120 680 800总计 200 800 1 000得出等高条形图如图所示:4比较图中阴影部分的高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关类型二 独立性检验例 2 某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品 不喜欢甜品 合计南方学生 60 20 80北方学生 10 10 20合计 70 30 100根据表中

    7、数据,问是否在犯错误的概率不超过 0.05 的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异” 考点 独立性检验及其基本思想题点 独立性检验的方法解 将 22 列联表中的数据代入公式计算,得K2的观测值 knad bc2a bc da cb d1006010 2010270308020 4.762.10021因为 4.7623.841,所以在犯错误的概率不超过 0.05 的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异” 反思与感悟 (1)独立性检验的关注点在 22 列联表中,如果两个分类变量没有关系,则应满足 ad bc0,因此| ad bc|越小,关系越弱;|

    8、ad bc|越大,关系越强(2)独立性检验的具体做法根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界 ,然后查表确定临界值 k0.5利用公式 K2 计算随机变量 K2的观测值 k.nad bc2a bc da cb d如果 k k0,推断“ X 与 Y 有关系”这种推断犯错误的概率不超过 ;否则,就认为在犯错误的概率不超过 的前提下不能推断“ X 与 Y 有关系” ,或者在样本数据中没有发现足够的证据支持结论“ X 与 Y 有关系” 跟踪训练 2 某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况

    9、进行了问卷调查,共调查了 50 人,其中有老教师 20 人,青年教师 30 人老教师对新课程教学模式赞同的有 10 人,不赞同的有 10 人;青年教师对新课程教学模式赞同的有 24 人,不赞同的有 6 人(1)根据以上数据建立一个 22 列联表;(2)判断是否有 99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系考点 独立性检验及其基本思想题点 独立性检验的方法解 (1)22 列联表如下所示:赞同 不赞同 总计老教师 10 10 20青年教师 24 6 30总计 34 16 50(2)假设“对新课程教学模式的赞同情况与教师年龄无关” 由公式得 K2 4.9636.635,故有 99%的

    10、把握认为箱产量与养殖方法有关反思与感悟 两个分类变量相关关系的判断(1)等高条形图法:在等高条形图中,可以估计满足条件 X x1的个体中具有 Y y1的个体所占的比例 ,也可以估计满足条件 X x2的个体中具有 Y y1的个体所占的比例 .两个aa b cc d比例的值相差越大, X 与 Y 有关系成立的可能性就越大(2)观测值法:通过 22 列联表,先计算 K2的观测值 k,然后借助 k 的含义判断“两个分类变量有关系”这一结论成立的可信程度跟踪训练 3 为了解某班学生喜爱打篮球是否与性别有关,对本班 48 人进行了问卷调查得到了如下的 22 列联表:喜爱打篮球 不喜爱打篮球 合计男生 6女

    11、生 10合计 48已知在全班 48 人中随机抽取 1 人,抽到喜爱打篮球的学生的概率为 .23(1)请将上面的 22 列联表补充完整(不用写计算过程);8(2)能否在犯错误的概率不超过 0.05 的前提下认为喜爱打篮球与性别有关?说明你的理由;(3)现从女生中抽取 2 人进一步调查,设其中喜爱打篮球的女生人数为 X,求 X 的分布列与均值考点 独立性检验思想的应用题点 分类变量与统计、概率的综合性问题解 (1)列联表补充如下:喜爱打篮球 不喜爱打篮球 合计男生 22 6 28女生 10 10 20合计 32 16 48(2)由 K2 4.286.48220 60228203216因为 4.28

    12、63.841,所以,能在犯错误的概率不超过 0.05 的前提下认为喜爱打篮球与性别有关(3)喜爱打篮球的女生人数 X 的可能取值为 0,1,2.其概率分别为P(X0) ,C210C20 938P(X1) ,C10C10C20 1019P(X2) ,C210C20 938故 X 的分布列为X 0 1 2P 938 1019 938X 的均值为 E(X)0 1.1019 9191某机构调查中学生的近视情况,了解到某校 150 名男生中有 80 名近视,140 名女生中有70 名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )A平均数 B方差 C回归分析 D独立性检验9考点

    13、独立性检验及其基本思想题点 独立性检验的思想答案 D2对于分类变量 X 与 Y 的随机变量 K2的观测值 k,下列说法正确的是( )A k 越大, “X 与 Y 有关系”的可信程度越小B k 越小, “X 与 Y 有关系”的可信程度越小C k 越接近于 0, “X 与 Y 没有关系”的可信程度越小D k 越大, “X 与 Y 没有关系”的可信程度越大考点 独立性检验及其基本思想题点 独立性检验的思想答案 B解析 k 越大, “X 与 Y 没有关系”的可信程度越小,则“ X 与 Y 有关系”的可信程度越大,k 越小, “X 与 Y 有关系”的可信程度越小3用等高条形图粗略估计两个分类变量是否相关

    14、,观察下列各图,其中两个分类变量关系最强的是( )考点 定性分析的两类方法题点 利用图形定性分析答案 D解析 由等高条形图易知,D 选项两个分类变量关系最强4若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据得“吸烟与患肺癌有关”的结论,并且有 99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )A100 个吸烟者中至少有 99 人患有肺癌B1 个人吸烟,那么这个人有 99%的概率患有肺癌C在 100 个吸烟者中一定有患肺癌的人10D在 100 个吸烟者中可能一个患肺癌的人也没有考点 独立性检验及其基本思想题点 独立性检验的方法答案 D解析 独立性检验的结论是一个统计量,统计的结

    15、果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生5高中流行这样一句话“文科就怕数学不好,理科就怕英语不好” 下表是一次针对高三文科学生的调查所得的数据.总成绩好 总成绩不好 总计数学成绩好 478 a 490数学成绩不好 399 24 423总计 b c 913(1)计算 a, b, c 的值;(2)文科学生总成绩不好与数学成绩不好有关系吗?考点 独立性检验及其基本思想题点 独立性检验的方法解 (1)由 478 a490,得 a12.由 a24 c,得 c122436.由 b c913,得 b91336877.(2)计算随机变量 K2的观测值k 6.2335.024,913478

    16、24 39912249042387736因为 P(K25.024)0.025,所以在犯错误的概率不超过 0.025 的前提下,认为文科学生总成绩不好与数学成绩不好有关系1列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有相关关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有相关关系2对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法先假设“两个分类变量没有关系”成立,计算随机变量 K2的值,如果 K2的值很大,说明假设不合理 K2越大,两个分类变量有关系的可能性越大11一、选择题1下面是一个 22 列联表:y1 y2 总计x1

    17、 a 21 73x2 8 25 33总计 b 46 106则表中 a, b 的值分别为( )A94,96 B52,50C52,60 D54,52考点 分类变量与列联表题点 求列联表中的数据答案 C2为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用 22列联表进行独立性检验,经计算得 K27.01,则认为“喜欢乡村音乐与性别有关系”的把握约为( )A0.1% B1% C99% D99.9%考点 独立性检验及其基本思想题点 独立性检验的方法答案 C解析 易知 K27.016.635,对照临界值表知,有 99%的把握认为喜欢乡村音乐与性别有关系3在独立性检验中,两个分类变量

    18、“ X 与 Y 有关系”的可信度为 99%,则随机变量 K2的观测值 k 的取值范围是( )A3.841,5.024) B5.024,6.635)C6.635,7.879) D7.879,10.828)考点 分类变量与列联表题点 求观测值答案 C4高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:12优秀 及格 总计甲班 11 34 45乙班 8 37 45总计 19 71 90则随机变量 K2的观测值约为( )A0.600 B0.828C2.712 D6.004考点 分类变量与列联表题点 求观测值答案 A解析 根据列联表中的数据,可得随机变量 K2的观

    19、测值k 0.600.故选 A.901137 3482454519715在 22 列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么这两个比值为( )A. 与 B. 与aa b cc d ac d ca bC. 与 D. 与aa d cb c ab d ca c考点 定性分析的两类方法题点 利用图形定性分析答案 A解析 由题意, ,因为| ad bc|的值越大,|aa b cc d| |ac ad ac bca bc d | | ad bca bc d|两个分类变量有关系的可能性就越大,故选 A.6有两个分类变量 X, Y,其列联表如下所示,Y1 Y2X1 a 20 aX2 15

    20、 a 30 a其中 a,15 a 均为大于 5 的整数,若在犯错误的概率不超过 0.05 的前提下认为 X, Y 有关,则 a 的值为( )A8 B9C8 或 9 D6 或 813考点 分类变量与列联表题点 求列联表中的数据答案 C解析 根据公式,得 K2的观测值k65a30 a 15 a20 a220451550 3.841,根据 a5 且 15 a5,1313a 602204532aZ,求得当 a8 或 9 时满足题意7某班主任对全班 50 名学生进行了作业量的调查,数据如下表:认为作业量大 认为作业量不大 合计男生 18 9 27女生 8 15 23合计 26 24 50则推断“学生的性

    21、别与认为作业量大有关”这种推断犯错误的概率不超过( )A0.01 B0.025 C0.005 D0.001考点 独立性检验及其基本思想题点 独立性检验的方法答案 B解析 由公式得 K2的观测值 k 5.0595.024. P(K25.024)501815 892262427230.025,犯错误的概率不超过 0.025.二、填空题8在吸烟与患肺病是否相关的判断中,有下面的说法:若 K2的观测值 k6.635,则在犯错误的概率不超过 0.01 的前提下,认为吸烟与患肺病有关系,那么在 100 个吸烟的人中必有 99 人患有肺病;从独立性检验可知在犯错误的概率不超过 0.01 的前提下,认为吸烟与

    22、患肺病有关系时,若某人吸烟,则他有 99%的可能患有肺病;从独立性检验可知在犯错误的概率不超过 0.05 的前提下,认为吸烟与患肺病有关系时,是指有 5%的可能性使得推断错误其中说法正确的是_考点 独立性检验及其基本思想题点 独立性检验的思想14答案 解析 K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法不正确;说法中对“确定容许推断犯错误概率的上界”理解错误;说法正确9某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:专业性别 非统计专业 统计专业男 13 10女 7 20为了判断主修统计专业是否与性别有关系,根据表中

    23、的数据,得到 K24.844,因为 K23.841,所以判定主修统计专业与性别有关501320 107223272030系,那么这种判断出错的可能性最大为_考点 独立性检验及其基本思想题点 独立性检验的方法答案 5%解析 因为 K23.841,所以有 95%的把握认为主修统计专业与性别有关,出错的可能性为5%.102014 年世界杯期间,某一电视台对年龄高于 40 岁和不高于 40 岁的人是否喜欢西班牙队进行调查,对高于 40 岁的调查了 50 人,不高于 40 岁的调查了 50 人,所得数据制成如下列联表:不喜欢西班牙队 喜欢西班牙队 总计高于 40 岁 p q 50不高于 40 岁 15

    24、35 50总计 a b 100若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为 ,则有超过35_的把握认为年龄与西班牙队的被喜欢程度有关附: K2 .nad bc2a bc da cb dP(K2 k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.00115k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828考点 独立性检验及其基本思想题点 独立性检验的方法答案 95%解析 设“从所有人中任意抽取一个,取到喜欢西班牙队的人”为事件 A,由已知得 P(A) ,q 35100 35所以 q25, p25, a40,

    25、b60.K2 4.1673.841.1002535 2515240605050 256故有超过 95%的把握认为年龄与西班牙队的被喜欢程度有关三、解答题11研究人员选取 170 名青年男女大学生的样本,对他们进行一种心理测验发现有 60 名女生对该心理测验中的最后一个题目的反应是:作肯定的有 22 名,否定的有 38 名;男生110 名在相同的项目上作肯定的有 22 名,否定的有 88 名问:性别与态度之间是否存在某种关系?分别用条形图和独立性检验的方法判断考点 定性分析的两类方法题点 利用图形定性分析解 建立性别与态度的 22 列联表如下:肯定 否定 总计男生 22 88 110女生 22

    26、38 60总计 44 126 170根据列联表中所给的数据,可求出男生中作肯定态度的频率为 0.2,女生中作肯定态度22110的频率为 0.37.作等高条形图如图,其中两个深色条形的高分别表示男生和女生中作肯2260定态度的频率,比较图中深色条形的高可以发现,女生中作肯定态度的频率明显高于男生中作肯定态度的频率,因此可以认为性别与态度有关系16根据列联表中的数据得到 K2的观测值 k 5.6225.024.1702238 228821106044126因此,在犯错误的概率不超过 0.025 的前提下认为性别和态度有关系12某旅行社为调查市民喜欢“人文景观”景点是否与年龄有关,随机抽取了 55

    27、名市民,得到数据如下表所示:喜欢 不喜欢 合计大于 40 岁 20 5 2520 岁至 40 岁 10 20 30合计 30 25 55(1)判断是否有 99.5%的把握认为喜欢“人文景观”景点与年龄有关?(2)用分层抽样的方法从喜欢“人文景观”景点的市民中随机抽取 6 人作进一步调查,将这6 名市民作为一个样本,从中任选 2 人,求恰有 1 位大于 40 岁的市民和 1 位 20 岁至 40 岁的市民的概率考点 独立性检验思想的应用题点 分类变量与统计、概率的综合性问题解 (1)由公式 K2 得,观测值 k11.9787.879,所以有 99.5%以nad bc2a bc da cb d上的

    28、把握认为喜欢“人文景观”景点与年龄有关(2)由题意知抽取的 6 人中大于 40 岁的市民有 4 个,20 岁至 40 岁的市民有 2 个,分别记为B1, B2, B3, B4, C1, C2,从中任选 2 人的基本事件有( B1, B2),( B1, B3),( B1, B4),( B1, C1),( B1, C2),( B2, B3),(B2, B4),( B2, C1),( B2, C2),( B3, B4),( B3, C1),( B3, C2),( B4, C1),( B4, C2),(C1, C2),共 15 个,其中恰有 1 位大于 40 岁的市民和 1 位 20 岁至 40 岁的

    29、市民的事件有(B1, C1),( B1, C2),( B2, C1),( B2, C2),( B3, C1),( B3, C2),( B4, C1),( B4, C2),共 8个,所以恰有 1 位大于 40 岁的市民和 1 位 20 岁至 40 岁的市民的概率为 .815四、探究与拓展13假设有两个分类变量 X 和 Y,它们的值域分别为 x1, x2和 y1, y2,其中 22 列联表为:y1 y2 总计x1 a b a bx2 c d c d总计 a c b d a b c d17对同一样本,以下数据能说明 X 与 Y 有关的可能性最大的一组是( )A a5, b4, c3, d2 B a5

    30、, b3, c4, d2C a2, b3, c4, d5 D a3, b2, c4, d5考点 分类变量与列联表题点 求列联表中的数据答案 D解析 对于同一样本,| ad bc|越小,说明 x 与 y 相关性越弱,而| ad bc|越大,说明 x与 y 相关性越强,通过计算知,对于 A,B,C 都有| ad bc|1012|2.对于选项 D,有|ad bc|158|7,显然 72.142017 年世界第一届轮滑运动会(the first edtion of Roller Games)在南京举行,为了搞好接待工作,组委会招募了 16 名男志愿者和 14 名女志愿者调查发现,男、女志愿者分别有 1

    31、0 人和 6 人喜爱轮滑,其余不喜爱得到 22 列联表如下.喜爱轮滑 不喜爱轮滑 总计男 10 6 16女 6 8 14总计 16 14 30(1)根据 22 列联表,判断能否在犯错误的概率不超过 0.10 的前提下认为性别与喜爱轮滑有关?(2)从女志愿者中抽取 2 人参加接待工作,若其中喜爱轮滑的人数为 ,求 的分布列和均值考点 独立性检验思想的应用题点 独立性检验与线性回归方程、均值的综合应用解 (1)假设:是否喜爱轮滑与性别无关由已知数据可求得 K2的观测值为k 1.157 52.706.30108 66216141614因此不能在犯错误的概率不超过 0.10 的前提下认为喜爱轮滑与性别有关(2)喜爱轮滑的人数 的可能取值为 0,1,2,则 P( 0) ,C06C28C214 2891 413P( 1) ,C16C18C214 4891P( 2) .C26C08C214 159118所以喜爱轮滑的人数 的分布列为 0 1 2P 413 4891 1591所以喜爱轮滑的人数 的均值为 E( )0 1 2 .413 4891 1591 67


    注意事项

    本文(版选修2_3.doc)为本站会员(towelfact221)主动上传,麦多课文档分享仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知麦多课文档分享(点击联系客服),我们立即给予删除!




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
    备案/许可证编号:苏ICP备17064731号-1 

    收起
    展开