1、第1章,统计案例,1,知识网络 系统盘点,提炼主干,2,要点归纳 整合要点,诠释疑点,3,题型研修 突破重点,提升能力,章末复习提升,1.独立性检验(其中nabcd)来确定在多大程度上认为“两个变量有相关关系”.应记熟2的几个临界值的概率.,2.回归分析 (1)分析两个变量相关关系常用:散点图或相关系数r进行判断.在确认具有线性相关关系后,再求线性回归方程,进行预测. (2)对某些特殊的非线性关系,可以通过变量转化,把非线性回归转化为线性回归,再进行研究.,题型一 独立性检验思想的应用 独立性检验的基本思想是统计中的假设检验思想,类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信
2、程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的随机变量2应该很小,如果由观测数据计算得到的2的观测值很大,则在一定程度上说明假设不合理.,例1 为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2),表1:注射药物A后皮肤疱疹面积的频数分布表,表2:注射药物B后皮肤疱疹面积的频数分布表,完成下面22列联表,能否在犯错误概率不超过0.001的前提下,认为“注射药物A后的疱疹面积与注射药
3、物B后的疱疹面积有差异”.,表3:,解 列出22列联表,由于210.828,所以在犯错误概率不超过0.001的前提下,认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.,跟踪演练1 某企业为了更好地了解设备改造与生产合格品的关系,随机抽取了180件产品进行分析.其中设备改造前生产的合格品有36件,不合格品有49件;设备改造后生产的合格品有65件,不合格品有30件,根据上面的数据,你能得出什么结论?,解 根据已知条件列出22列联表:,提出假设H0:设备改造与生产合格品无关.,210.828, 我们有99.9%的把握认为设备改造与生产合格品有关系.,题型二 线性回归分析 进行线性回归分
4、析的前提是两个变量具有线性相关关系,否则求出的线性回归方程就没有实际意义,所以必须先判断两个变量是否线性相关.分析判断两个变量是否线性相关的常用方法是利用散点图进行判断,若各数据点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系.此方法直观、形象,但缺乏精确性.,例2 在一段时间内,分5次测得某种商品的价格x(万元)和需求量y(t)之间的一组数据为,(1)画出散点图; 解 散点图如下图所示:,(2)求出y对x的线性回归方程;,(3)如果价格定为1.9万元,预测需求量大约是多少?(精确到0.01 t).,故价格定为1.9万元,预测需求量大约为6.25 t.,跟踪演练
5、2 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了4次试验,得到数据如下:,(1)在给定的坐标系中画出表中数据的散点图;解 散点图如图所示:,(3)试预测加工10个零件需要的时间.,题型三 非线性回归分析 非线性回归问题有时并不给出经验公式.这时我们可以画出已经数据的散点图,把它与已经学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决.,例3 下表是某年美国旧轿车价格的调查资料,今以x表示轿车的使用年数,y是表示相应的年均价格,求y关于x的回归方程.,解 数据对应的散点图
6、如图1,图1,可以发现,各点并不是基本处于一条直线附近, 因此,y与x之间是非线性回归关系.,题中数据变成如下表所示:,相应的散点图如图2, 从图2可以看出,变换的样本点分布在一条直线附近, 因此可以用线性回归方程拟合.图2,由表中数据可得r0.996. 即|r|r0.050.632, 所以有95%的把握认为x与z之间具有线性相关关系,,跟踪演练3 下表所示是一组试验数据:,(1)作出x与y的散点图,并判断是否线性相关; 解 散点图如图:,由散点图可知y与x不具有线性相关关系,且样本点分布在反比例函数y a的周围.,(2)若变量y与 成线性相关关系,求出y对x的回归方程, 并观测x10时y的值.,解 令x ,yy由已知数据制成下表,由于|r|r0.050.878, 说明y与x具有很强的线性关系,,所以y11.336.95x.,课堂小结 1.独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法,而利用假设的思想方法,计算出某一个随机变量2的值来判断更精确些. 2.建立回归模型的基本步骤:(1)确定研究对象.(2)画出散点图,观察它们之间的关系.(3)由经验确定回归方程的类型.(4)按照一定的规则估计回归方程中的参数.,