第八章 相关分析.ppt
《第八章 相关分析.ppt》由会员分享,可在线阅读,更多相关《第八章 相关分析.ppt(135页珍藏版)》请在麦多课文档分享上搜索。
1、1,第八章 相关分析,本章主要内容: 第一节 相关分析的一般问题 第二节 相关关系判断 第三节 回归分析,2,第一节 相关分析的一般问题,主要内容:一、相关关系的种类二、相关分析与回归分析 三、相关分析的作用四、相关分析的内容,3,第一节 相关分析的一般问题,一、相关关系的种类(一)变量之间的关系种类:1、相关关系是指现象之间相互依存、相互制约和相互影响的关系。它是指现象之间的一种不确定性的依存关系。2、函数关系是指现象之间是确定性的关系,表现为某一现象发生变化,另一现象也随之变化,且有确定的值与之相对应。,4,第一节 相关分析的一般问题,函数关系: 设有两个变量 x 和 y ,变量 y 随变
2、量 x变化, 并完全依赖于 x ,当变量 x 取某个数值时, y 依 确定的关系取相应的值,则称 y 是 x 的函数,记 为其中 x 称为自变量,y 称为因变量。,5,第一节 相关分析的一般问题,相关关系:变量间关系不能用函数关系精确表达; 一个变量的取值不能由另一个变量唯一确 定;当变量 x 取某个值时,变量 y 的取值 可能有几个。,6,第一节 相关分析的一般问题,相关关系 函数关系,Y,Y,X,X,O,0,7,第一节 相关分析的一般问题,(二)相关关系与函数关系之间的关系 1、相关关系是相关分析的研究对象。函数关系是相关分析的工具。2、函数关系有时也会表现为相关关系;相关分析必须借助函数
3、表达式来表明现象之间的相关形式(方程式)。,8,第一节 相关分析的一般问题,例:函数关系 1、圆的面积S与半径r之间的关系 2、商品销售额y与销售量q之间的关系,p为价格 3、企业的原材料消耗额M与产品产量q和单位产品消耗量m、材料价格p之间的关系,9,第一节 相关分析的一般问题,例:相关关系 1、农作物产量(Y)与施肥量(X) 2、工资(Y)与工龄(X1)、性别(X2)之间的关系 3、子女身高(Y)与父亲身高(X)之间的关系 4、收入水平(Y)与受教育程度(X)之间 5、商品销售额(Y)与广告费(X)的关系,10,第一节 相关分析的一般问题,(三)相关关系的种类 1、按相关程度分: 完全相关
4、、不完全相关、完全不相关。 2、按相关方向分正相关和负相关。 3、按相关关系的表现形式分,直线相关和曲线相关。,11,第一节 相关分析的一般问题,4、按影响因素的多少分,单相关和复相关。5、按依存关系的情况分:因果关系,分不清因果的依存关系。,12,第一节 相关分析的一般问题,相关关系种类,依存关系,影响因素,关系表现形式,相关方向,相关程度,完全相关,不完全相关,非线性相关,线性相关,负相关,正相关,复相关,单相关,非因果关系,因果关系,完全不相关,13,第一节 相关分析的一般问题,二、相关分析与回归分析 (一)涵义 1、相关分析是对具有相关关系的变量之间的关系密切程度进行分析研究的统计方法
5、。2、回归分析是对具有相关关系的变量,根据其形式,选择一个适当的数学模型,近似地表示变量之间的关系的统计分析方法。,14,第一节 相关分析的一般问题,(二)二者之关系1、二者之联系:回归分析与相关分析有密切联系,如果没有从定性上判断变量间是否具有相关关系,而盲目地进行回归分析是没有意义的;反之,仅有相关分析而不进行回归分析,这种得不到具体数量对应关系的统计分析是不深入的。由此可见,相关分析是回归分析的前提和基础,回归分析是相关分析的继续和深入。,15,第一节 相关分析的一般问题,2、区别(1)变量之间的关系不同 相关分析:变量是对等的关系回归分析:变量之间确定的因果关系。(2)变量之间的关系表
6、现 相关分析:相关系数回归分析:利用回归方程,16,第一节 相关分析的一般问题,(3)变量的随机性要求不同相关分析:变量都必须是随机变量, 回归分析:自变量不是随机变量,因 变量是随机变量。,17,第一节 相关分析的一般问题,三、相关分析的作用1、确定现象之间的依存关系。2、确定相关关系的密切程度。 3、配合数学方程式4、确定因变量估计值的误差程度。,18,第一节 相关分析的一般问题,四、相关分析的内容 1、从理论或经验上,判断变量之间是否存在相关关系。2、利用统计方法描述变量之间的相关关系、相关关系的形态判断。3、配合回归方程。用最小二乘法估计方程参数,并对回归方程进行评价。4、回归方程的估
7、计误差计算。,19,第二节 相关关系判断,一、图示法二、表式法三、相关系数,20,第二节 相关关系判断,一、图示法。用散点图表现变量之间的关系程度和形态,也称相关图。,21,第二节 相关关系判断,二、表示法。用表格的形式表现变量之间的相关关系,也称之为相关表。种类:1、简单相关表和分组相关表(棋盘表):简单相关表是资料未曾分组,只将自变量数值按大小顺序排列,并配合其对应的因变量的变量数值所形成的表。,22,第二节 相关关系判断表示法,23,24,第二节 相关关系判断表示法,25,26,27,第二节 相关关系判断,三、相关系数的计算(一)相关系数相关系数是说明两个现象之间相关关 系密切程度的统计
8、分析综合指标。对两个变量之间的线性相关程度的度 量称为简单相关系数。多个变量之间的相 关系数称为复相关系数。,28,第二节 相关关系判断,(二)计算 设两个变量y和x,它们之间的简单相关系数计算公式为:,29,第二节 相关关系判断,相关系数r的取值范围在-1,1之间。 当r=1时,为完全相关。 当 r=0 时,为完全不相关。 当 时,为负相关。 当 时,为正相关。 当 时,变量之间关系的密切程度越高;反之,关系密切程度低。,30,r,第二节 相关关系判断,31,第二节 相关关系判断相关系数,例1.消费支出与可支配收入之间的相关系数计算。,32,第二节 相关关系判断相关系数,33,第二节 相关关
9、系判断相关系数,34,第二节 相关关系判断相关系数,用相关系数公式,35,36,第二节 相关关系判断相关系数,例3.一家大型商业银行在多个地区设有25 个分行。该银行所属的25家分行2002年的 有关业务数据列入下表 。通过散点图可以 观察到不良贷款与贷款余额、累计应收贷 款、贷款项目等之间存在较大的相关性。 为了进一步说明相关的程度,需要计算相 关系数,并列入下表。,37,第二节 相关关系判断相关系数,分别计算两两变量之间的相关系数,列入 下表,38,第三节 回归分析,主要内容 一、回归分析 二、标准的一元线性回归模型 三、一元线性回归模型的估计 四、回归方程的检验 五、一元线性回归模型的预
10、测 六、多元回归 七、曲线回归,39,第三节 回归分析,一、回归分析(Regression)1、回归分析是指从一组数据出发,确定变量之间的数学关系式,即建立回归模型。 2、回归模型是对具有相关关系的变量,借助数学分析方法,建立的用以近似地描述相关变量间联系的函数关系或经验公式,也称回归方程或回归函数。换言之,回归分析通过一个或一组被称为自变量的变化解释另一个被称为因变量的变化。,40,第三节 回归分析,回归分析最早采用者是英国遗传学家高尔登。他把这种统计分析方法应用于研究生物学的遗传问题。他所说的回归是指生物后代有回复或回归到其上代原有特性的倾向。因此,这种分析方法就称为回归分析。,41,第三
11、节 回归分析,3、回归模型的种类根据变量数量的多少,分为一元回归和多元回归。 根据变量间关系的表现形态,分为直线回归和曲线回归,也称线性回归和非线性回归。最简单的回归模型是两个变量的方程,即一元线性回归方程。,42,第三节 回归分析,4、主要内容和步骤 1)根据理论对问题进行分析,区分自变量和因变量。2)建立变量之间的回归模型,表现变量之间的函数关系。3)测定模型的拟合精度,对估计值进行统计 检验。4)在通过检验之后,利用回归方程,根据自变量的具体数值,对因变量进行预测。,43,第三节 回归分析,回归分析的主要任务是要采用适当的 方法,充分利用样本所提供的信息,使得样 本回归函数尽可能地接近于
12、真实的总体回归 函数。,44,第三节 回归分析,5、变量、变量类型和变量之间的关系* 变量是对研究对象数量特征的描述,如产量、产值、价格等。因变量(Y),也称被解释变量或内生变量。也是被预测的变量。自变量 (X) ,也称解释变量或外生变量,用于解释因变量的一个或多个变量。,45,第三节 回归分析,*变量类型。变量主要分为外生变量和内生变量两种。内生变量是由经济系统本身决定的变量,系统运行,变量也随之变化。外生变量是由经济系统以外的因素决定的,它们的取值不受模型的影响,系统运行不对其产生影响。例:其中:内生变量为y,它被x1和x2解释,其数值受到x1和x2的影响。此时,x1和x2,是解释变量,是
13、外生变量,它们不受Y的影响。,46,第三节 回归分析,在外生变量中,除了上述如x1和x2这样 的变量外,还有滞后变量,如yt-1。在时间t 上,yt-1是已经确定,它不能随着模型的变 化而变化。例:研究居民消费水平时,除了收集工 资收入、家庭人口和存款情况,还要收集前期居民消费水平。因其直接关系到当前消费。,47,第三节 回归分析,例:经济学的有关国民收入的模型。根据凯恩斯的收入影响消费的理论,消费是收入的线性函数,即其中:C表示消费总额,Y表示收入,c表 示消费倾向。C0为常数。,48,第三节 回归分析,实际上,对于居民消费,除了收入水 平以外,还存在许多其他的影响因素,如 消费习惯、对未来
14、收入的预期、年龄等因 素。这些因素都会使消费者的消费与收入 之间的关系表现为不完全确定的相关关系。因此,应该将误差项也列入到方程中,49,第三节 回归分析,二、标准的一元线性回归模型(一)总体回归函数。回归分析通常要建立一定的数学模型。最简单的模型是只有一个因变量和一个自变量的线性回归模型,即一元线性回归模型。,50,第三节 回归分析,该类模型假设因变量为Y主要受到自变量X的影 响,它们之间存在着近似的线性函数关系:,称为总体回归函数。 式中:1和2是未知参数,又叫回归系数。Yi和Xi分别是Y和X的第t次值。,51,第三节 回归分析,ui为随机误差项,又称随机干扰项或扰动项。它是一个随机变量,
15、反映未列入方程中的其他各项因素对Y的影响。而E(Yi)=1+2Xi,是指在X值给定条件下,Y的期望值是X的严密的线性函数。Y和X之间是确定的函数关系。,52,第三节 回归分析,然而,变量Y的实际观察值并不一定都 位于直线上,Y只是散布在该直线的周围。 把各实际观测点与总体回归线垂直方 向的间隔,称为随机误差扰动项,即ui=Yi-E(Yi),53,第三节 回归分析,(二)样本回归函数根据样本资料拟合的直线,称为样本回归直线;若拟合的是一条曲线,时,则称为样本回归曲线。其形式与总体回归函数一致 。样本回归函数 为,54,第三节 回归分析,样本回归函数 为样本回归方程为,其中: 为样本函数的截距;
16、为样本函数的斜率,也是对总体回归系数的估计值;ei是残差,与总体的随机扰动项相对应。n为样本容量.,55,第三节 回归分析,样本函数模型与总体函数模型之间的差别:1)总体函数模型是未知的,它只有一条。样本回归线则有多条,是可变的。2)总体回归函数中的系数是未知的。为常 数。而样本回归函数中的回归系数是随机变量。3)总体回归函数中的随机误差项u是Y与总 体回归线之间的纵向距离,它是不可直接观测的。 而样本回归函数中的e是Y与样本回归线之间 的纵向距离,可以计算出具体数值。,56,第三节 回归分析,(三)误差项的标准假定随机误差项u是无法直接观测到的。 为了进行回归分析,通常对其概率分布提 出假定
17、。 假设1:误差项的期望值为0,即对所有的i总有 E(ui)=0,57,第三节 回归分析,假设2:误差项的方差为常数即对所有的i,有 即同方差性。 假设3:误差项之间不存在序列相关关系, 其协方差为零,即当ij时有,58,第三节 回归分析,假设4:自变量是给定的变量,与随机误差项线性无关。 假设5:随机误差项服从正态分布。上述假设最初是由德国数学家高斯提出的,也称高斯假设或标准假定,或经典假定。满足以上标准的假定的一元线性回归方程模型,称为标准的一元线性回归方程。,59,第三节 回归分析,三、一元线性回归模型的估计 (一)回归系数的估计设直线方程式为 采用最小二乘法配合线性方程,其中:Q为残差
18、平方和的大小。,60,第三节 回归分析,对Q求偏导,得到计算估计值的正规方 程组或称标准方程组,计算得到各参数的 估计值:,61,第三节 回归分析,例:内蒙古城镇居民可支配收入与居民消费水平 (1)农村居民消费水平(Y)农牧民纯收入(X),回归方程为:y=121.29+0.492x. 回归系数为0.492,也称为边际消费倾向。即农牧民纯收入每增加1亿元,农村居民消费水平增加0.492亿元。,利用excel计算,62,第三节 回归分析,例:内蒙古城镇居民可支配收入与居民消费水平 (2)城镇居民消费水平(Y)城镇居民可支配收入(X),回归方程为:y=120.793+0.891x. 回归系数为0.8
19、91,也称为边际消费倾向。即城镇居民可 支配收入每增加1亿元,消费水平增加0.891亿元。,63,(二)回归系数与相关系数的关系回归方程式的斜率2与相关系数r之间的关 系可用下式表示,64,第三节 回归分析,(三)估计标准误差利用回归方程推算因变量的估计值。估计值与实际值之间是有差异的,存在估计误差。测量估计误差的目的是帮助我们了解估计资料的精确度,分析误差产生的原因,提高估计的把握程度。,利用excel计算,65,第三节 回归分析,(三)估计标准误差-计算公式,考虑自由度时,则用下式.其中:m为方程中的参数个数。如一元线性方程有两个参数,因此,上式用n-2.,66,第三节 回归分析,(三)估
20、计标准误差1、实际观察值与回归估计值离差平方和的 均方根2、反映实际观察值在回归直线周围的分散状 况3、对误差项的标准差的估计,是在排除了 x对y的线性影响后,y随机波动大小的一个估计量4、反映用估计的回归方程预测y时预测误差 的大小。,67,第三节 回归分析,例:内蒙古城镇居民可支配收入与居民消费水平 (1)农村居民消费水平(Y)- 农牧民纯收入(X),根据回归方程为:y=121.29+0.492x.对农村居民消费水平进行估计,并计算其估计误差。,利用excel计算,68,第三节 回归分析,例:内蒙古城镇居民可支配收入与居民消费水平 (2)城镇居民消费水平(Y)- 城镇居民可支配收入(X),
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 相关 分析 PPT
