CNS 14787-2003 Guidelines for regression analysis《回归分析指导纲要》.pdf
《CNS 14787-2003 Guidelines for regression analysis《回归分析指导纲要》.pdf》由会员分享,可在线阅读,更多相关《CNS 14787-2003 Guidelines for regression analysis《回归分析指导纲要》.pdf(44页珍藏版)》请在麦多课文档分享上搜索。
1、 1 印行年月 94 年 10 月 本標準非經本局同意不得翻印 中華民國國家標準 CNS 總號 類號 ICS 03.120.30 Z406114787經濟部標準檢驗局印行 公布日期 修訂公布日期 92 年 11 月 27 日 年月日 (共 44 頁 )迴歸分析指導綱要 Guidelines for regression analysis 目 錄 頁數 1. 適用範圍 - 3 2. 用語釋義 - 3 3. 主要內容 - 3 3.1 簡單直線迴歸模型 - 5 3.1.1 概述 - 5 3.1.2 原理與背景 - 5 3.1.3 方法與公式 - 5 3.1.3.1 相關分析 - 5 3.1.3.2
2、最小平方法 - 7 3.1.3.3 常態誤差迴歸模型 - 8 3.1.3.4 迴歸分析的推論 - 8 3.1.3.5 變異數分析法 -11 3.1.3.6 判定係數與相關係數 -12 3.1.3.7 迴歸模型之診斷與矯正 -13 3.1.4 步驟 -14 3.1.4.1 相關係數的檢定步驟 -14 3.1.4.2 估計0 和1 的步驟 -15 3.1.4.3 0 和1 的推論步驟 -15 3.1.4.4 估計 E(yh|xh) 的 100(1- )%信賴區間步驟 -17 3.1.4.5 估計 y0|x0的 100(1- )%預測區間步驟 -17 3.1.4.6 變異數分析法的步驟 -18 3.
3、1.4.7 計算判定係數與相關係數之步驟 -19 3.1.4.8 殘差圖建立的步驟 -19 3.1.5 限制條件與注意事項 -20 3.1.6 應用實例 -20 3.1.7 高次迴歸模型實例說明 -25 3.2 複迴歸分析 -28 3.2.1 概述 -28 3.2.2 原理與背景 -30 2 CNS 14787, Z 4061 3.2.3 方法與公式 - 28 3.2.3.1 複迴歸模型之估計 - 28 3.2.3.2 變異數分析 - 29 3.2.3.3 迴歸分析的推論 - 30 3.2.3.4 複判定係數與偏相關係數 - 31 3.2.3.5 複迴歸模型之診斷與矯正 - 32 3.2.4
4、步驟 - 34 3.2.4.1 複迴歸模型之估計步驟 - 34 3.2.4.2 變異數分析法的步驟 - 35 3.2.4.3 建立i 的 100(1 )%信賴區間步驟 - 35 3.2.4.4 i 的檢定步驟 - 35 3.2.4.5 建立新觀測值0Y 之 100(1 )%預測區間步驟 - 36 3.2.4.6 建立新觀測值0Y 之 100(1 )%預測區間步驟 - 36 3.2.4.7 判定係數與偏相關係數的計算步驟 - 37 3.2.4.8 殘差圖建立的步驟 - 37 3.2.5 限制條件與注意事項 - 38 3.2.6 應用實例 - 38 4. 引用資料 - 42 5. 附錄 - 43
5、3 CNS 14787, Z 4061 1. 適用範圍 目前,在所有的資料分析方法中,迴歸分析或許是最常被用到的方法。此方法可以廣泛被應用在工商業,社會科學,生物科學及其他領域上。 迴歸分析在應用上有四種主要用途: (1) 預測:利用已知的自變數可使用建立的統計關係預測因變數。 (2) 篩選變數:即決定影響因變數的重要自變數,以做為未來研究的實驗變數。 (3) 模型描述:即決定最好的迴歸模型以有效的說明因變數與自變數之統計關聯。 (4) 參數估計:即利用隨機獲得的樣本資料配適迴歸模型。 2.用語釋義 (1) 迴歸分析:是一種利用多個數量型變數間之關係,使得其中一個變數 y(或稱因變數、反應變數
6、 ) 可以用另一個或其他多個變數 (x1,x2,xk)(或稱自變數、預測變數、迴歸變數 )預測的統計方法。 (2) t 分佈:以 0 為中心的對稱分佈,不同自由度有不同的分佈。 (見 CNS 8461) (3) F 分佈:為右偏分佈, F 分佈決定於兩個自由度,不同自由度有不同的 F 分佈 (見CNS 10674)。 (4) 信賴區間:一個區間用以說明包含未知母體參數的真實值之可靠程度。 (見 CNS 8747) (5) 信賴係數 (或信賴度, (1- )%)對於估計出來的區間包含未知母體參數的真實值之信心度。 (見 CNS 8747 註 5) 3. 主要內容 當產品之重要品質特性值多落在規格
7、界限之外時,品質工程師必須腦力激盪探討影響此問題的重要因素,並進一步收集資料以決定這些重要因素與品質特性的統計關係。並利用此統 計關係,品質工程師可以 (1)利用統計推論方法判斷此統計關係是否需要修正; (2)估計或預測各重要因素在特定值下的品質特性值,以做為如何改善產品品質的決策參考。 上述重要因素在 迴歸分析裡稱為自變數,而品質特性為因變數。若 (1)自變數個數只有一個,則須進一步由因變數對自變數的散佈圖或相關分析決定其是否存在統計關係; (2)散佈圖顯示無統計關係或相關係數 太低則不需配適迴歸模型; (3)散佈圖顯示統計關係或 相關係數不低則需配適迴歸模型; (4)散佈圖呈直線關係則應配
8、適簡單直線迴歸模型,有關簡單直線迴歸模型之估計與推論見第 3.1 節; ( 5)散佈圖呈非直線關係則應配適高次迴歸模型,有關高次迴歸模型之估計與推論應用實例同見第 3.1 節; ( 6)自變數個數至少有二個,則須配適複迴歸模型;有關複迴歸模型之估計與推論見第 3.2 節。本節內容架構見圖 1。 4 CNS 14787, Z 4061 圖 1 內容架構圖 k=1 k 2 決定 y 與 x1之統計關係 決定 y 與 xi之統計關係 決定影響因變數 (y)的自變數 (x1,x2,xK,)收集或取得樣本資料 ,建立 y 與 x1之散佈圖 決定 y 與 xi之統計關係 Y 與 x1呈非直線關係Y 與 x
9、1呈直線關係 決定複迴歸模型 配適高次 迴歸模型 (本版未含此模型) 配適簡單直線 迴歸模型 (1)迴歸分析的推論(2)變異數分析 (3)判定係數計算 迴歸模型診斷與矯正 迴歸分析迴歸分析的推論變異數分析判定係數計算 , (1)迴歸分析迴歸分析的推論 (2)變異數分析 (3)判定係數計算 配適複迴歸模型迴歸模型診斷與矯正 迴歸模型診斷與矯正 是否為直線關係? 5 CNS 14787, Z 4061 3.1 簡單直線迴歸模型 3.1.1 概述 當散佈圖顯示因變數與自變數 是直線相關時,我們用最小平方法配適簡單直線迴歸模型。配適迴歸模型 所用的樣本資料必須合適模型假設,故須對模型做診斷與矯正。最後
10、,則是有關迴歸模型之迴歸分析。 3.1.2 原理與背景 簡單直線迴歸模型是最簡單的迴歸結構。簡單意謂只有一個迴 歸變數,而直線是指 與因變數 y 是直線相關。所以簡單直線迴歸模型表示為 +=10y (3.1.1) 其中, y 為因變數 0 為截距 1 為斜率 為已知固定值 為模型誤差。 10 , 為未知的常數,稱為迴歸係數。1 表示 使 y 增加或減少的效果。 表示 y 無法被迴歸變數 ( )解釋的部分。 當一組隨機樣本 )y,),(y ,( ,)y ,(nn2211被取得,則模型 (3.1.1)表示為 iiiy +=10(i = 1,2,n), (3.1.2) 模型中參數0 和1 通常是未知
11、的,但是利用最小平方法可以找到其良好估計量,接著可對參數0 ,1 和迴歸模型做推論。 3.1.3 方法與公式 3.1.3.1 相關分析 在配適迴歸模型前應做相關 分析以判斷自變數和因變數是否存在統計關係。當自變數和因變數存在統計關係,則應進一步配適迴歸模型,否則不配適迴歸模型。 直線相關時,兩個連續變數之間的關係,稱為簡單相關。連續變數之間的關係可以是直線相關,也可以是非直線相關。 兩變數間是否存在直線關係, 可以觀察 ( yx, )點子在散佈圖上的變化見圖 2: (a) (g)。 6 CNS 14787, Z 4061 圖 2(a) (g) 兩變數相關關係 (a) 正直線相關 (b) 負直線
12、相關 y x x yxx x x xx x x xx x x xx xx xx x x (c) 完全正相關 (d) 完全負相關 y x yx x x x x x x x x x x (e) 無直線相關 (f) 無直線相關 y x x yxx x x x x x x x x x x x x x x x x x xx x x xxxx x x x xx x x x (g) 無直線相關 y x x x x x x x x x x x x x x x 7 CNS 14787, Z 4061 當一變數之高數值傾向於結合另一高數值之變數,而一變數低數值則傾向於結合另一低數值之變數,則稱此兩個變數呈正相關。
13、而若一變數之高數值與另一變數之低數值結合,一變數之低數值與另一變數之高數值結合,則稱負相關。若各觀測點分佈在一條直線上,則稱兩個變數完全相關。 衡量兩變數間直線相關之程度與方向的統計量,稱為樣本相關係數 r,r=( )( )()()22yyxxyyxxiiii。 (3.1.3) r 為正值表示正相關,負值表示負相關,零表示無直線關係, 1=r 表完全正相關, 1=r 表完全負相關。 3.1.3.2 最小平方法 (1) 迴歸模型假設 在下列迴歸模型假設 下,利用最小平方法可找到參數0 和1 的良好估計量,進而得到估計的迴歸模型。迴歸模型假設為 a. i 是固定值 b. i 是隨機變數,期望值為
14、0 ,即 ( 0= )(i),且變異數為常數2= )(V(i)。 c. 誤差間是互不相關的,即 0= ),(Covji, ji 。 (2) 最小平方法 最小平方法對 n對觀察值 ,n,i),y,(ii21= 考慮iy 與其期望值之離差平方之和,2101)(iiniy +=,繼而找出使離差平方和最小的0和1 的估計值0 和1 。 以最小平方法獲得的估計量0 和1 如下: ()()()nxxnyxyxyyiiiiiiiiiiiiii,)(2221= (3.1.4) nxnyxyyniiiiii,11110= (3.1.5) 其中nyy nxxiiii= , 。於是估計的迴歸函數表示為 xy10+=
15、 。 (3) 最小平方估計量的性質 在上述的模型假設下 ,可推導得估計量0 和1 的期望值和變異數為: 8 CNS 14787, Z 4061 11= (3.1.6) 00= (3.1.7) ()= =iiiinxxxxV222212)()(3.1.8) ()+= +=nxxxnxxxnViiiiii2222222)()(1)(1(3.1.9) 由於和1 是0 和1 之不偏估計量,且1 和0 都是諸 yi的線性組合,所以由 Gauss-markov定理可知,在所有不偏 線性估計量中,1 和0 的變異數最小。 3.1.3.3 常態誤差迴歸模型 不論誤差項i 的分佈服從何種型式,最小平方估計量0
16、和1 具不偏性且變異數最小。但是要對參數0 和1 做推論,則須假設i 為常態分佈,即i 為獨立 ( )2,0 隨機變數。 3.1.3.4 迴歸分析的推論 考慮簡單直線迴歸模型 iiiy +=10(3.1.2) 其中, 0 和1 為參數; i 為已知固定值; i獨立且服從 ( )2,0 。 (1) 1 的推論 我們常對模型 (3.1.2)中的斜率,1 ,之推論有興趣。因為研究者常想知道 x和 y之間是否存在直線關係,和若自變數 x 會影響 y 則對 y 有多大影響。所以須對1 做推論,有關1 的推論包括假設檢定和信賴區間估計。 a. 1 的抽樣分佈 由於誤差i 為常態分佈,故1 之抽樣分佈為常態
17、分佈,即 ()2211,i(3.1.10) 9 CNS 14787, Z 4061 b. 1 的樣本估計標準誤差 未知常數2 之不偏估計量為誤差均方 MSE, 故1 的樣本估計標準誤差為 ()21=iMSEse ,其中2210=nyMSEii(3.1.11) 因此,欲檢定 0:10= vs 0:11 若檢定統計量的值11*=set ( )22nt 則拒絕0H ,即 x 和 y 存在直線關係。 ( )22nt 值可查 t值表 (參見附錄 )。若檢定統計量的值 11*=set ( )22nt 則不拒絕0H ,即 x 和 y 不存在直線關係。 1 之 100(1- )%信賴區間估計為 ()nxxMS
18、Entiii2221)(2 (3.1.12) (2) 0 的推論 通常我們並不對截距項0 做推論,除非當迴歸直線的範圍包含 x=0時,我們才對截距0 做推論。 a. 0 的抽樣分佈 同1 的抽樣分佈,0 之抽樣分佈為常態分佈,即 +222001,in(3.1.13) b. 0 的樣本估計標準誤差 同樣的,2 為未知常數,以誤差均方 MSE估計。故0 的樣本估計標準誤差為+=nxxnxnMSEseiiini222)()(10(3.1.14) 因此,檢定 0:00= vs 0:01 10 CNS 14787, Z 4061 若檢定統計量的值00*=set ( )22nt ,則拒絕0 ,即截距項應存
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CNS147872003GUIDELINESFORREGRESSIONANALYSIS 回归 分析 指导 纲要 PDF

链接地址:http://www.mydoc123.com/p-634561.html