多重線性回歸_第1頁(yè)
多重線性回歸_第2頁(yè)
多重線性回歸_第3頁(yè)
多重線性回歸_第4頁(yè)
多重線性回歸_第5頁(yè)
已閱讀5頁(yè),還剩74頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第十三章 多重線性回歸 授課教師:吳立娟授課教師:吳立娟 流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系內(nèi) 容 多重線性回歸 回歸分析中自變量的選擇 多因素線性回歸的應(yīng)用及注意事項(xiàng)復(fù) 習(xí) 線性回歸分析是研究一個(gè)變量和另外一些變量間線性關(guān)系的統(tǒng)計(jì)分析方法。 在回歸分析中,最簡(jiǎn)單的情形是模型中只包含兩個(gè)有“依存關(guān)系”的變量,一個(gè)變量(反應(yīng)變量)隨另一個(gè)變量(自變量)的變化而變化,且呈直線變化趨勢(shì),稱之為簡(jiǎn)單線性回歸。 給定給定X X的數(shù)值的數(shù)值, , Y Y 的數(shù)值取在一個(gè)平均值的數(shù)值取在一個(gè)平均值 (y|x)附近 對(duì)應(yīng)于不同的對(duì)應(yīng)于不同的X X值值, , Y Y 的平均值座落在一條直線上平均值座落在一

2、條直線上 - - 回歸直線回歸直線. . y|x 和和 X X的關(guān)系可用一個(gè)線性方程描寫的關(guān)系可用一個(gè)線性方程描寫. .|y xX簡(jiǎn)單線性回歸方程總體樣本“Y hat”表示估計(jì)值,給定x時(shí)y的總體均數(shù)的估計(jì)值。YabXXXY直線回歸方程的求解:最小二乘原理YabXYX iiYY 回歸系數(shù)及其計(jì)算回歸系數(shù)及其計(jì)算找一條直線使殘差平方和最小找一條直線使殘差平方和最小 利用微積分知識(shí)利用微積分知識(shí),容易得到容易得到 這條線一定過(guò)兩個(gè)點(diǎn)這條線一定過(guò)兩個(gè)點(diǎn) 和和最小 )(2 yy),0(abXaY線性回歸分析的前提條件 線性(linear)反應(yīng)變量Y與自變量X呈線性變化趨勢(shì) 獨(dú)立(independent

3、)任意兩個(gè)觀察值相互獨(dú)立,一個(gè)個(gè)體的取值不受其他個(gè)體的影響 給定X時(shí),Y正態(tài)分布(normal)給定X取值時(shí),Y的取值服從正態(tài)分布 等方差(equal variance)指對(duì)應(yīng)于不同的X值,Y值的總體變異相同直線回歸應(yīng)用條件LINE示意圖回歸方程有統(tǒng)計(jì)學(xué)意義嗎 建立樣本直線回歸方程,只是完成了統(tǒng)計(jì)分析中兩變量關(guān)系的統(tǒng)計(jì)描述,這種關(guān)系是否有統(tǒng)計(jì)學(xué)意義,還需要進(jìn)一步進(jìn)行假設(shè)檢驗(yàn)。檢驗(yàn)回歸模型是否成立:方差分析檢驗(yàn)總體回歸系數(shù)是否為零:t檢驗(yàn) 例1: 某研究者研究大氣污染物一氧化氮(NO)的濃度(ppm)與汽車流量(千輛)、氣溫()、空氣濕度(%)、風(fēng)速(m/s)等因素的關(guān)系,結(jié)果見表1: 單位時(shí)間

4、內(nèi)過(guò)往的汽車數(shù)(千輛)、氣溫()、空氣濕度(%)、風(fēng)速(m/s)這四個(gè)因素是否都對(duì)空氣中一氧化氮(NO)的濃度(ppm)有影響?如何定量地描述這些因素對(duì)一氧化氮濃度的影響?哪個(gè)因素對(duì)一氧化氮濃度的影響最大?哪個(gè)因素的影響最???如果利用這些影響因素去預(yù)測(cè)空氣中一氧化氮的濃度,如何預(yù)測(cè)?效果如何? 第一節(jié) 多重線性回歸 多重多重線性回歸線性回歸(multiple linear regression) 因變量因變量: : 一個(gè)一個(gè), , Y Y 自變量自變量: : 多個(gè)多個(gè), , X X1, 1, X X2, 2, X X3, 3, , , XpXp方程:方程:ppXbXbXbbY.22110概概

5、念念 多元多元線性回歸線性回歸(multi- variate linear regression) 簡(jiǎn)稱簡(jiǎn)稱多元多元回歸回歸(multi- variate regression): 因變量因變量: : 多個(gè)多個(gè), , Y Y1 1,Y Y2 , 2 , 自變量自變量: : 多個(gè)多個(gè), X1, X2, X3, , X1, X2, X3, 方程:方程:ppXbXbXbbY1221111011.ppXbXbXbbY2222112022.多重線性回歸方程 多重線性回歸方程是簡(jiǎn)單線性回歸方程的擴(kuò)展pppxxxYXXX 22110,.,2,1|其中 表示當(dāng)所有自變量為0時(shí)反應(yīng)變量Y的總體平均值。 為變量X

6、i 的總體偏回歸系數(shù)(partial regression coefficient),表示當(dāng)方程中其他自變量保持常量時(shí),自變量Xi每增加(或減少)一個(gè)計(jì)量單位,反應(yīng)變量Y平均變化 個(gè)單位。0ii 樣本回歸方程 ppXbXbXbbY.22110Y反應(yīng)變量Y的總體平均值12|,.,pY x xx的估計(jì)值。 b00的估計(jì)。 為常數(shù)項(xiàng),又稱為截距,是總體參數(shù)bi為自變量Xi 的偏回歸系數(shù),是總體參數(shù) 的估計(jì)值。i 如果要建立由車流量( )和風(fēng)速( )預(yù)測(cè)一氧化氮濃度(Y)的線性回歸方程,模型可以寫成: 1X4X44110XbXbbY4b4b表示在車流量不變的情況下,風(fēng)速每增加一個(gè)單位(1m/s),估計(jì)

7、空氣中一氧化氮的濃度平均改變個(gè)單位(ppm)。表13-1 多重線性回歸分析數(shù)據(jù)格式 前提條件(LINE)多重線性多重線性回歸分析步驟回歸分析步驟求回歸方程求回歸方程 - - 最小二乘原則最小二乘原則假設(shè)檢驗(yàn)假設(shè)檢驗(yàn) - - 檢驗(yàn)回歸方程是否具有統(tǒng)計(jì)學(xué)意義,檢驗(yàn)回歸方程是否具有統(tǒng)計(jì)學(xué)意義,模型有意義的前提下,再分別對(duì)模型有意義的前提下,再分別對(duì)各偏回歸系數(shù)各偏回歸系數(shù)進(jìn)行假進(jìn)行假設(shè)檢驗(yàn)設(shè)檢驗(yàn)。(3)(3)變量選擇變量選擇 - - 以盡量少的自變量以盡量少的自變量, , 達(dá)到較好地解釋達(dá)到較好地解釋Y Y的目的的目的基本原理:尋找一套適宜的偏回歸系數(shù)( ),建立多重線性回歸方程,使得反應(yīng)變量的觀測(cè)

8、值 與回歸方程的估計(jì)值回歸系數(shù)的估計(jì),求回歸方程采用最小二乘法 (least squared method)來(lái)估計(jì)偏回歸系數(shù) pbbbb,210iYiY之間的殘差平方和最小。 SPSS實(shí)現(xiàn)方法: Analyze-Regression-Linear- y選入Dependent x1、x2、X3.XP選入Independent Method-Enter Stepwise Backward Forward -ok43621035. 01055. 6004. 0116. 0142. 0XXXXY當(dāng)建立樣本回歸方程后,首先要考察這個(gè)回歸方程是否有意義?即在, , , , 中,是否至少存在一個(gè)自變量與Y的

9、總體均數(shù)呈線性關(guān)系?回歸方程的效果如何?也即是這四個(gè)自變量能夠解釋反應(yīng)變量的變異的百分比是多少?四個(gè)自變量是否都對(duì)反應(yīng)變量有影響?也即是各個(gè)偏回歸系數(shù)( )所對(duì)應(yīng)的總體偏回歸系數(shù)( 是否等于0?思考:1X2X3X4X4321,bbbb4321, 回歸的目的回歸的目的: :估計(jì)估計(jì)H H0 0成立時(shí)成立時(shí), , 只能用只能用Y Y的均數(shù)的均數(shù) 來(lái)估計(jì)來(lái)估計(jì) 殘差殘差: , : , 自由度自由度= =H H1 1成立時(shí)成立時(shí), , 給定給定 可以用可以用 來(lái)估計(jì)來(lái)估計(jì) 殘差殘差: : , , 自由度自由度= 殘差減少了殘差減少了 統(tǒng)計(jì)推斷 這個(gè)回歸方程有統(tǒng)計(jì)學(xué)意義嗎這個(gè)回歸方程有統(tǒng)計(jì)學(xué)意義嗎? ?

10、 XYyXY2)(yySSi總1nXYiyix2)(iiyySS殘1 pn回殘總SSSSSS- - 這是回歸模型的貢獻(xiàn)這是回歸模型的貢獻(xiàn) 2)(yySSi回自由度自由度= = p方差分析的基本思想 總變異:把反應(yīng)變量的觀察值的離均差平方和記為 ,它反映了沒有利用自變量的信息時(shí)的觀察值的變異性,即沒有考慮車流量、氣溫、氣濕和風(fēng)速等因素的情況下一氧化氮濃度的變異的大小,其自由度記為 (為樣本量)。 2)(yySSi總1 n總 根據(jù)回歸方程計(jì)算得到的預(yù)測(cè)值 與實(shí)際觀察值 之間的差異稱為殘差,記殘差的離均差平方和為 ,它反映了的變異中不能由回歸解釋的部分,其自由度記為 ,P 為自變量個(gè)數(shù)。 把 與 之

11、差記為回歸平方和 ,它反應(yīng)了回歸模型的貢獻(xiàn),即車流量、氣溫、氣濕和風(fēng)速等因素對(duì)一氧化氮濃度的影響,其自由度記為 。 iy iy2)(iiyySS殘1pnE總SS殘差SS回歸SSp回SSMSFP 表13-3 檢驗(yàn)回歸方程整體意義的方差分析表變異來(lái)源自由度回歸40.0640.01617.59.001殘差190.0170.001總230.081P0H表中值小于0.001,按照0.05的檢驗(yàn)水準(zhǔn),可以拒絕,認(rèn)為所建立的回歸方程是有意義的。用這四個(gè)自變量構(gòu)成的回歸方程解釋空氣中一氧化氮濃度的變化是有意義的。確定系數(shù)確定系數(shù) 或稱決定系數(shù),以反映回歸方程的效果好壞。 總回歸SSSSR 22R本例 0.79

12、,說(shuō)明利用車流量、氣溫、氣濕和風(fēng)速等四個(gè)因素可以解釋一氧化氮濃度的約80的變異,可以認(rèn)為回歸的效果較好 。復(fù)相關(guān)系數(shù)復(fù)相關(guān)系數(shù) (coefficient of multiple correlation)又稱多重相關(guān)系數(shù)又稱多重相關(guān)系數(shù) 決決定定系系數(shù)數(shù) R調(diào)整的確定系數(shù)調(diào)整的確定系數(shù)(adjusted R2, ) 11111/1/1122pnnRnSSpnSSMSMSRad總殘差總殘差2adR 回歸系數(shù)的假設(shè)檢驗(yàn)回歸系數(shù)的假設(shè)檢驗(yàn) 由于存在抽樣誤差,即使總體偏回歸系數(shù)為零,也可能得到樣本偏回歸系數(shù)不為零的情形,因此需要對(duì)偏回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn),以推斷總體偏回歸系數(shù)是否為零 。0:0iH0:1i

13、H05. 0 檢驗(yàn)統(tǒng)計(jì)量為biibiSbtbiSi其中, 是第 個(gè)偏回歸系數(shù)的標(biāo)準(zhǔn)誤 05. 0P05. 0P車流量、氣溫、風(fēng)速對(duì)一氧化氮濃度的影響有統(tǒng)計(jì)學(xué)意義( ),但是氣濕的影響沒有統(tǒng)計(jì)學(xué)意義( )。)。 標(biāo)準(zhǔn)偏回歸系數(shù)標(biāo)準(zhǔn)偏回歸系數(shù)Standardized partial regression coefficient所有變量標(biāo)準(zhǔn)化后做回歸所有變量標(biāo)準(zhǔn)化后做回歸, ,所得系數(shù)稱為標(biāo)準(zhǔn)偏回歸所得系數(shù)稱為標(biāo)準(zhǔn)偏回歸系數(shù)系數(shù). .注意:注意: 一般回歸系數(shù)一般回歸系數(shù)有單位,用來(lái)解釋各自變量對(duì)有單位,用來(lái)解釋各自變量對(duì)應(yīng)變量的影響,表示在其它自變量保持不變時(shí),應(yīng)變量的影響,表示在其它自變量保持不

14、變時(shí), 增加或減少一個(gè)單位時(shí)增加或減少一個(gè)單位時(shí)Y Y的平均變化量的平均變化量 。不能用。不能用各各 來(lái)比較各來(lái)比較各 對(duì)對(duì) 的影響大小。的影響大小。 標(biāo)準(zhǔn)化回歸系數(shù)標(biāo)準(zhǔn)化回歸系數(shù)無(wú)單位,用來(lái)比較各自變量無(wú)單位,用來(lái)比較各自變量對(duì)應(yīng)變量的影響大小,對(duì)應(yīng)變量的影響大小, 越大,越大, 對(duì)對(duì) 的影響越大。的影響越大。iXibiXY,ibXiY第二節(jié) 回歸分析中變量的選擇 并不是事先考慮的所有的自變量對(duì)反應(yīng)變量的影響都有統(tǒng)計(jì)學(xué)意義。 在許多研究中,多因素線性回歸分析的目的是建立一個(gè)預(yù)測(cè)效果最優(yōu)的回歸模型,需要對(duì)自變量進(jìn)行篩選: 將對(duì)反應(yīng)變量沒有影響的自變量從模型中剔除,將對(duì)反應(yīng)變量的作用有意義的自變

15、量納入模型當(dāng)中。 殘差平方和( )縮小或確定系數(shù)( )增大 2)(iiyySS殘殘差SS2R越小越好!越小越好!總殘差總回歸SS12SSSSSSR越大越好!越大越好! 然而然而, , 只要增加自變量個(gè)數(shù)只要增加自變量個(gè)數(shù), , 這個(gè)量就會(huì)減小這個(gè)量就會(huì)減小!?!?自變量篩選的統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)殘差的均方( )縮小或調(diào)整確定系數(shù)( )增大 殘差MS2adR1pnSSMS殘差殘差11111/1/1122pnnRnSSpnSSMSMSRad總殘差總殘差自變量篩選的統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)AIC統(tǒng)計(jì)量pSSnAIC2)nln(殘差A(yù)IC值達(dá)到最小,該模型為最佳模型,AIC準(zhǔn)則自變量篩選的統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)自變量篩選的方法 最優(yōu)子集

16、回歸分析法: p個(gè)變量有2p1個(gè)方程 逐步回歸分析: 向前引入法(forward selection) 向后剔除法(backward selection) 逐步引入剔除法(stepwise selection)(一)最優(yōu)子集回歸法求出所有自變量可能組合子集的回歸方程的模型(共有2p1個(gè)),按一定準(zhǔn)則選擇最優(yōu)模型,常用的準(zhǔn)則有: 校正決定系數(shù)或殘差的均方(考慮了自變量的個(gè)數(shù)) AIC(Akaikes Information Criterion)準(zhǔn)則;最優(yōu)子集法的局限性 如果自變量個(gè)數(shù)為4,則所有的回歸有24115個(gè);當(dāng)自變量數(shù)個(gè)數(shù)為10時(shí),所有可能的回歸為 2101 1023個(gè);.;當(dāng)自變量數(shù)個(gè)

17、數(shù)為50時(shí),所有可能的回歸為25011015個(gè)。 前進(jìn)法(forward selection) 后退法(backward elimination) 逐步回歸法(stepwise regression)。它們的共同特點(diǎn)是每一步只引入或剔除一個(gè)自變量。決定其取舍則基于對(duì)偏回歸平方和偏回歸平方和的F檢驗(yàn),它表示在原有回歸方程基礎(chǔ)上引入或剔除某一自變量后所增加或減少的那部分回歸平方和.1; 1;)1(21)(pnpnSSSSSSFjj殘回回(二)逐步回歸分析(1)前進(jìn)法)前進(jìn)法 自變量從無(wú)到有、從少到多自變量從無(wú)到有、從少到多 將偏回歸平方和最大且能使回歸系數(shù)檢驗(yàn)拒絕者入選為第一個(gè)自變量;規(guī)定一個(gè)界值

18、,接著將余下的變量中偏回歸平方和最大并使檢驗(yàn)拒絕者選為第二個(gè)自變量; 如此不斷引入新的自變量,直到再不能拒絕時(shí)為止。 局限性:只進(jìn)不出,后續(xù)變量的引入可能會(huì)使先進(jìn)入方程的自變量變得不重要。(2 2)后退法)后退法 先將全部自變量放入方程,然后逐步剔除先將全部自變量放入方程,然后逐步剔除 首先對(duì)全部候選變量作總的回歸,每次剔除一個(gè)偏回歸平方和最小而使回歸系數(shù)的檢驗(yàn)不能拒絕者。直到再不能剔除時(shí)為止 。 局限性:只出不進(jìn),自變量高度相關(guān)時(shí),可能得不出正確的結(jié)果;開始時(shí)剔除的變量即使后來(lái)變得有顯著性也不能再進(jìn)入方程 。(3 3)逐步回歸法)逐步回歸法 雙向篩選(實(shí)際應(yīng)用最多):雙向篩選(實(shí)際應(yīng)用最多)

19、:在向前引入的每一步之后都要考慮在向前引入的每一步之后都要考慮從已引入方程的變量中剔除相形見絀者從已引入方程的變量中剔除相形見絀者. . 引入引入有意義的變量(前進(jìn)法),有意義的變量(前進(jìn)法),剔除剔除無(wú)意義變量無(wú)意義變量 (后退法)(后退法) 先規(guī)定兩個(gè)閾值P引入和P剔除(P引入P剔除),當(dāng)候選變量中最大P值 P引入時(shí),引入相應(yīng)變量;已進(jìn)入方程的變量最小P值 P剔除時(shí),剔除相應(yīng)變量。如此交替進(jìn)行直到無(wú)引入和無(wú)剔除為止(計(jì)算復(fù)雜)多重線性回歸的應(yīng)用 (1)定量地建立一個(gè)反應(yīng)變量與多個(gè)解釋變量之間的線性關(guān)系。例如,建立肺活量的大小與身高、體重、年齡和性別之間的線性關(guān)系。 (2)篩選危險(xiǎn)因素。例如

20、,篩選高血壓的危險(xiǎn)因素。 (3)通過(guò)較易測(cè)量的變量估計(jì)不易測(cè)量的變量。例如,建立嬰兒體表面積關(guān)于身高、體重、月齡的多因素線性回歸方程,可以通過(guò)容易測(cè)量的身高、體重、月齡等變量估計(jì)不易測(cè)量的體表面積。 (4)通過(guò)解釋變量預(yù)測(cè)反應(yīng)變量。例如,通過(guò)風(fēng)速、汽車流量、氣溫等指標(biāo)預(yù)測(cè)空氣中一氧化氮的濃度。 (5)通過(guò)反應(yīng)變量控制解釋變量。例如,在氣溫、風(fēng)速不變的情況下,通過(guò)控制汽車流量來(lái)實(shí)現(xiàn)空氣中一氧化氮濃度不超過(guò)一定的水平。多重線性回歸應(yīng)用時(shí)的注意事項(xiàng)多重線性回歸應(yīng)用時(shí)的注意事項(xiàng) 1樣本含量 2方程“最優(yōu)”問(wèn)題 3關(guān)于逐步回歸 4多元共線性 5. 啞變量設(shè)定6. 變量間的交互作用7. 殘差分析多重共線性

21、是指在進(jìn)行多元回歸分析時(shí),自變量間存在較強(qiáng)的線性相關(guān)關(guān)系。共線關(guān)系的存在,可使得估計(jì)系數(shù)方差估計(jì)系數(shù)方差加大,系數(shù)估計(jì)不穩(wěn),結(jié)果分析困難。因此在多因素線性回歸分析時(shí),特別是當(dāng)回歸結(jié)果難以用專業(yè)知識(shí)解釋時(shí),要進(jìn)行共線性診斷共線性診斷,找出存在共線性且不重要的那些自變量,剔出方程,另行回歸分析。對(duì)于存在共線性的資料,可以利用共線性診斷有選擇的保留自變量以消除共線性;或者采用嶺回歸、主成分回歸等回歸分析方法以避免共線性指標(biāo)對(duì)結(jié)果的影響。剔除某個(gè)造成共線性的自變量,重建回歸方程;合并自變量;采用逐步回歸方法。4 4多重共線性多重共線性 多重共線性的表現(xiàn)在實(shí)際應(yīng)用中主要表現(xiàn)為:多重共線性的表現(xiàn)在實(shí)際應(yīng)用

22、中主要表現(xiàn)為:(1)模型擬合效果很好,但偏回歸系數(shù)幾乎都無(wú)統(tǒng)計(jì)學(xué)意義;(2)偏回歸系數(shù)估計(jì)值的方差很大;(3)偏回歸系數(shù)估計(jì)值不穩(wěn)定,隨著樣本含量的增減各偏回歸系數(shù)發(fā)生較大變化或當(dāng)一個(gè)自變量被引入或剔除時(shí)其余變量偏回歸系數(shù)有很大變化;(4)偏回歸系數(shù)估計(jì)值的大小與符號(hào)可能與事先期望的不一致或與經(jīng)驗(yàn)相悖,結(jié)果難以解釋 出現(xiàn)以上表現(xiàn),提示存在多重共線性問(wèn)題,應(yīng)進(jìn)行多重共線性診斷。方差膨脹因子VIF (2) 容忍度(tolerance) 以每個(gè)自變量作為應(yīng)變量,對(duì)其他自變量進(jìn)行回歸分析時(shí)得到的殘差比例,大小用1-R2來(lái)表示,該指標(biāo)越小,則說(shuō)明該自變量被其余變量預(yù)測(cè)的越精確,共線性可能越嚴(yán)重。如果自變

23、量的容忍度小于0.1,則可能存在共線性問(wèn)題。5 5 啞變量的設(shè)定2分類,可用一個(gè)(0,1)變量。如性別0 1 X男女 k分類,k-1個(gè)(0,1)變量,如血型。 多重線性回歸分析有時(shí)先將有序變量或無(wú)序多分類變量轉(zhuǎn)換成為多個(gè)二分類變量之后,才能將它們引入回歸模型。將有序變量或無(wú)序多分類變量轉(zhuǎn)換成為多個(gè)二分類變量的過(guò)程常被稱為“啞元化(dummying)”,得到的多個(gè)二分類變量稱為“啞變量(dummy variable)”。型非AAX101血型是一個(gè)無(wú)序多分類變量,它的取“值”是A、B、AB、O四種,可以用3個(gè)二分類變量來(lái)描述。令型非BBX102型非ABBAX1031X2X3XABABO表11-5

24、用二分類啞變量描述血型血型變量100010001000編號(hào) X1 X2 X3 Y 1 1 0 0 2 0 0 0 3 0 1 0 n 0 0 1 數(shù)據(jù)格式回歸方程 建立回歸方程建立回歸方程 0112233Ybb Xb Xb Xb1 :相當(dāng)相當(dāng)A 型相對(duì)于型相對(duì)于O 型的差別型的差別b2 :相當(dāng):相當(dāng)B 型相對(duì)于型相對(duì)于O 型的差別型的差別b3 :相當(dāng):相當(dāng)AB 型相對(duì)于型相對(duì)于O 型的差別型的差別 (2)等級(jí) 定量。 一般是將等級(jí)從弱到強(qiáng)轉(zhuǎn)換為 (或 )如文化程度分為小學(xué)、中學(xué)、大學(xué)、大學(xué)以上四個(gè)等級(jí)。Y為經(jīng)濟(jì)收入。1 1 2 3 X小 學(xué)中 學(xué)大 學(xué) 4 大 學(xué) 以 上 011Ybb X 解

25、釋:b(b1)反映X(X1) 增加1個(gè)單位, 增加b個(gè)單位(如:500元)。 表示中學(xué)文化較小學(xué)收入多500, 大學(xué)較中學(xué)多500,余類推。,3,2, 1X,2, 1 ,0XYb1,b2,b3分別反映中學(xué)、大學(xué)、大學(xué)以上相對(duì)于小分別反映中學(xué)、大學(xué)、大學(xué)以上相對(duì)于小學(xué)文化程度者經(jīng)濟(jì)收入差別的大小學(xué)文化程度者經(jīng)濟(jì)收入差別的大小也可將K個(gè)等級(jí)轉(zhuǎn)換為K-1個(gè)(0,1)變量為了檢驗(yàn)兩個(gè)自變量是否具有交互作用,為了檢驗(yàn)兩個(gè)自變量是否具有交互作用,普遍的做法是在方程中加入它們的乘積項(xiàng)。普遍的做法是在方程中加入它們的乘積項(xiàng)。6. 變量間的交互作用變量間的交互作用 例例2 2 某項(xiàng)研究調(diào)查了3334名有心臟疾患

26、的婦女,了解血清高密度脂蛋白膽固醇(HDL cholesterol,mg/dl)與體質(zhì)指數(shù)(body mass index, BMI, kg/m2)的關(guān)系,考慮到是否患糖尿?。―IABETES)也是影響HDL水平的因素,因此建立了一個(gè)以體質(zhì)指數(shù)、是否患糖尿病為自變量,HDL為反應(yīng)變量的線性回歸方程,結(jié)果如表13-4所示。表13-4 以體質(zhì)指數(shù)、是否患糖尿病為自變量的線性回歸方程變量bSEtP95%CIBMI-0.3910.017-22.5310.000-0.426-0.357DIABETES-4.7830.092-52.2070.000-4.962-4.603CONSTANT67.5510.3

27、63185.8470.00066.83968.264F=2441.323, P0.001; R2=0.594, adjR2=0.594, Root MSE=2.02模型假定HDL的平均水平隨BMI的變化而變化的規(guī)律在糖尿病婦女和非糖尿病組之間是相同的,表現(xiàn)為相同的偏回歸系數(shù) -0.391605040302010 70605040 糖尿病組非糖尿病組糖尿病組非糖尿病組 在多重線性回歸模型中引入一個(gè)新的自變量(DMBMI),定義為BMI和DIABETES的乘積,這個(gè)乘積項(xiàng)描述的是兩個(gè)自變量與反應(yīng)變量之間的關(guān)系。由于兩個(gè)自變量已經(jīng)在模型中,乘積項(xiàng)就可以解釋為交互作用。 表13-5 以體質(zhì)指數(shù)、是否患糖尿病為自變量,包含交互作用項(xiàng)的線性回歸結(jié)果VariablebSEtP95%CIDIABETES-11.3400.965-11.7550.001-

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論