




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、SPSS-回歸-多元線性回歸模型案例解析!(一) 多元線性回歸,主要是研究一個因變量與多個自變量之間的相關(guān)關(guān)系,跟一元回歸原理差不多,區(qū)別在于影響因素(自變量)更多些而已,例如:一元線性回歸方程 為: 毫無疑問,多元線性回歸方程應(yīng)該為:上圖中的 x1, x2, xp分別代表“自變量”Xp截止,代表有P個自變量,如果有“N組樣本,那么這個多元線性回歸,將會組成一個矩陣,如下圖所示:那么,多元線性回歸方程矩陣形式為: 其中: 代表隨機(jī)誤差, 其中隨機(jī)誤差分為
2、:可解釋的誤差 和 不可解釋的誤差,隨機(jī)誤差必須滿足以下四個條件,多元線性方程才有意義(一元線性方程也一樣)1:服成正太分布,即指:隨機(jī)誤差必須是服成正太分別的隨機(jī)變量。2:無偏性假設(shè),即指:期望值為03:同共方差性假設(shè),即指,所有的 隨機(jī)誤差變量方差都相等4:獨(dú)立性假設(shè),即指:所有的隨機(jī)誤差變量都相互獨(dú)立,可以用協(xié)方差解釋。 今天跟大家一起討論一下,SPSS-多元線性回歸的具體操作過程,下面以教程教程數(shù)據(jù)為例,分析汽車特征與汽車銷售量之間的關(guān)系。通過分析汽車特征跟汽車銷售量的關(guān)系,建立擬合多元線性回歸模型。數(shù)據(jù)如下圖所示: 點(diǎn)擊“分析”回歸線性進(jìn)
3、入如下圖所示的界面: 將“銷售量”作為“因變量”拖入因變量框內(nèi), 將“車長,車寬,耗油率,車凈重等10個自變量 拖入自變量框內(nèi),如上圖所示,在“方法”旁邊,選擇“逐步”,當(dāng)然,你也可以選擇其它的方式,如果你選擇“進(jìn)入”默認(rèn)的方式,在分析結(jié)果中,將會得到如下圖所示的結(jié)果:(所有的自變量,都會強(qiáng)行進(jìn)入)如果你選擇“逐步”這個方法,將會得到如下圖所示的結(jié)果:(將會根據(jù)預(yù)先設(shè)定的“F統(tǒng)計(jì)量的概率值進(jìn)行篩選,最先進(jìn)入回歸方程的“自變量”應(yīng)該是跟“因變量”關(guān)系最為密切,貢獻(xiàn)最大的,如下圖可以看出,車的價格和車軸 跟因變量關(guān)系最為密切,符合判斷條件的概率值必須小于0.05,當(dāng)概率值大于等于0.1時
4、將會被剔除)“選擇變量(E)" 框內(nèi),我并沒有輸入數(shù)據(jù),如果你需要對某個“自變量”進(jìn)行條件篩選,可以將那個自變量,移入“選擇變量框”內(nèi),有一個前提就是:該變量從未在另一個目標(biāo)列表中出現(xiàn)!,再點(diǎn)擊“規(guī)則”設(shè)定相應(yīng)的“篩選條件”即可,如下圖所示: 點(diǎn)擊“統(tǒng)計(jì)量”彈出如下所示的框,如下所示:在“回歸系數(shù)”下面勾選“估計(jì),在右側(cè)勾選”模型擬合度“ 和”共線性診斷“ 兩個選項(xiàng),再勾選“個案診斷”再點(diǎn)擊“離群值”一般默認(rèn)值為“3”,(設(shè)定異常值的依據(jù),只有當(dāng)殘差超過3倍標(biāo)準(zhǔn)差的觀測才會被當(dāng)做異常值) 點(diǎn)擊繼續(xù)。提示:共線性檢驗(yàn),如果有兩個或兩個以上的自變量之間存在線性相關(guān)關(guān)系,就會產(chǎn)生
5、多重共線性現(xiàn)象。這時候,用最小二乘法估計(jì)的模型參數(shù)就會不穩(wěn)定,回歸系數(shù)的估計(jì)值很容易引起誤導(dǎo)或者導(dǎo)致錯誤的結(jié)論。所以,需要勾選“共線性診斷”來做判斷 通過容許度可以計(jì)算共線性的存在與否? 容許度TOL=1-RI平方 或方差膨脹因子(VIF): VIF=1/1-RI平方,其中RI平方是用其他自變量預(yù)測第I個變量的復(fù)相關(guān)系數(shù),顯然,VIF為TOL的倒數(shù),TOL的值越小,VIF的值越大,自變量XI與其他自變量之間存在共線性的可能性越大。提供三種處理方法:1:從有共線性問題的變量里刪除不重要的變量2:增加樣本量或重新抽取樣本。3:采用其他方法擬合模型,如領(lǐng)回歸法,逐步回歸法,主
6、成分分析法。再點(diǎn)擊“繪制”選項(xiàng),如下所示: 上圖中:DEPENDENT( 因變量) ZPRED(標(biāo)準(zhǔn)化預(yù)測值) ZRESID(標(biāo)準(zhǔn)化殘差) DRESID(剔除殘差) ADJPRED(修正后預(yù)測值) SRSID(學(xué)生化殘差) SDRESID(學(xué)生化剔除殘差) 一般我們大部分以“自變量”作為 X 軸,用“殘差”作為Y軸, 但是,也不要忽略特殊情況,這里我們以“ZPRED(標(biāo)準(zhǔn)化預(yù)測值)作為"x" 軸,分別用“SDR
7、ESID(血生化剔除殘差)”和“ZRESID(標(biāo)準(zhǔn)化殘差)作為Y軸,分別作為兩組繪圖變量。再點(diǎn)擊”保存“按鈕,進(jìn)入如下界面: 如上圖所示:勾選“距離”下面的“cook距離”選項(xiàng) (cook 距離,主要是指:把一個個案從計(jì)算回歸系數(shù)的樣本中剔除時所引起的殘差大小,cook距離越大,表明該個案對回歸系數(shù)的影響也越大)在“預(yù)測區(qū)間”勾選“均值”和“單值” 點(diǎn)擊“繼續(xù)”按鈕,再點(diǎn)擊“確定按鈕,得到如下所示的分析結(jié)果:(此分析結(jié)果,采用的是“逐步法”得到的結(jié)果)SPSS回歸多元線性回歸結(jié)果分析(二),最近一直很忙,公司的潮起潮落,就好比人生的跌巖起伏,眼看著一步步走向衰弱,卻無能為力,也許要學(xué)
8、習(xí)“步步驚心”里面“四阿哥”的座右銘:“行到水窮處”,”坐看云起時“。 接著上一期的“多元線性回歸解析”里面的內(nèi)容,上一次,沒有寫結(jié)果分析,這次補(bǔ)上,結(jié)果分析如下所示:結(jié)果分析1:由于開始選擇的是“逐步”法,逐步法是“向前”和“向后”的結(jié)合體,從結(jié)果可以看出,最先進(jìn)入“線性回歸模型”的是“price in thousands" 建立了模型1,緊隨其后的是“Wheelbase" 建立了模型2,所以,模型中有此方法有個概率值,當(dāng)小于等于0.05時,進(jìn)入“線性回歸模型”(最先進(jìn)入模型的,相關(guān)性最強(qiáng),
9、關(guān)系最為密切)當(dāng)大于等0.1時,從“線性模型中”剔除結(jié)果分析:1:從“模型匯總”中可以看出,有兩個模型,(模型1和模型2)從R2 擬合優(yōu)度來看,模型2的擬合優(yōu)度明顯比模型1要好一些(0.422>0.300)2:從“Anova"表中,可以看出“模型2”中的“回歸平方和”為115.311,“殘差平方和”為153.072,由于總平方和=回歸平方和+殘差平方和,由于殘差平方和(即指隨即誤差,不可解釋的誤差)由于“回歸平方和”跟“殘差平方和”幾乎接近,所有,此線性回歸模型只解釋了總平方和的一半,3:根據(jù)后面的“F統(tǒng)計(jì)量”的概率值為0.00,由于0.00<0.01,隨著“自變量”的引
10、入,其顯著性概率值均遠(yuǎn)小于0.01,所以可以顯著地拒絕總體回歸系數(shù)為0的原假設(shè),通過ANOVA方差分析表可以看出“銷售量”與“價格”和“軸距”之間存在著線性關(guān)系,至于線性關(guān)系的強(qiáng)弱,需要進(jìn)一步進(jìn)行分析。 結(jié)果分析:1:從“已排除的變量”表中,可以看出:“模型2”中各變量的T檢的概率值都大于“0.05”所以,不能夠引入“線性回歸模型”必須剔除。 從“系數(shù)a” 表中可以看出:1:多元線性回歸方程應(yīng)該為:銷售量=-1.822-0.055*價格+0.061*軸距但是,由于常數(shù)項(xiàng)的sig為(0.116>0.1) 所以常數(shù)項(xiàng)不具備顯著性,所以,我們再看后面的“標(biāo)準(zhǔn)系數(shù)
11、”,在標(biāo)準(zhǔn)系數(shù)一列中,可以看到“常數(shù)項(xiàng)”沒有數(shù)值,已經(jīng)被剔除所以:標(biāo)準(zhǔn)化的回歸方程為:銷售量=-0.59*價格+0.356*軸距2:再看最后一列“共線性統(tǒng)計(jì)量”,其中“價格”和“軸距”兩個容差和“vif都一樣,而且VIF都為1.012,且都小于5,所以兩個自變量之間沒有出現(xiàn)共線性,容忍度和膨脹因子是互為倒數(shù)關(guān)系,容忍度越小,膨脹因子越大,發(fā)生共線性的可能性也越大 從“共線性診斷”表中可以看出:1:共線性診斷采用的是“特征值”的方式,特征值主要用來刻畫自變量的方差,診斷自變量間是否存在較強(qiáng)多重共線性的另一種方法是利用主成分分析法,基本思想是:如果自變量間確實(shí)存在較強(qiáng)的相關(guān)關(guān)
12、系,那么它們之間必然存在信息重疊,于是就可以從這些自變量中提取出既能反應(yīng)自變量信息(方差),而且有相互獨(dú)立的因素(成分)來,該方法主要從自變量間的相關(guān)系數(shù)矩陣出發(fā),計(jì)算相關(guān)系數(shù)矩陣的特征值,得到相應(yīng)的若干成分。從上圖可以看出:從自變量相關(guān)系數(shù)矩陣出發(fā),計(jì)算得到了三個特征值(模型2中),最大特征值為2.847, 最小特征值為0.003條件索引=最大特征值/相對特征值 再進(jìn)行開方 (即特征值2的 條件索引為 2.847/0.150 再開方=4.351)標(biāo)準(zhǔn)化后,方差為1,每一個特征值都能夠刻畫某自變量的一定比例,所有的特征值能將刻畫某自變量信息的全部,于是,我們可以得到以下結(jié)論:1:價格在方差標(biāo)準(zhǔn)化后,第一個特征值解釋了其方差的0.02, 第二個特征值解釋了0.97,第三個特征值解釋了0.002:軸距在方差標(biāo)準(zhǔn)化后,第一個特征值解釋了其方差
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年工程經(jīng)濟(jì)考試的知識負(fù)擔(dān)試題及答案
- 2024水利水電工程實(shí)務(wù)考試試題及答案
- 2025企業(yè)郵件服務(wù)合同樣本
- 水利水電工程研究方向試題及答案
- 2025供暖系統(tǒng)安裝工程合同書
- 市政工程國際交流與試題答案匯聚
- 水利水電工程水力學(xué)基礎(chǔ)試題及答案
- 工程項(xiàng)目的利益沖突案例試題及答案
- 2025標(biāo)準(zhǔn)的企業(yè)租賃合同
- 公共關(guān)系的傳播模型試題及答案
- 家長開放日家長意見反饋表
- 初中英語2023年中考專題訓(xùn)練任務(wù)型閱讀-完成表格篇
- 數(shù)據(jù)中臺-項(xiàng)目需求規(guī)格說明書
- 田徑運(yùn)動會檢查員報(bào)告表
- 高級政工師職稱面試題
- 老年人能力評估師高級第六章-需求評估
- 業(yè)主維權(quán)授權(quán)委托書范文
- 第四代EGFR-C797S藥物管線及專利調(diào)研報(bào)告
- 骨科基礎(chǔ)知識解剖篇
- 梁山伯與祝英臺小提琴譜樂譜
- 有機(jī)硅化學(xué)課件-有機(jī)硅化合物的化學(xué)鍵特性
評論
0/150
提交評論