數(shù)據(jù)分析spss作業(yè)匯總_第1頁
數(shù)據(jù)分析spss作業(yè)匯總_第2頁
數(shù)據(jù)分析spss作業(yè)匯總_第3頁
數(shù)據(jù)分析spss作業(yè)匯總_第4頁
數(shù)據(jù)分析spss作業(yè)匯總_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上數(shù)據(jù)分析方法及軟件應(yīng)用(作業(yè)) 題 目:4、8、13、16題 指導教師: 學 院:交通運輸學院姓 名: 學 號: 4、在某化工生產(chǎn)中為了提高收率,選了三種不同濃度,四種不同溫度做試驗。在同一濃度與溫度組合下各做兩次試驗,其收率數(shù)據(jù)如下面計算表所列。試在=0.05顯著性水平下分析(1)給出SPSS數(shù)據(jù)集的格式(列舉前3個樣本即可);(2)分析濃度對收率有無顯著影響;(3)分析濃度、溫度以及它們間的交互作用對收率有無顯著影響。解答:(1)分別定義分組變量濃度、溫度、收率,在變量視圖與數(shù)據(jù)視圖中輸入表格數(shù)據(jù),具體如下圖。(2)思路:本問是研究一個控制變量即濃度的不同水平是否

2、對觀測變量收率產(chǎn)生了顯著影響,因而應(yīng)用單因素方差分析。假設(shè):濃度對收率無顯著影響。步驟:【分析-比較均值-單因素】,將收率選入到因變量列表中,將濃度選入到因子框中,確定。輸出:變異數(shù)分析收率 平方和df平均值平方F顯著性群組之間39.083219.5425.074.016在群組內(nèi)80.875213.851總計119.95823顯著性水平為0.05,由于概率p值小于顯著性水平,則應(yīng)拒絕原假設(shè),認為濃度對收率有顯著影響。(3)思路:本問首先是研究兩個控制變量濃度及溫度的不同水平對觀測變量收率的獨立影響,然后分析兩個這控制變量的交互作用能否對收率產(chǎn)生顯著影響,因而應(yīng)該采用多因素方差分析。假設(shè),H01

3、:濃度對收率無顯著影響;H02:溫度對收率無顯著影響;H03:濃度與溫度的交互作用對收率無顯著影響。步驟:【分析-一般線性模型-單變量】,把收率制定到因變量中,把濃度與溫度制定到固定因子框中,確定。輸出:主旨間效果檢定因變數(shù): 收率 來源第 III 類平方和df平均值平方F顯著性修正的模型70.458a116.4051.553.230截距2667.04212667.042646.556.000濃度39.083219.5424.737.030溫度13.79234.5971.114.382濃度 * 溫度17.58362.931.710.648錯誤49.500124.125總計2787.00024校

4、正後總數(shù)119.95823a. R 平方 = .587(調(diào)整的 R 平方 = .209)第一列是對觀測變量總變差分解的說明;第二列是觀測變量變差分解的結(jié)果;第三列是自由度;第四列是均方;第五列是檢驗統(tǒng)計量的觀測值;第六列是檢驗統(tǒng)計量的概率值。可以看到觀測變量收率的總變差為119.958,由濃度不同引起的變差是39.083,由溫度不同引起的變差為13.792,由濃度和溫度的交互作用引起的變差為17.583,由隨機因素引起的變差為49.500。濃度,溫度和濃度*溫度的概率p值分別為0.030,0.382和0.648。濃度:顯著性<0.05說明拒絕原假設(shè)(濃度對收率無顯著影響),證明濃度對收率

5、有顯著影響;溫度:顯著性0.05說明不拒絕原假設(shè)(溫度對收率無顯著影響),證明溫度對收率無顯著影響;濃度與溫度: 顯著性0.05說明不拒絕原假設(shè)(濃度與溫度的交互作用對收率無顯著影響),證明溫濃度與溫度的交互作用對收率無顯著影響。8、以高??蒲醒芯繑?shù)據(jù)為例:以課題總數(shù)X5為被解釋變量,解釋變量為投入人年數(shù)X2、投入科研事業(yè)費X4、專著數(shù)X6、獲獎數(shù)X8;建立多元線性回歸模型,分析它們之間的關(guān)系。解釋變量采用逐步篩選策略,并做多重共線性、方差齊性和殘差的自相關(guān)性檢驗。解答:思路:根據(jù)要求采用逐步篩選的解釋變量篩選策略,利用回歸分析方法建立多元線性回歸模型,分析它們之間的關(guān)系,并且要求做多重共線性

6、、方差齊性和殘差的自相關(guān)性檢驗。(1)步驟:【分析-回歸-線性】,X5選入因變量,X2、X4、X6、X8選入自變量,方法選擇【逐步】?!窘y(tǒng)計量】勾選【估計】、【模型擬合度】、【共線性診斷】與【Durbin-Waston(U)】?!纠L制(T)按鈕】,將*ZRESID添加到Y(jié)(Y)框中,將*ZPRED添加到X2(X)框中,勾選【正態(tài)概率圖】,【保存(S)】按鈕。在預測值與殘差中勾選【標準化】選項。選擇菜單【分析相關(guān)雙變量】將標準化預測值和標準化殘差選入【變量】框,在相關(guān)系數(shù)中選擇Spearman,各項完成后點擊【確定】。輸出:變數(shù)已輸入/已移除a模型變數(shù)已輸入變數(shù)已移除方法1投入人年數(shù).逐步(準則

7、:F-to-enter 的機率 <= .050,F(xiàn)-to-remove 的機率 >= .100)。a. 應(yīng)變數(shù): 課題總數(shù)模型摘要b模型RR 平方調(diào)整後 R 平方標準偏斜度錯誤Durbin-Watson1.959a.919.917241.95821.747a. 預測值:(常數(shù)),投入人年數(shù)b. 應(yīng)變數(shù): 課題總數(shù)表中變量為投入人年數(shù),參考調(diào)整的判定系數(shù),由于調(diào)整的判定系數(shù)(0.917)較接近于1,因此認為擬合優(yōu)度較高,被解釋變量可以被模型解釋的部分較多,未能被解釋的部分較少。方程DW檢驗值為1.747,殘差存在一定的正自相關(guān)。變異數(shù)分析a模型平方和df平均值平方F顯著性1迴歸.04

8、71.047331.018.000b殘差.9532958543.791總計.00030a. 應(yīng)變數(shù): 課題總數(shù)b. 預測值:(常數(shù)),投入人年數(shù)被解釋變量的總離差平方和為.00,回歸平方和及均方分別為.047 和.047,剩余平方和及均方分別為.953和58543.791,𝑭檢驗統(tǒng)計量的觀測值為331.018,對應(yīng)的概率𝒑值近似為0。依據(jù)該表可進行回歸方程的顯著性檢驗。如果顯著性水平𝜶為0.05,由于概率𝒑值小于顯著性水平𝜶 ,應(yīng)拒絕回歸方程顯著性檢驗的零假設(shè),認為回歸系數(shù)不為0,被解釋變量與解釋變量的線性關(guān)系是顯

9、著的,可建立線性模型。係數(shù)a模型非標準化係數(shù)標準化係數(shù)T顯著性共線性統(tǒng)計資料B標準錯誤Beta允差VIF1(常數(shù))-94.52472.442-1.305.202投入人年數(shù).492.027.95918.194.0001.0001.000a. 應(yīng)變數(shù): 課題總數(shù)依據(jù)該表可以進行回歸系數(shù)顯著性檢驗,寫出回歸方程和檢測多重共線性??梢钥吹剑绻@著性水平𝜶為0.05,投入人年數(shù)變量的回歸系數(shù)顯著性t檢驗的概率p值小于顯著性水平𝜶,因此拒絕零假設(shè),認為其偏回歸系數(shù)與0有顯著差異,與被解釋變量與解釋變量的線性關(guān)系是顯著的,應(yīng)保留在方程中。同時從容忍度和方差膨脹因子看,解釋變

10、量與投入人年數(shù)多重共線性很弱,可以建立模型。最終回歸方程為,課題總數(shù)= -94.524+0.492投入人年數(shù)。排除的變數(shù)a模型Beta 入T顯著性偏相關(guān)共線性統(tǒng)計資料允差VIF允差下限1投入科研事業(yè)費(百元).152b1.528.138.278.2673.748.267專著數(shù).023b.182.857.034.1885.308.188獲獎數(shù).030b.411.684.077.5421.846.542a. 應(yīng)變數(shù): 課題總數(shù)b. 模型中的預測值:(常數(shù)),投入人年數(shù)該表展示回歸方程的剔除變量,可以看到,如果顯著性水平𝜶為0.05,表中三個變量的回歸系數(shù)顯著性t檢驗的概率p值大于顯

11、著性水平𝜶,因此不拒絕零假設(shè),認為其偏回歸系數(shù)與0無顯著差異,與被解釋變量與解釋變量的線性關(guān)系是不顯著的,不應(yīng)保留在方程中。同時從容忍度和方差膨脹因子看,解釋變量與三個解釋變量多重共線性嚴重,在建立模型的時候應(yīng)當被剔除。共線性診斷a模型維度特徵值條件指數(shù)變異數(shù)比例(常數(shù))投入人年數(shù)111.8001.000.10.102.2003.001.90.90a. 應(yīng)變數(shù): 課題總數(shù)依據(jù)該表可進行多重共線性檢測,從方差比例上看第二個變量可解釋常量的90%,也可解釋投入人年數(shù)的90%,一次認為這些變量存在多重共線性。條件指數(shù)都小于10,說明存在共線性較弱,低個變量特征值小于0.7,說明線性相

12、關(guān)關(guān)系較弱。殘差統(tǒng)計資料a最小值最大值平均數(shù)標準偏差N預測值-57.6423246.986960.000803.721331殘差-466.2850509.6787.0000237.891431標準預測值-1.2662.845.0001.00031標準殘差-1.9272.106.000.98331a. 應(yīng)變數(shù): 課題總數(shù)數(shù)據(jù)點圍繞基準線還存在一定的規(guī)律性,但標準化殘差的非參數(shù)檢驗結(jié)果表明標準化殘差與標準正態(tài)分布不存在顯著差異,可以認為殘差滿足了線性模型的前提要求。隨著標準化預測值的變化,殘差點在0線周圍隨機分布,但殘差的等方差性并不完全滿足,方差似乎有增大的趨勢。但計算殘差與預測值的Spearm

13、an等級相關(guān)系數(shù)為-0.176,且檢驗并不顯著,因此認為異方差現(xiàn)象并不明顯。相關(guān)Standardized Predicted ValueStandardized ResidualSpearman 的 rhoStandardized Predicted Value相關(guān)係數(shù)1.000-.176顯著性 (雙尾).344N3131Standardized Residual相關(guān)係數(shù)-.1761.000顯著性 (雙尾).344.N3131依據(jù)該表可以對標準化殘差和標準化預測值的Spearman等級進行分析,可以看到,計算殘差與預測值的相關(guān)性弱,認為異方差現(xiàn)象不明顯。13、利用1950年1990年的天津食品

14、消費數(shù)據(jù),分析這段時間內(nèi)的人均生活費用年收入的變化情況。要求:數(shù)據(jù)進行對數(shù)變換后,運用Holt線性趨勢平滑模型分析。(1)輸出均方根誤差和參數(shù)估計結(jié)果;(2)輸出ACF和PACF圖形并對其特征進行分析,是否滿足白噪聲序列的條件;(3)給出1991-1992的預測值,并輸出擬合圖。解答:思路:根據(jù)題意,先不進行序列圖和自相關(guān)、偏自相關(guān)的觀察和檢驗階段處理。直接利用指數(shù)平滑模型中的Holt線性趨勢模型對數(shù)據(jù)進行分析,同時輸出均方根誤差和參數(shù)估計誤差,ACF和PACF圖像判斷是否滿足白噪音序列的條件;最后然后對數(shù)據(jù)進行1991年、1992年做出預測,并用模型進行擬合。步驟:【分析-預測-創(chuàng)建模型】,

15、將人均生活費年收入選入【因變量】中,將【方法】選為【指數(shù)平滑法】;點擊【條件】,在【因變量轉(zhuǎn)換】中選【自然對數(shù)】,在【模型類型】中【Holt線性趨勢】,【繼續(xù)】?!窘y(tǒng)計量】,在【擬合度量】中選擇【平穩(wěn)的R方、均方根誤差】,在【個別模型的統(tǒng)計量】中選中【參數(shù)估計】,在【比較模型的統(tǒng)計量】中選中【擬合優(yōu)度】,選中【顯示預測值】,【確定】【圖表】,在【單個模型圖】中選擇【序列、殘差自相關(guān)函數(shù)、殘差部分自相關(guān)函數(shù)】,在【每張圖顯示的內(nèi)容】中現(xiàn)則【觀察值、預測值、擬合值】?!具x項】,在【預測階段】選擇第二個,在【日期】的【年】框中填入【1992】。輸出:模型適合度適合度統(tǒng)計資料平均數(shù)SE最小值最大值百分

16、位數(shù)5102550759095平穩(wěn) R 平方.221.221.221.221.221.221.221.221.221.221R 平方.994.994.994.994.994.994.994.994.994.994RMSE28.179.28.17928.17928.17928.17928.17928.17928.17928.17928.179MAPE3.517.3.5173.5173.5173.5173.5173.5173.5173.5173.517MaxAPE12.495.12.49512.49512.49512.49512.49512.49512.49512.49512.495MAE17.1

17、46.17.14617.14617.14617.14617.14617.14617.14617.14617.146MaxAE82.911.82.91182.91182.91182.91182.91182.91182.91182.91182.911標準化 BIC6.858.6.8586.8586.8586.8586.8586.8586.8586.8586.858模型統(tǒng)計資料模型預測變數(shù)數(shù)目模型適合度統(tǒng)計資料Ljung-Box Q(18)離群值數(shù)目平穩(wěn) R 平方RMSE統(tǒng)計資料DF顯著性人均生活費年收入-模型_10.22128.17916.36016.4280均方根誤差為28.179,誤差較小。指

18、數(shù)平滑化模型參數(shù)模型估計SET顯著性人均生活費年收入-模型_1自然對數(shù)Alpha(水準)1.000.1576.381.000Gamma(趨勢).400.1782.244.031模型的兩個參數(shù)分別為:1.0和0.4,則具體模型為ft+m=1.0+0.4m, 雖然殘差自相關(guān)函數(shù)和偏自相關(guān)函數(shù)絕大多數(shù)處于置信區(qū)間內(nèi),但兩函數(shù)都具有明顯減少趨勢,且具有一定的季節(jié)性,因此不屬于白噪音序列。預測模型19911992人均生活費年收入-模型_1預測1708.821920.58UCL1887.022274.43LCL1543.631609.99針對每一個模型,預測是在所要求的估計期間範圍內(nèi)的前次非遺漏開始,並在

19、其所有預測值的非遺漏值可用的前次期間,或是在所要求的預測期間的結(jié)束日期結(jié)束,取較早的時間。1991、1992年的預測值與1990年的觀測值有較大的增長趨勢。從整個數(shù)據(jù)來看,1950年至1980年這段時期較為平穩(wěn)的增長,但是1980年之后迅速上升,最后預測值上升較為明顯,這與實際趨勢基本一致。且1991、1992年預測值分別為1708.82、1920.58。16、結(jié)合自己的研究方向、參與項目等,舉出一個說明SPSS在交通運輸中應(yīng)用的例子。例子需包含問題說明、數(shù)據(jù)來源、統(tǒng)計方法、統(tǒng)計結(jié)果及其主要結(jié)論。解答:問題說明:利用1950年2013年美國么歷年定期航班旅客周轉(zhuǎn)量(單位:“臺億客公里)歷年數(shù)據(jù)

20、數(shù)據(jù),建立幾種指數(shù)平滑模型,預測2016年美國定期航班旅客周轉(zhuǎn)量。數(shù)據(jù)來源:從統(tǒng)計看民航(2014)中國民航出版社,2014年11月第一版。年份1950195119521953195419551956195719581959定期航班旅客周轉(zhuǎn)量/億客公里164.4211.8250.3292.1331.6391.8444.5503506.9585.3年份1960196119621963196419651966196719681969定期航班旅客周轉(zhuǎn)量/億客公里625.4640.9704.2810.4941.31105.21285.71605.81830.72017.3年份1970197119721

21、973197419751976197719781979定期航班旅客周轉(zhuǎn)量/億客公里2131.32155.914532606262126202882311036404080年份1980198119821983198419851986198719881989定期航班旅客周轉(zhuǎn)量/億客公里3930395041004460472052795800647067436948年份1990199119921993199419951996199719981999定期航班旅客周轉(zhuǎn)量/億客公里731471837651.477598199.88491.69214.89655.7984710448.7年份20002001

22、20022003200420052006200720082009定期航班旅客周轉(zhuǎn)量/億客公里11109.510444.810218.410389.611643.712446.912753.813120.51279012570年份2010201120122013定期航班旅客周轉(zhuǎn)量/億客公里12998.713105.413247.513525.2解題思路:首先首先繪制和觀察彩電出口量的序列圖,通過圖形觀察和檢驗尋找規(guī)律,然后通過指數(shù)平滑模型簡單、HOIT線性趨勢、Brown線性趨勢三個模型進行分析預測,比較選擇最佳模型預測2016年億客公里數(shù)。統(tǒng)計結(jié)果:美國億客公里時間序列圖如下:該序列圖為平穩(wěn)序

23、列則可以直接進行建模分析。(1)簡單指數(shù)平滑模型型號說明模型類型模型 ID億客公里模型_1簡單模型統(tǒng)計資料模型預測變數(shù)數(shù)目模型適合度統(tǒng)計資料Ljung-Box Q(18)離群值數(shù)目平穩(wěn) R 平方RMSE統(tǒng)計資料DF顯著性億客公里-模型_10-.417367.91812.51117.0460指數(shù)平滑化模型參數(shù)模型估計SET顯著性億客公里-模型_1自然對數(shù)Alpha(水準)1.000.1228.175.000預測模型201420152016億客公里-模型_1預測13638.2113752.1613867.06UCL17502.4819474.7921137.62LCL10451.729393.22

24、8654.28針對每一個模型,預測是在所要求的估計期間範圍內(nèi)的前次非遺漏開始,並在其所有預測值的非遺漏值可用的前次期間,或是在所要求的預測期間的結(jié)束日期結(jié)束,取較早的時間。(2)HOIT線性趨勢指數(shù)平滑模型型號說明模型類型模型 ID億客公里模型_1Holt模型統(tǒng)計資料模型預測變數(shù)數(shù)目模型適合度統(tǒng)計資料Ljung-Box Q(18)離群值數(shù)目平穩(wěn) R 平方RMSE統(tǒng)計資料DF顯著性億客公里-模型_10.610417.99015.33616.0500指數(shù)平滑化模型參數(shù)模型估計SET顯著性億客公里-模型_1自然對數(shù)Alpha(水準).694.1185.893.000Gamma(趨勢).117.0621.895.063預測模型201420152016億客公里-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論