工學(xué)Matlab與統(tǒng)計分析_第1頁
工學(xué)Matlab與統(tǒng)計分析_第2頁
工學(xué)Matlab與統(tǒng)計分析_第3頁
工學(xué)Matlab與統(tǒng)計分析_第4頁
工學(xué)Matlab與統(tǒng)計分析_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、Matlab與統(tǒng)計分析一、 回歸分析1、多元線性回歸1.1 命令 regress( ), 實現(xiàn)多元線性回歸,調(diào)用格式為b,bint,r,rint,stats=regress(y,x,alpha)其中因變量數(shù)據(jù)向量Y和自變量數(shù)據(jù)矩陣x按以下排列方式輸人對一元線性回歸,取k=1即可。alpha為顯著性水平(缺省時設(shè)定為0.05),輸出向量b,bint為回歸系數(shù)估計值和它們的置信區(qū)間,r,rint為殘差及其置信區(qū)間,stats是用于檢驗回歸模型的統(tǒng)計量,有三個數(shù)值,第一個是, 其中R是相關(guān)系數(shù),第二個是F統(tǒng)計量值,第三個是與統(tǒng)計量F對應(yīng)的概率P,當 時拒絕,回歸模型成立.注:1、兩組數(shù)據(jù)的相關(guān)系數(shù)在

2、概率論的標準定義是:R= E(x - Ex) * (y - Ey) / (sqrt(x - Ex)2) * sqrt(y - Ey)2)E求取期望值。也就是兩組數(shù)據(jù)協(xié)方差與兩者標準差乘積的商。如果|R|=1說明兩者相關(guān),R=0說明兩者不相關(guān).1、 F是方差分析中的一個指標,一般方差分析是比較組間差異的。F值越大,P值越小,表示結(jié)果越可靠.1.2 命令 rcoplot(r,rint),畫出殘差及其置信區(qū)間.1.3 實例 1已知某胡八年來湖水中COD濃度實測值(v)與影響因素湖區(qū)工業(yè)產(chǎn)值(x1)、總?cè)丝跀?shù)(x2 )、捕魚量(x3 )、降水量( x4)資料,建立污染物Y的水質(zhì)分析模型.Step 1

3、輸入數(shù)據(jù)x1=1.376, 1.375, 1.387, 1.401, 1.412, 1.428, 1.445, 1.477;x2=0.450,0.475,0.485,0.500,0.535,0.545,0.550,0.575;x3=2.170,2.554,2.676,2.713,2.823,3.088,3.122,3.262;x4=0.8922, 1.1610,0.5346,0.9589, 1.0239, 10499,1.1065, 1.1387;Y=5.19, 5.30,5.60,5.82,6.00,6.06,6.45,6.95;Step 2 保存數(shù)據(jù)(以數(shù)據(jù)文件.mat 形式保存,便于以后

4、調(diào)用)save data x1 x2 x3 x4 yload data %取出數(shù)據(jù)Step 3 執(zhí)行回歸命令x=ones(8,1),x1,x2,x3,x4;b,bint,r,rint,stats=regress(y,x)得到結(jié)果:b=(-16.5283, 15.7206, 2.0327-0.2106,-0.1991)'stats=(0.9908,80.9530,0.0022)'即Y= -16.5283+15.7206x1+2.0327x2-0.2106xl+0.1991x4=0.9908, F=80.9530,P=0.00222、 非線性回歸2.1 命令 nlinfit( )

5、實現(xiàn)非線性回歸,調(diào)用格式為beta,r,J=nlinfit(x,y,model,beta0)其中,輸入數(shù)據(jù)x,y分別為n×m矩陣和n維列向量,對一元非線性回歸,x為n維列向量;model是事先用m-文件定義的非線性函數(shù),beta0是回歸系數(shù)的初值beta是估計出的回歸系數(shù),r是殘差,J是Jacobian矩陣,它們是估計預(yù)測誤差需要的數(shù)據(jù).2.2 命令 nlpredci( ) 預(yù)測和預(yù)測誤差的估計,調(diào)用格式為y,delta=npredci('model',x,beta,r,j)2.3 實例 2 對實例1中COD濃度實測值(Y),建立時序預(yù)測模型,這里選用logistic

6、模型,即Step 1 建立非線性函數(shù) 對所要擬合的非線性模型建立m-文件model.m如下function yhat=model(beta,t)yhat=beta(1).(1+beta(2)*exp(-beta(3)*t)Step 2 輸入數(shù)據(jù)t= 1:8load data y(在datamat中取出數(shù)據(jù)y)beta0=50,10,1Step 3 求回歸系數(shù)beta,r,J=nlinfit(t,Y,model, beta0)得結(jié)果:beta=(56.1157,10.4006,0.0445)即Step 4 預(yù)測及作圖YY,delta=nlpredci(model,x',beta,r ,J

7、);plot(x,y,'k+',x,YY,'r')3、 逐步回歸逐步回歸的命令是stepwise, 它提供了一個交互式畫面通過此工具可自由地選擇變量,進行統(tǒng)計分析.調(diào)用格式為:stepwise(x,y,inmodel,alpha)其中x是自變量數(shù)據(jù),是階矩陣,y是因變量數(shù)據(jù),階矩陣,inmodel是矩陣的列數(shù)指標(給出初始模型中包括的子集(缺省時設(shè)定為全部自變量),alpha是顯著性水平(缺省時為0.5). 運行stepwise命令時產(chǎn)生三個圖形窗口:Stepwise Plot,Stepwise Table,Stepwise History.在Stepwise

8、Plot窗口,顯示出各項的回歸系數(shù)及其置信區(qū)間.Stepwise Table 窗口中列出了一個統(tǒng)計表,包括回歸系數(shù)及其置信區(qū)間,以及模型的統(tǒng)計量剩余標準差(RMSE)、相關(guān)系數(shù)(R-square)、F值、與F對應(yīng)的概率P.2、 主成分分析這里給出江蘇省生態(tài)城市主成份分析實例。我們對江蘇省十個城市的生態(tài)環(huán)境狀況進行了調(diào)查,得到生態(tài)環(huán)境指標的指數(shù)值,見表1?,F(xiàn)對生態(tài)環(huán)境水平進行分析和評價。我們利用Matlab65中的princomp命令實現(xiàn)。具體程序如下x=07883 07391 08111 06587 06543 08259 08486 06834 08495 0784607633 07287

9、07629 08552 07564 07455 07800 09490 08918 0895404745 05126 08810 08903 08288 07850 08032 08862 03987 0397008246 07603 06888 08977 07926 07856 06509 08902 06799 0987708791 08736 08183 09446 09202 09263 09185 09505 08620 0887309538 09257 09285 09434 09154 08871 09357 08760 09579 0974108785 08542 08537

10、 09027 08729 08485 08473 09044 08866 0903506305 06187 06313 07415 06398 06142 05734 08980 06186 0738208928 07831 05608 08419 08464 07616 08234 06384 09604 08514x=x'stdr=std(x); 求各變量標準差n,m=size(x);sddata= x.stdr(ones(n,1),:); 標準化變換p,princ,egenvalue=princomp(sddata) 調(diào)用主成分分析程序p3=p(:,1:3) 輸出前三個主成分系數(shù)

11、sc=princ(:,1:3) 輸出前三個主成分得分egenvalue 輸出特征根per=100*egenvaluesum(egenvalue) 輸出各個主成分貢獻率執(zhí)行后得到所要結(jié)果,這里是前三個主成分、主成分得分、特征根。即egenvalue=38811,26407,10597' , per=4312,2934,11971' 這樣,前三個主成分為Zl = -03677xl+ 03702x2+ 01364x3+ 04048x4+ 03355x5-01318x6+04236x7+ 04815x8-00643x9Z2 = 01442xl+ 02313x2-05299x3+ 018

12、12x4-01601x5+ 05273x6+03116x7-00267x8+ 04589x9Z3 = -03282xl-03535x2+ 00498x3+ 00582x4+ 05664x5-00270x6-00958x7-02804x8+ 05933x9第一主成分貢獻率為43.12,第二主成分貢獻率為29.34,第三主成分貢獻率為11.97,前三個主成分累計貢獻率達8424。如果按80 以上的信息量選取新因子,則可以選取前三個新因子。第一新因子Z1包含的信息量最大為43.12,它的主要代表變量為x8(城市文明)、x7(生產(chǎn)效率)、 x4(城市綠化),其權(quán)重系數(shù)分別為04815、04236、04

13、048,反映了這三個變量與生態(tài)環(huán)境水平密切相關(guān),第二新因子Z2包含的信息量次之為2934,它的主要代表變量為x3(地理結(jié)構(gòu))、x6(資源配置)、 x9(可持續(xù)性),其權(quán)重系數(shù)分別為05299、05273、04589,第三新因子 Z3包含的信息量為1197,代表總量為 x9(可持續(xù)性)、 x5(物質(zhì)還原),權(quán)重系數(shù)分別為05933、05664。這些代表變量反映了各自對該新因子作用的大小,它們是生態(tài)環(huán)境系統(tǒng)中最重要的影響因素。根據(jù)前三個主成分得分,用其貢獻率加權(quán),即得十個城市各自的總得分F = 4312princ(:,1)+2934princ(:,2)+1197princ(:,3) =00970,

14、-06069,-15170,11801,00640,-08178,-09562,11383,01107,13077'根據(jù)總得分排序,結(jié)果見表1。3、 聚類分析我們對蘇州所轄張家港市2003年七條河流中主要污染因子(指標),即CODmn,BOD5,非離子氨,氨氮,揮發(fā)酚,石油類共6個變量(資料見表2,來源于張家港市2003年環(huán)境質(zhì)量報告書),進行聚類分析。我們利用Matlab65中的cluster命令實現(xiàn)。具體程序如下x= 3.14 8.41 23.78 25.79 4.17 6.47 5.47 9.57 26.48 23.79 6.42 6.58 3.1 4.31 21.2 22.48

15、 5.34 6.54 5.67 9.54 10.23 20.87 4.2 6.8 6.81 9.05 16.18 24.56 5.2 5.45 6.21 7.08 21.05 31.56 6.15 8.214.87 8.97 26.54 34.56 5.58 8.07;n,m=size(x);stdr=sta(x);xx=x .stdr(ones(n,1),:); 標準化變換y=pdist(xx); 計算各樣本間距離(這里為歐氏距離)z=linkage(y); 進行聚類(這里為最短距離法)h=dendrogram(z); 畫聚類譜系圖t=cluster(z,3) 將全部樣本分為3類find(t=2); 找出屬于第2類的樣品編號執(zhí)行后得到所要結(jié)果,聚類譜系圖見圖1.t

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論