實(shí)用多元統(tǒng)計(jì)分析相關(guān)習(xí)題_第1頁
實(shí)用多元統(tǒng)計(jì)分析相關(guān)習(xí)題_第2頁
實(shí)用多元統(tǒng)計(jì)分析相關(guān)習(xí)題_第3頁
實(shí)用多元統(tǒng)計(jì)分析相關(guān)習(xí)題_第4頁
實(shí)用多元統(tǒng)計(jì)分析相關(guān)習(xí)題_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余3頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、練習(xí)題一、填空題1 .人們通過各種實(shí)踐,發(fā)現(xiàn)變量之間的相互關(guān)系可以分成相關(guān)和不相關(guān)兩種類型.多元統(tǒng)計(jì)中常用的統(tǒng)計(jì)量有:樣本均值、樣本方差、樣本協(xié)方差和樣本相關(guān)系數(shù).2 .總離差平方和可以分解為回歸離差平方和和剩余離差平方和兩個(gè)局部,其中回歸離差平方和在總離差平方和中所占比重越大,那么線性回歸效果越顯著.3 .回歸方程顯著性檢驗(yàn)時(shí)通常采用的統(tǒng)計(jì)量是SR/p/Se/n-p-1.4 .偏相關(guān)系數(shù)是指多元回歸分析中,當(dāng)其他變量固定時(shí),給定的兩個(gè)變量之間的的相關(guān)系數(shù).5 .Spss中回歸方程的建模方法有一元線性回歸、多元線性回歸、嶺回歸、多對多線性回歸等.6 .主成分分析是通過適當(dāng)?shù)淖兞刻鎿Q,使新變量成

2、為原變量的線性組合,并尋求降維的一種方法.7 .主成分分析的根本思想是設(shè)法將原來眾多具有一定相關(guān)性比方P個(gè)指標(biāo),重新組合成一組新的互相無關(guān)的綜合指標(biāo)來替代原來的指標(biāo).8 .主成分表達(dá)式的系數(shù)向量是相關(guān)系數(shù)矩陣的特征向量.9 .樣本主成分的總方差等于1.10 .在經(jīng)濟(jì)指標(biāo)綜合評價(jià)中,應(yīng)用主成分分析法,那么評價(jià)函數(shù)中的權(quán)數(shù)為方差奉獻(xiàn)度.主成分的協(xié)方差矩陣為對稱矩陣.主成分表達(dá)式的系數(shù)向量是相關(guān)矩陣特征值的特征向量.11 .SPSS中主成分分析采用analyze-datareduction-facyor命令過程.12 .因子分析是把每個(gè)原始變量分解為兩局部因素,一局部是公共因子,另一局部為特殊因子.

3、13 .變量共同度是指因子載荷矩陣中第i行元素的平方和.14 .公共因子方差與特殊因子方差之和為1.15 .聚類分析是建立一種分類方法,它將一批樣品或變量根據(jù)它們在性質(zhì)上的親疏程度進(jìn)行科學(xué)的分類.16 .Q型聚類法是按樣品進(jìn)行聚類,R型聚類法是按變量進(jìn)行聚類.17 .Q型聚類統(tǒng)計(jì)量是距離,而R型聚類統(tǒng)計(jì)量通常采用相關(guān)系數(shù).18 .六種Q型聚類方法分別為最長距離法、最短距離法、中間距離法、類平均法、重心法、離差平方和法.19 .快速聚類在SPSS中由k-均值聚類analyzeclassify-kmeanscluster過程實(shí)現(xiàn).20 .判別分析是要解決在研究對象已已分成假設(shè)干類的情況下,確定新的

4、觀測數(shù)據(jù)屬于類別中哪一類的多元統(tǒng)計(jì)方法.21 .用判別分析方法處理問題時(shí),通常以判別函數(shù)作為衡量新樣本點(diǎn)與各組別接近程度的指標(biāo).22 .進(jìn)行判別分析時(shí),通常指定一種判別規(guī)那么,用來判定新樣本的歸屬,常見的判別準(zhǔn)那么有Fisher準(zhǔn)那么、貝葉斯準(zhǔn)那么.23 .類內(nèi)樣本點(diǎn)接近,類間樣本點(diǎn)疏遠(yuǎn)的性質(zhì),可以通過類與類之間的距離與類內(nèi)樣本的距離的大小差異表現(xiàn)出來,而兩者的比值能把不同的類區(qū)別開來.這個(gè)比值越大,說明類與類間的差異越類與類之間的距離越大,分類效果越好024 .Fisher判別法就是要找一個(gè)由p個(gè)變量組成的線性判別函數(shù),使得各自組內(nèi)點(diǎn)的離差盡可能接近,而不同組問點(diǎn)的盡可能疏遠(yuǎn).二、簡做題1、

5、簡述復(fù)相關(guān)系數(shù)與偏相關(guān)系數(shù).答:復(fù)相關(guān)系數(shù):又叫多重相關(guān)系數(shù).復(fù)相關(guān)是指因變量與多個(gè)自變量之間的相關(guān)關(guān)系.例如,某種商品的需求量與其價(jià)格水平、職工收入水平等現(xiàn)象之間呈現(xiàn)復(fù)相關(guān)關(guān)系.偏相關(guān)系數(shù):又叫局部相關(guān)系數(shù).局部相關(guān)系數(shù)反映校正其它變量后某一變量與另一變量的相關(guān)關(guān)系.偏相關(guān)系數(shù)是指多元回歸分析中,當(dāng)其他變量固定后,給定的兩個(gè)變量之間的的相關(guān)系數(shù).偏相關(guān)系數(shù)的假設(shè)檢驗(yàn)等同于偏回歸系數(shù)的t檢驗(yàn).復(fù)相關(guān)系數(shù)的假設(shè)檢驗(yàn)等同于回歸方程的方差分析.2、簡述逐步回歸分析方法的具體實(shí)施步驟.答:逐步回歸過程如下:1自變量的剔除;2重新進(jìn)行少一個(gè)自變量的多元線性回歸分析;3重新進(jìn)行多一個(gè)自變量的多元線性回歸分

6、析;4重新進(jìn)行上述步驟,直至無法再刪除和再引入自變量為止.3、提取樣本主成分的原那么.答:主成分個(gè)數(shù)提取原那么為主成分對應(yīng)的特征值大于1的前m個(gè)主成分.特征值在某種程度上可以被看成是表示主成分影響力度大小的指標(biāo),如果特征值小于1,說明該主成分的解釋力度還不如直接引入一個(gè)原變量的平均解釋力度大,因此,一般可以用特征值大于1作為納入標(biāo)準(zhǔn).4、簡述系統(tǒng)聚類法的根本思想及主要步驟.答:系統(tǒng)聚類的根本思想是:距離相近的樣品或變量先聚成類,距離相遠(yuǎn)的后聚成類,過程一直進(jìn)行下去,每個(gè)樣品或變量總能聚到適宜的類中.系統(tǒng)聚類過程是:假設(shè)總共有n個(gè)樣品或變量,第一步將每個(gè)樣品或變量單獨(dú)聚成一類,共有n類;第二步根

7、據(jù)所確定的樣品或變量“距離公式,把距離較近的兩個(gè)樣品或變量聚合為一類,其它的樣品或變量仍各自聚為一類,共聚成n1類;第三步將“距離最近的兩個(gè)類進(jìn)一步聚成一類,共聚成n2類;,以上步驟一直進(jìn)行下去,最后將所有的樣品或變量全聚成一類,也簡稱聚集法.還有與以上方法相反的稱分解法.5、簡述快速聚類k均值聚類的根本思想及主要步驟.答:根本思想:1.一個(gè)樣品分配給最近中央均值的類中,將所有樣品分成k個(gè)初始類.2.通過歐式距離將每個(gè)樣品劃入離中央最近的類中,并對得到樣品或失去樣品的類重新計(jì)算中央坐標(biāo).3.重復(fù)步驟2,直到所有樣品都不能再分配時(shí)為止.6、判別分析的分類.答:判別分析是多元統(tǒng)計(jì)分析中用于判別樣本

8、所屬類型的一種統(tǒng)計(jì)分析方法.判別分析按判別的組數(shù)來分,有兩組判別分析和多組判別分析;按區(qū)分不同總體所用的數(shù)學(xué)模型來分,有線性判別和非線性判別;按判別對所處理的變量方法不同,有逐步判別、序貫判別等;按判別準(zhǔn)那么不同,有距離判別、貝葉斯判別Bayes、費(fèi)歇Fisher判別等.7、簡述Fisher判別規(guī)那么及具體判別步驟.答:Fisher判別法的根本思想:從多個(gè)總體類抽取一定的樣本,借助方差分析的思想,建立p個(gè)指標(biāo)的線性判別函數(shù),把待判樣品代入線性判別函數(shù),然后與臨界值比擬,就可判樣品屬于哪個(gè)類.*1*Fisher判別法的具體算法步驟:由Fisher線性判別式SM1M2求解向量的步驟:1把來自兩類2

9、練習(xí)樣本集X分成1和2兩個(gè)子集X1和X2.1MiXk,I1,2由niXkXi,計(jì)算Mi.TSiXkMiXkMic由XkXi計(jì)算各類的類內(nèi)離散度矩陣Si,i=1,2o計(jì)算類內(nèi)總離散度矩陣sSiS2O1計(jì)算S的逆矩陣S.*1*由SM1M2求解.三、計(jì)算題1 .現(xiàn)收集了92組合金鋼中的碳含量x及強(qiáng)度y,且求得:X0.1255,y45.7989L.0.3019Lxv26.5126Lvv2941.03xxxyyy(1)求y關(guān)于x的一元線性回歸方程;求y與x的相關(guān)系數(shù);(3)列出對方程作顯著性檢驗(yàn)的方差分析表;(4)在x=0.1時(shí),求?的點(diǎn)估計(jì).Q京y關(guān)于戈的一線性回歸方程;cL265126=工=解:h=

10、S7.S191:=v-=45:,匏-S7S151黑口1255="二7ML03019"一4AXAy-34.777S+81911;即,y-34.7775487.8191y(2中)與,的f目關(guān)系加.對出對方程作顯著性情蛉的方差為析哀來源平方和自由度均方F值由月232SJJ141232S.3J14712499臊雙LQE23267S1總計(jì)門阻打912 .某地區(qū)通過一個(gè)樣本容量為722的調(diào)查數(shù)據(jù)得到勞動(dòng)力受教育年數(shù)的一個(gè)回歸方程為edui10.360.094sibSi0.131medUi0.210feduiR20.214式中,edu為勞動(dòng)力受教育年數(shù),sibs為勞動(dòng)力家庭中兄弟姐妹的個(gè)

11、數(shù),medu與fedu分別為母親與父親受到教育的年數(shù).問(1)假設(shè)medu與fedu保持不變,為了使預(yù)測的受教育水平減少一年,需要sibs增加多少?(2)請對medu的系數(shù)給予適當(dāng)?shù)慕忉?(3)如果兩個(gè)勞動(dòng)力都沒有兄弟姐妹,但其中一個(gè)的父母受教育的年數(shù)均為12年,另一個(gè)的父母受教育的年數(shù)均為16年,那么兩人受教育的年數(shù)預(yù)期相差多少年首先計(jì)算的大受致育的年數(shù)分月他1叮網(wǎng)X風(fēng)二TIKM4HWij10一驪粒因此,兩人的受教育年齦的差異為15-816-14452=1J64操作時(shí)種不同品種的玉米進(jìn)行產(chǎn)鞍批實(shí)心幅定言實(shí)瞌區(qū)其它豪幅油國片數(shù)據(jù)如下亂品種145AI47.5454心46645.2A24f45,5

12、二一工才947.1A3432-5-輛45,SA444141.63SS43.242.5問玉米的不同品種的平均聲里是否有顯著差異?miK平方和df均方F顯普性組同組內(nèi)總數(shù)63.98240,064108.9463161922.9612JO49.170,001管:PR.0010戀拒葩原假設(shè),故不同品種的平均產(chǎn)里有顯著差異2F面列出在不同重剪下彈簧的茨度:1!ix面510152030茬虔強(qiáng)7R8.12S.959.9011.80在囹篇坐標(biāo)系下作勖點(diǎn)圖,棄判斷Y關(guān)于X的相關(guān)關(guān)系是否攜性;(編圖也,舊通話相、散聲、簡單分布分析、回歸、線性、統(tǒng)計(jì)里中選擇相應(yīng)的1答:線性相關(guān).2求出Y關(guān)于X的一元線性回歸方程;棋

13、型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)*熟tSig.B標(biāo)準(zhǔn)誤差試用版1常量6.283.053117.624.000重量X.183.031.00065.745.000a.因變量:長虔y解:Y=0.183X*6.283;3對所求得的回歸方程作顯著性檢縫,列比方差分析表:Anovaw提型平方和df均方FSig.1回歸14.665114.6654454.018.OOO1殘差.0134.003總計(jì)14.6785a.預(yù)測變量二常量,重量x.b.因變量:氏度y4求出Y與X間的相關(guān)系麴.楮定性重量X長度y重量xPearson相關(guān)性11.000-顯著性雙惻D.000N66長度yPearson相關(guān)性1.0001顯著性雙惻.000M6

14、6*.在.1水平雙那么上顯著相關(guān).3.下表給出一二元模型的回歸結(jié)果方差來源平方和(SS)自由度(d.f.)來自回歸(ESS)65965一來自殘差(RSS)一一總離差(TSS)6604214求:(1)樣本容量是多少?RSS是多少?ESS和RSS的自由度各是多少?222(2)R2和R?(3)檢驗(yàn)假設(shè):解釋變量總體上對Y有無影響.你用什么假設(shè)檢驗(yàn)?為什么?解:(1)樣本容量為14+1=15RSS-TSS-ESS=66042-65965=77ESS的自由度為:d£=2RSS的自由度為:dl=n-2-l=12(2)RESSTSS=65W560042=0,«88=1-(1-R2)(n-

15、l)(n-k-l>14),0012,14/12=0.99860)應(yīng)該采用方程顯著性檢驗(yàn),即F檢驗(yàn)I理由是只有這樣才能判斷Xl、X二一起是否對Y有影響“4.在一項(xiàng)研究中,測量了376只雞的骨骼,并利用相關(guān)系數(shù)矩陣進(jìn)行主成分分析,見卜表:Y1Y2Y3Y4Y5Y6頭長x10.350.530.76-0.05-0.040.00頭寬x20.330.70-0.640.000.00-0.04肱骨x30.44-0.19-0.050.530.190.59尺骨x40.44-0.25-0.020.48-0.15-0.63股骨x50.43-0.28-0.06051-0.670.48脛骨x60.44-0.22-0.

16、05048-0.700.15特征值4.570.710.410.170.080.06(1)計(jì)算前三個(gè)主成分各自的奉獻(xiàn)率和累積奉獻(xiàn)率.對于y4,y5,y6的方差很小這一點(diǎn),你怎樣對實(shí)際情況作出推斷M:5 .在一項(xiàng)對楊樹的性狀的研究中,測定了20株楊樹樹葉,每個(gè)葉片測定了四個(gè)變量:葉長(x1),2/3處寬(x2),1/3處寬(x3),1/2處寬(x4).這四個(gè)變量的相關(guān)系數(shù)矩陣的特征根和標(biāo)準(zhǔn)正交特征向量分別為:12,920U1(0.1485,0.5735,0.5577,0.5814)21.024U2(0.9544,0.0984,0.2695,0.0824)30.049U3(0.2516,0.7733

17、,0.5589,0.1624)40.007U4(0.0612,0.2519,0.5513,0.7930)寫出四個(gè)主成分,計(jì)算它們的奉獻(xiàn)率.解:各自的主成分為:Z1=0.1485X1-0.5735X2-0.5577X3-0.5814X4Z2=0.9544X1-0.0984X2+0.2695X3+0.0824X4Z3=0.2516X1+0.7733X2-0.5589X3-0.1624X4Z4=-0.0612X1+0.2519X2+0.5513X3-0.7930X4那么各自的奉獻(xiàn)率為:W1=2.920/(2.920+1.024+0.049+0.007)=0.73W2=1.024/(2.920+1.0

18、24+0.049+0.007)=0.256W2=0.049/(2.920+1.024+0.049+0.007)=0.01225W2=0.007/(2.920+1.024+0.049+0.007)=0.001756 .對紐約股票市場上的五種股票的周上升率x1,x2,x3,x4,x5進(jìn)行了主成分分析,其中x1,x2,x3分別表示三個(gè)化學(xué)工業(yè)公司的股票上升率,x4,x5表示兩個(gè)石油公司的股票上升率,主成分分析是從相關(guān)系數(shù)矩陣出發(fā)進(jìn)行的,前兩個(gè)特征根和對應(yīng)的標(biāo)準(zhǔn)正交特征向量為:1 2.857U1(0.464,0.457,0.470,0.421,0.421)2 0.809U2(0.240,0.509,0.260,0.526,0.582)(1)計(jì)算這兩個(gè)主成分的方差奉獻(xiàn)率.解:各自的主成分為:Z1=0.464X1+0.457X2+0.470X3+0.421X4+0.421X5Z2=0.240X1+0.509X2+0.260X3-0.526X4-0.582X5那么各自的奉獻(xiàn)率為:W1=2.58

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論