多元統(tǒng)計(jì)分析期末考試考點(diǎn)整理_第1頁
多元統(tǒng)計(jì)分析期末考試考點(diǎn)整理_第2頁
多元統(tǒng)計(jì)分析期末考試考點(diǎn)整理_第3頁
多元統(tǒng)計(jì)分析期末考試考點(diǎn)整理_第4頁
多元統(tǒng)計(jì)分析期末考試考點(diǎn)整理_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上二 名詞解釋1、 多元統(tǒng)計(jì)分析:多元統(tǒng)計(jì)分析是運(yùn)用數(shù)理統(tǒng)計(jì)的方法來研究多變量(多指標(biāo))問題的理論和方法,是一元統(tǒng)計(jì)學(xué)的推廣2、 聚類分析:是根據(jù)“物以類聚”的道理,對樣品或指標(biāo)進(jìn)行分類的一種多元統(tǒng)計(jì)分析方法。將個(gè)體或?qū)ο蠓诸?,使得同一類中的對象之間的相似性比與其他類的對象的相似性更強(qiáng)。使類內(nèi)對象的同質(zhì)性最大化和類間對象的異質(zhì)性最大化3、 隨機(jī)變量:是指的值無法預(yù)先確定僅以一定的可能性(概率)取值的量。它是由于隨機(jī)而獲得的非確定值,是概率中的一個(gè)基本概念。即每個(gè)分量都是隨機(jī)變量的向量為隨機(jī)向量。類似地,所有元素都是隨機(jī)變量的矩陣稱為隨機(jī)矩陣。4、統(tǒng)計(jì)量:多元統(tǒng)計(jì)研究的是

2、多指標(biāo)問題,為了了解總體的特征,通過對總體抽樣得到代表總體的樣本,但因?yàn)樾畔⑹欠稚⒃诿總€(gè)樣本上的,就需要對樣本進(jìn)行加工,把樣本的信息濃縮到不包含未知量的樣本函數(shù)中,這個(gè)函數(shù)稱為統(tǒng)計(jì)量3、 計(jì)算題解:答:答:題型三 解答題1、簡述多元統(tǒng)計(jì)分析中協(xié)差陣檢驗(yàn)的步驟答:第一,提出待檢驗(yàn)的假設(shè) 和H1;第二,給出檢驗(yàn)的統(tǒng)計(jì)量及其服從的分布;第三,給定檢驗(yàn)水平,查統(tǒng)計(jì)量的分布表,確定相應(yīng)的臨界值,從而得到否定域;第四,根據(jù)樣本觀測值計(jì)算出統(tǒng)計(jì)量的值,看是否落入否定域中,以便對待判假設(shè)做出決策(拒絕或接受)。2、簡述一下聚類分析的思想答:聚類分析的基本思想,是根據(jù)一批樣品的多個(gè)觀測指標(biāo),具體地找出一些能夠度

3、量樣品或指標(biāo)之間相似程度的統(tǒng)計(jì)量,然后利用統(tǒng)計(jì)量將樣品或指標(biāo)進(jìn)行歸類。把相似的樣品或指標(biāo)歸為一類,把不相似的歸為其他類。直到把所有的樣品(或指標(biāo))聚合完畢.3、多元統(tǒng)計(jì)分析的內(nèi)容和方法答:1、簡化數(shù)據(jù)結(jié)構(gòu),將具有錯(cuò)綜復(fù)雜關(guān)系的多個(gè)變量綜合成數(shù)量較少且互不相關(guān)的變量,使研究問題得到簡化但損失的信息又不太多。(1)主成分分析(2)因子分析(3)對應(yīng)分析等2、分類與判別,對所考察的變量按相似程度進(jìn)行分類。(1)聚類分析:根據(jù)分析樣本的各研究變量,將性質(zhì)相似的樣本歸為一類的方法。(2)判別分析:判別樣本應(yīng)屬何種類型的統(tǒng)計(jì)方法。4、系統(tǒng)聚類法基本原理和步驟答:1)先計(jì)算n個(gè)樣本兩兩間的距離2)構(gòu)造n個(gè)類

4、,每個(gè)類只包含一個(gè)樣本3)合并距離最近的兩類為一新類4)計(jì)算新類與當(dāng)前各類的距離5)類的個(gè)數(shù)是否等于1,如果不等于回到3在做6)畫出聚類圖7)決定分類個(gè)數(shù)和類5、 聚類分析的類型有:答:(1) 對樣本分類,稱為Q型聚類分析(2) 對變量分類,稱為R型聚類分析 # Q型聚類是對樣本進(jìn)行聚類,它使具有相似性特征的樣本聚集在一起,使差異性大的樣本分離開來。# R型聚類是對變量進(jìn)行聚類,它使具有相似性的變量聚集在一起,差異性大的變量分離開來,可在相似變量中選擇少數(shù)具有代表性的變量參與其他分析,實(shí)現(xiàn)減少變量個(gè)數(shù),達(dá)到變量降維的目的。6、 簡述歐氏距離與馬氏距離的區(qū)別和聯(lián)系。 7、&#

5、160; 試述系統(tǒng)聚類的基本思想。 答:系統(tǒng)聚類的基本思想是:距離相近的樣品(或變量)先聚成類,距離相遠(yuǎn)的后聚成類,過程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類中。 8對樣品和變量進(jìn)行聚類分析時(shí)所構(gòu)造的統(tǒng)計(jì)量分別是什么?簡要說明為什么這樣構(gòu)造? 答:對樣品進(jìn)行聚類分析時(shí),用距離來測定樣品之間的相似程度。因?yàn)槲覀儼裯個(gè)樣本看作p維空間的n個(gè)點(diǎn)。點(diǎn)之間的距離即可代表樣品間的相似度。常用的距離為 9、在進(jìn)行系統(tǒng)聚類時(shí),選擇距離公式應(yīng)遵循哪些原則? 答:(1)要考慮所選擇的距離公式在實(shí)際應(yīng)用中有明確的意義。如歐氏距離就有非常明確的空間

6、距離概念。馬氏距離有消除量綱影響的作用。 (2)要綜合考慮對樣本觀測數(shù)據(jù)的預(yù)處理和將要采用的聚類分析方法。如在進(jìn)行聚類分析之前已經(jīng)對變量作了標(biāo)準(zhǔn)化處理,則通常就可采用歐氏距離。 (3)要考慮研究對象的特點(diǎn)和計(jì)算量的大小。樣品間距離公式的選擇是一個(gè)比較復(fù)雜且?guī)в幸欢ㄖ饔^性的問題,我們應(yīng)根據(jù)研究對象的特點(diǎn)不同做出具體分折。實(shí)際中,聚類分析前不妨試探性地多選擇幾個(gè)距離公式分別進(jìn)行聚類,然后對聚類分析的結(jié)果進(jìn)行對比分析,以確定最合適的距離測度方法。10、歐式距離的優(yōu)點(diǎn)缺點(diǎn)優(yōu)點(diǎn):幾何意義明確,簡單,容易掌握,由于中學(xué)數(shù)學(xué)就已初步接觸,數(shù)學(xué)知識(shí)不多的人也可以把握它的基本含義。 缺點(diǎn):從統(tǒng)計(jì)學(xué)的角度看,使用歐式距離要求一個(gè)向量的n個(gè)分量不相關(guān),且具有相當(dāng)?shù)姆讲?,或者說各個(gè)坐標(biāo)對歐式距離的貢獻(xiàn)同等且變差大小相同,此時(shí)使用歐式距離才合適,且效果良好,否則就不能如實(shí)反映情況且容易導(dǎo)致錯(cuò)誤的結(jié)論。因此需要對坐標(biāo)加權(quán),化為統(tǒng)計(jì)距離11、模糊聚類分析的實(shí)質(zhì)和基本原理答:模糊聚類分析的實(shí)質(zhì)就是根據(jù)研究對象本身的屬性而構(gòu)造模糊矩陣,在此基礎(chǔ)上根據(jù)一定的隸屬度來確定其分類關(guān)系基本原理:如果水平 滿足 ,則按水平分出的每一類必是按水平

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論