


版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、地球科學(xué)與學(xué)院中國(guó)地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室數(shù)學(xué)在地學(xué)中的應(yīng)用實(shí)習(xí)三、聚類(lèi)分析實(shí)驗(yàn)?zāi)康模?.2.3.熟悉系統(tǒng)聚類(lèi)和 k-均值聚類(lèi)方法;熟悉 R 型、Q 型系統(tǒng)聚類(lèi)分析 SPSS 操作流程; 理解聚類(lèi)分析結(jié)果分析思路。一、系統(tǒng)聚類(lèi)分析1.2.3.系統(tǒng)聚類(lèi)主要有兩種方法:分解法和凝聚法; 系統(tǒng)聚類(lèi)的功能:樣品的聚類(lèi)和變量的聚類(lèi);系統(tǒng)聚類(lèi)分析流程:數(shù)據(jù)的標(biāo)準(zhǔn)化à測(cè)度方法的選擇(距離方法的選擇或相似性、關(guān)聯(lián)程度的選擇)à聚類(lèi)方法的選擇à輸出圖形的選擇1.數(shù)據(jù)的標(biāo)準(zhǔn)化處理導(dǎo)入數(shù)據(jù)。打開(kāi)“實(shí)習(xí)三”文件夾中“實(shí)習(xí)三.xlsx”文件,在“打開(kāi) Excel 數(shù)據(jù)源” 擊確
2、定??蛑斜A裟J(rèn)設(shè)置,點(diǎn)數(shù)據(jù)的標(biāo)準(zhǔn)化處理。點(diǎn)擊工具欄中的“分析”(A)à“描述統(tǒng)計(jì)”à“描述”,進(jìn)入“描述性”框(B),選擇除 FID 以框中保留默認(rèn)選擇,外所有元素變量進(jìn)行分析,點(diǎn)擊“選項(xiàng)”à進(jìn)入“描述:選項(xiàng)”框。在該系統(tǒng)將對(duì)所選元素含量的均值、標(biāo)準(zhǔn)差、最小值、最大值進(jìn)行統(tǒng)計(jì)分析à點(diǎn)擊“繼續(xù)”返回“描述性”框(B)à“將標(biāo)準(zhǔn)化得分另存為變量(Z)”à點(diǎn)擊“確定”,得到各元素統(tǒng)計(jì)分析結(jié)果(D),并且可以在“變量視圖”中查看標(biāo)準(zhǔn)化后的各元素含量以新變量的形式出現(xiàn)在窗口中(E)。地球科學(xué)與學(xué)院中國(guó)地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室(A)
3、(B)(C)(D)(E)當(dāng)重復(fù)步驟,對(duì)標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析時(shí),可以得到新變量均值為 0,標(biāo)準(zhǔn)差為 1,如下圖分析結(jié)果所示。接下來(lái)的聚類(lèi)分析過(guò)程,將使用標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行。地球科學(xué)與學(xué)院中國(guó)地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室2.Q 型(基于樣本)聚類(lèi)分析點(diǎn)擊“分析”à“分類(lèi)”à“系統(tǒng)聚類(lèi)”進(jìn)入“系統(tǒng)聚類(lèi)分析”對(duì)數(shù)據(jù)進(jìn)行 Q 型聚類(lèi)分析。框。選擇分群“個(gè)案”,即選擇“個(gè)案”,即對(duì)樣本進(jìn)行聚類(lèi)(Q 型聚類(lèi))設(shè)置分類(lèi)方案。點(diǎn)擊“統(tǒng)計(jì)量”à進(jìn)入“系統(tǒng)聚類(lèi)分析:統(tǒng)計(jì)量”框。按圖計(jì)量à點(diǎn)擊“繼續(xù)”返回“系統(tǒng)聚類(lèi)分析”框。分類(lèi)信息表:ØØ無(wú):
4、表示不列示分類(lèi)信息表; 單一方案:指定分類(lèi)數(shù)的分類(lèi)信息表。若要顯示分為 6 類(lèi), 則在此填入 6;方案范圍:指定分為多類(lèi)的分類(lèi)信息。若要顯示分為 3、4、5、6 類(lèi)的情況,則在最小和最大聚類(lèi)數(shù)中分別填寫(xiě) 3、6。也稱(chēng)“凝聚狀態(tài)表”相似性矩陣表Ø設(shè)置繪圖方案。在“系統(tǒng)聚類(lèi)分析”框中,點(diǎn)擊“繪制”,進(jìn)入“系統(tǒng)聚類(lèi)分析:圖”框。按下圖相應(yīng)選項(xiàng)à點(diǎn)擊“繼續(xù)”,返回“系統(tǒng)聚類(lèi)分析”框。地球科學(xué)與學(xué)院中國(guó)地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室輸出所有分類(lèi)的冰柱圖輸出指定類(lèi)分類(lèi)結(jié)果冰柱圖不輸出分類(lèi)結(jié)果冰柱圖冰柱圖水平或垂直顯示設(shè)置分類(lèi)方法。在“系統(tǒng)聚類(lèi)分析”框中,點(diǎn)擊“方法”,進(jìn)入“系統(tǒng)聚
5、類(lèi)分析:方法”框。按下圖相應(yīng)選項(xiàng)à點(diǎn)擊“繼續(xù)”,返回“系統(tǒng)聚類(lèi)分析”框。相似性度量指標(biāo):類(lèi)間距離定義方法:數(shù)據(jù)標(biāo)準(zhǔn)化處理方式選擇;系統(tǒng)默認(rèn)為不進(jìn)行標(biāo)準(zhǔn)化處理。本實(shí)驗(yàn)第一步已對(duì)數(shù)據(jù)按變量進(jìn)行了標(biāo)準(zhǔn)化處理。設(shè)置保存方案。在“系統(tǒng)聚類(lèi)分析”框中,點(diǎn)擊“保存”,進(jìn)入“系統(tǒng)聚類(lèi)分析:保存”框。在這里選擇是否將某分類(lèi)信息以新變量的形式保存在數(shù)據(jù)文件中à按下圖在“單一方案聚類(lèi)數(shù)”中填入 6à點(diǎn)擊“繼續(xù)”,返回“系統(tǒng)聚類(lèi)分析”框à點(diǎn)擊“確定”,得到聚類(lèi)分析結(jié)果。ØØ系統(tǒng)默認(rèn):不保存;單一方案:保存指定分類(lèi)的分類(lèi)結(jié)果。若要保存分為 6 類(lèi)的情況, 則在
6、“聚類(lèi)數(shù)”中填入 6。系統(tǒng)將產(chǎn)生一個(gè)新變量,將所有樣本分到 6 類(lèi)中某一類(lèi)結(jié)果標(biāo)示在新變量中;方案范圍:保存指定分為某幾類(lèi)Ø地球科學(xué)與學(xué)院中國(guó)地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室3.查看 Q 型聚類(lèi)分析結(jié)果樣本基本情況。本例中有效分類(lèi)樣本數(shù)量為 80 個(gè)。查看相似性矩陣。表中矩陣了 80 個(gè)樣本點(diǎn)兩兩之間的距離。凝聚狀態(tài)表。第五、六列(首次出現(xiàn)階群集):表示該步驟是樣本的聚類(lèi)還是樣本與類(lèi)的聚類(lèi)或者是類(lèi)與類(lèi)的聚類(lèi); 0-樣本;非 0-類(lèi),數(shù)字表示第幾步聚成的類(lèi)。第一列(階):聚類(lèi)進(jìn)行到第幾步。第二、三列(群集):表示是哪兩個(gè)樣本或類(lèi)第四列(聚類(lèi)系數(shù)):表示該步中實(shí)現(xiàn)聚類(lèi)的兩樣本(或類(lèi))
7、之間的距離第七列(下一階):表示該果會(huì)在后面第幾步用到。類(lèi)結(jié) 分類(lèi)信息表。該表表示在設(shè)定為 6 類(lèi)的情況下,各樣本點(diǎn)的分類(lèi)情況。 冰柱圖。冰柱圖因其樣子形似冬天房頂上垂下的冰柱而得名。一般從冰柱圖的最后一行開(kāi)始觀察,縱坐標(biāo)表示類(lèi)的順序,橫坐標(biāo)表示樣品號(hào)。兩樣品之間實(shí)心部分,表示在該類(lèi)上把這兩個(gè)樣品進(jìn)行聚合地球科學(xué)與學(xué)院中國(guó)地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室形成一類(lèi)。 系統(tǒng)聚類(lèi)譜系圖(樹(shù)狀圖)。4. R 型(基于變量)聚類(lèi)分析及結(jié)果 R 型聚類(lèi)分析步驟與 Q 型聚類(lèi)分析步驟雷同,僅需在“系統(tǒng)聚類(lèi)分析”“變量”類(lèi)型??虻摹胺秩骸狈桨钢羞x擇 用相同方法得到 R 型聚類(lèi)分析結(jié)果,所得到的各種圖標(biāo)均變
8、量進(jìn)行聚類(lèi)分析。二、K-means 聚類(lèi)分析注意:K-均值聚類(lèi)只能做 Q 型(樣本)聚類(lèi);如要做 R 型(變量)聚類(lèi),需要把數(shù)據(jù)陣進(jìn)行轉(zhuǎn)置。以下過(guò)程為樣本聚類(lèi)。1. k-均值聚類(lèi)分析K-Means 聚類(lèi)分析的步驟為:Step1:指定聚類(lèi)的數(shù)目,假設(shè)要分成 k 類(lèi);Step2:確定類(lèi)的初始中心。可由用戶(hù)自定義,也可讓系統(tǒng)選定;地球科學(xué)與學(xué)院中國(guó)地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室Step3:根據(jù)距離最近原則進(jìn)行聚類(lèi); Step4:重新確定 K 個(gè)類(lèi)的中心;Step5:重復(fù) Setp3 Step4,直到滿(mǎn)足停止聚類(lèi)分析的條件。點(diǎn)擊“分析”à“分類(lèi)”à“k-均值聚類(lèi)”進(jìn)入“K-均
9、值聚類(lèi)分析”框(A)。設(shè)置聚類(lèi)變量和數(shù)目。將全部經(jīng)過(guò)標(biāo)準(zhǔn)化后的變量導(dǎo)入“變量”欄中;聚類(lèi)數(shù)量改為“6”。設(shè)置終止聚類(lèi)分析的條件。點(diǎn)擊“迭代”à進(jìn)入“K-均值聚類(lèi)分析:寫(xiě)入文件”框(B)à保留默認(rèn)迭代次數(shù)為 10à點(diǎn)擊“繼續(xù)”返回“K 均值聚類(lèi)分析”框。迭代次數(shù):進(jìn)行 10 次迭代后,聚類(lèi)分析停止,不再重新確定K 個(gè)類(lèi)的中心聚類(lèi)數(shù)量應(yīng)少于樣本數(shù)量收斂性標(biāo)準(zhǔn):說(shuō)明類(lèi)中心點(diǎn)偏移的程度,即迭代前后中心點(diǎn)的最大偏移量是否超過(guò)預(yù)定值,一般取 0.02。設(shè)置初始聚類(lèi)中心。點(diǎn)擊“選項(xiàng)”à進(jìn)入“K 均值聚類(lèi)分析:選項(xiàng)”點(diǎn)擊“繼續(xù)”返回“K 均值聚類(lèi)分析”框。框(A),如圖
10、計(jì)量à輸出方差分析表,反映哪些變量對(duì)分類(lèi)起著顯著作用樣本的處理,可不用選擇,默認(rèn)即可。輸出每個(gè)樣本的分類(lèi)信息設(shè)置保存方式。點(diǎn)擊“保存”à進(jìn)入“K-Means 群集:保存新變量”框。如圖即將保存的結(jié)果à點(diǎn)擊“繼續(xù)”返回“K 均值聚類(lèi)分析”框à點(diǎn)擊“確定”,得到聚類(lèi)分析結(jié)果。以新變量“QCL_1”保存“分類(lèi)信息”到 SPSS 數(shù)據(jù)文件中以新變量“QCL_2”保存“每個(gè) 樣本到各自所在類(lèi)的類(lèi)中心的距離”到 SPSS 數(shù)據(jù)文件中地球科學(xué)與學(xué)院中國(guó)地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室2.查看 K-Means 聚類(lèi)分析結(jié)果初始聚類(lèi)中心表和最終聚類(lèi)中心表。表中給出了每一個(gè)變量所有樣品的聚類(lèi)情況。由于沒(méi)有指定初始 聚類(lèi)中心,對(duì)每一個(gè)變量的樣品進(jìn)行聚類(lèi)分析時(shí),系統(tǒng)自動(dòng)選取了初始聚類(lèi)中心。經(jīng)過(guò)聚類(lèi)分析最終得到的聚類(lèi)中心與初始聚類(lèi)中心有差異。聚類(lèi)成員。該表中顯示了每一個(gè)樣品其分類(lèi),及距離聚類(lèi)中心的距離。聚類(lèi)中心間的距離。該表顯示了兩兩類(lèi)聚類(lèi)中心間的距離。聚類(lèi)案例數(shù)。該表反映了每一類(lèi)樣本個(gè)數(shù)信息,本例中,第一類(lèi)有 2 個(gè)樣本;第二類(lèi)有 1 個(gè)樣本地球科學(xué)與學(xué)院中國(guó)地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室ANOVA 方差分析表。該表對(duì)各指數(shù)的均值在各類(lèi)中的差異進(jìn)行顯著性檢驗(yàn),反映了哪些聚類(lèi)變量對(duì)分類(lèi)起著顯著作
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 太陽(yáng)膜搞活動(dòng)方案
- 大學(xué)師生共建活動(dòng)方案
- 大型返鄉(xiāng)活動(dòng)方案
- 大班冬至節(jié)活動(dòng)方案
- 太原必勝客充值活動(dòng)方案
- 夏天別墅活動(dòng)方案
- 2025-2030工業(yè)傳感器智能化趨勢(shì)及物聯(lián)網(wǎng)連接與邊緣計(jì)算協(xié)同效應(yīng)報(bào)告
- 大班食物活動(dòng)方案
- 城管軍訓(xùn)活動(dòng)方案
- 夜市試吃活動(dòng)方案
- 四川電網(wǎng)新建電源并網(wǎng)服務(wù)指南(2025年)
- 建筑工程修繕培訓(xùn)課件
- 2025年主管護(hù)師考試真題試題及答案
- 2025全國(guó)英語(yǔ)等級(jí)考試(PETS)二級(jí)試卷真題匯編與解析
- 2024北森圖表分析題庫(kù)
- 稅務(wù)智稅競(jìng)賽試題及答案
- 成都銀河磁體股份有限公司高精度、高潔凈度硬盤(pán)用粘結(jié)釹鐵硼磁體擴(kuò)建項(xiàng)目環(huán)評(píng)報(bào)告
- 企業(yè)內(nèi)部控制體系構(gòu)建與優(yōu)化研究
- 電力巡檢機(jī)器人市場(chǎng)調(diào)研報(bào)告2025
- 森林康養(yǎng)基地項(xiàng)目可行性研究報(bào)告
- 竹編非遺教學(xué)課件
評(píng)論
0/150
提交評(píng)論