




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
趙世舜zhaoss@數(shù)學(xué)樓426第一章多元統(tǒng)計分析的應(yīng)用和
多元統(tǒng)計數(shù)據(jù)的圖表示法第一節(jié)
引言第二節(jié)輪廓圖第三節(jié)雷達(dá)圖第四節(jié)散布圖矩陣第一節(jié)引言什么是多元統(tǒng)計分析用于的領(lǐng)域如何處理數(shù)據(jù)什么樣的方法第一節(jié)引言什么是多元統(tǒng)計分析高維數(shù)據(jù)降維分類變量間的相互關(guān)系統(tǒng)計推斷第一節(jié)引言用于的領(lǐng)域●教育●服飾●醫(yī)學(xué)●經(jīng)濟●氣象●農(nóng)業(yè)●環(huán)境●社會科學(xué)●地址●文學(xué)第一節(jié)引言如何處理數(shù)據(jù)第一節(jié)引言什么樣的方法第二節(jié)輪廓圖
圖表示法眾所周知,圖形是我們直觀了解、認(rèn)識數(shù)據(jù)的一種可視化手段。如果能將所研究的數(shù)據(jù)直接顯示在一個平面圖上,便可以一目了然地看出分析變量間的數(shù)量關(guān)系。直方圖、散點圖等就是我們常用的二維平面圖示方法。雖然三維數(shù)據(jù)也可以用三維圖形來表示,但觀測三維數(shù)據(jù)卻存在一定的難度,而且在許多實際問題中,多變量數(shù)據(jù)的維數(shù)通常又都大于3,那么如何用圖形直觀表現(xiàn)三維以上的數(shù)據(jù)呢?自上世紀(jì)70年代以來,多變量數(shù)據(jù)的可視化分析研究就一直是人們關(guān)注的一個問題。從研究的成果來看,主要可以分為兩類:一類是使高維空間的點與平面上的某種圖形對應(yīng),這種圖形能反映高維數(shù)據(jù)的某些特點或數(shù)據(jù)間的某些關(guān)系;另一類是對多變量數(shù)據(jù)進(jìn)行降維處理,在盡可能多地保留原始信息的原則下,將數(shù)據(jù)的維數(shù)降為2維或1維,然后再在平面上表示。例如后面將要介紹的主成分分析方法、因子分析方法、多維尺度法等就屬于此類方法。下表是我國華北地區(qū)5個省市2003年城鎮(zhèn)居民家庭平均每人全年消費性支出的六項指標(biāo)數(shù)據(jù)考慮微機的普及應(yīng)用,圖形的制作則通過電腦實現(xiàn)。輪廓圖、矩陣散點圖在SPSS中制作,雷達(dá)圖則在EXCEL中實現(xiàn)。
表華北5省市城鎮(zhèn)居民家庭消費性支出第二節(jié)輪廓圖輪廓圖是將多個樣品觀測數(shù)據(jù)以折線的方式表示在平面圖中的一種多變量可視化圖形。輪廓圖用線段的升降來表示變量的大小,常用于表示現(xiàn)象在時間上的變化趨勢、現(xiàn)象的分配情況和兩個現(xiàn)象之間的依存關(guān)系等。輪廓圖的作圖原理如下:(1)作平面坐標(biāo)系,橫坐標(biāo)取p個點,表示p個變量,縱坐 標(biāo)表示變量取值。(2)對給定的樣品觀測值,在p個點的縱坐標(biāo)上標(biāo)出相應(yīng)的 變量取值。(3)將表示p個變量取值的點連接成一條折線,即得到了表 示一個樣品觀測數(shù)據(jù)的折線,n次觀測可繪出n條折 線,構(gòu)成多變量輪廓圖。在SPSS中作輪廓圖的方法如下:(1)將原始數(shù)據(jù)輸入SPSS中。把不同地區(qū)當(dāng)成變量,而把支出指標(biāo)當(dāng)成觀測。作輪廓圖時的數(shù)據(jù)組織形式
(2)選擇菜單項Graphs→Line,打開LineCharts對話框,如圖。在對話框上方的三個選項用于選擇輪廓圖的形式,由于是這里是多變量作圖,所以選擇Multiple。在對話框下面的三個選項中選擇Valueofindividualcases。單擊Define按鈕,打開DefineMultipleLine對話框。LineCharts對話框
(3)在DefineMultipleLine對話框中,將代表不同地區(qū)的5個變量移入LinesRepresent列表框中,將代表支出指標(biāo)的變量(variable)移入Variable框中。單擊OK按鈕,即可作出如圖所示的輪廓圖。從圖中可以清楚地看出北京市幾乎各項支出都排在第一,而山西省則幾乎每項支出都是最低的。DefineMultipleLine對話框輪廓圖第五節(jié)雷達(dá)圖雷達(dá)圖是一種較為常用的多變量可視化圖形。在雷達(dá)圖中,每個變量都有它自己的數(shù)值軸,每個數(shù)值軸都是從中心向外輻射。由于圖形就好像雷達(dá)熒光屏上的圖像,故稱其為雷達(dá)圖。又像蜘蛛網(wǎng),所以也稱蛛網(wǎng)圖。雷達(dá)圖的作圖方法:(1)作一圓,并按變量的個數(shù)p將圓周分成p等分。(2)連接圓心和各分點,將這p條半徑連線依次定義為各變量的坐標(biāo)軸,并標(biāo)以適當(dāng)?shù)目潭?。?)對給定的一次觀測值,將每個變量值分別標(biāo)在相應(yīng)的坐標(biāo)軸上,把p個點相連就形成了一個p邊形,n次觀測值就可畫出n個p邊形。例如,根據(jù)前表中的數(shù)據(jù),調(diào)用EXCEL圖表向?qū)В纯芍谱鞒鋈鐖D1~7所示的雷達(dá)圖。圖1畫出了北京、天津和河北的雷達(dá)圖,從圖可以看出,三省市消費支出結(jié)構(gòu)有較大差異。北京人均消費支出的各項指標(biāo)都高,對應(yīng)面積最大的六邊形,其次是天津,在三個省市中面積最小的是河北,天津在居住支出方面與北京較為接近,而在衣著和交通、通訊支出方面則與河北接近。其他支出方面三地存在較大差異。利用雷達(dá)圖的形狀、面積大小,可以對樣品進(jìn)行初始分類分析。為了加強雷達(dá)圖的效果,在雷達(dá)圖中適當(dāng)?shù)姆峙渥鴺?biāo)軸是很重要的,具體的分配辦法要結(jié)合分析的問題而定。例如可將要對比的指標(biāo)分布在左、右或上、下方,以便于對比分析。當(dāng)觀測次數(shù)n較
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 社保合同協(xié)議書范本下載
- 中高端餐飲創(chuàng)業(yè)計劃書范文
- 機器承包使用合同協(xié)議書
- 建筑行業(yè)市場深度分析及發(fā)展策略研究報告2025年
- 文博會展策劃書模板3
- 合同協(xié)議書匯編四篇范文
- 2025年金屬爐料項目投資分析及可行性報告
- 建筑合同責(zé)任解除協(xié)議書
- 創(chuàng)新生態(tài)系統(tǒng)的界定、特征及其構(gòu)建
- 鋼結(jié)構(gòu)分包合同協(xié)議書
- 2025-2030中國個人征信行業(yè)發(fā)展現(xiàn)狀調(diào)研及前景預(yù)測分析研究報告
- 2025農(nóng)業(yè)銀行筆試題庫及答案
- CNG場站應(yīng)急處置方案
- 民宿裝修合同協(xié)議書
- 《新能源汽車電氣系統(tǒng)》教學(xué)設(shè)計 任務(wù)1 新能源汽車充電系統(tǒng)認(rèn)知
- 河南省青桐鳴大聯(lián)考普通高中2024-2025學(xué)年高三考前適應(yīng)性考試語文試題及答案
- 第22講 杠桿 滑輪 2025年中考物理專題復(fù)習(xí)(廣東)課件
- 2025年租房合同房東模板
- 年產(chǎn)20噸植物硒蛋白添加劑項目可行性研究報告模板
- 上海市安裝工程預(yù)算定額2000 說明
- 六十四卦爻象全圖(彩色)(共6頁)
評論
0/150
提交評論