SPSS第十四講偏相關(guān)性分析_第1頁(yè)
SPSS第十四講偏相關(guān)性分析_第2頁(yè)
SPSS第十四講偏相關(guān)性分析_第3頁(yè)
SPSS第十四講偏相關(guān)性分析_第4頁(yè)
SPSS第十四講偏相關(guān)性分析_第5頁(yè)
已閱讀5頁(yè),還剩39頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

SPSS第十四講偏相關(guān)性分析第一頁(yè),共44頁(yè)。第十四講偏相關(guān)分析第一部分Excel與SPSS方式對(duì)比第二部分偏相關(guān)分析的概念第三部分偏相關(guān)分析的SPSS過(guò)程第四部分距離分析第二頁(yè),共44頁(yè)。相關(guān)分析的Excel方式例:一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國(guó)家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來(lái),該銀行的貸款額平穩(wěn)增長(zhǎng),但不良貸款額也有較大比例的提高,這給銀行業(yè)務(wù)的發(fā)展帶來(lái)較大壓力。為弄清楚不良貸款形成的原因,管理者希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)做些定量分析,以便找出控制不良貸款的辦法。第三頁(yè),共44頁(yè)。下表就是該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)。第四頁(yè),共44頁(yè)。第五頁(yè),共44頁(yè)。散點(diǎn)圖第六頁(yè),共44頁(yè)。Spss結(jié)果比較第七頁(yè),共44頁(yè)。偏相關(guān)分析

在多變量的情況下,變量之間的相關(guān)關(guān)系是很復(fù)雜的。因此,多元相關(guān)分析除了要利用上一講的簡(jiǎn)單相關(guān)系數(shù)外,還要計(jì)算偏相關(guān)系數(shù)。在對(duì)其他變量的影響進(jìn)行控制的條件下,衡量多個(gè)變量中某兩個(gè)變量之間的線性相關(guān)程度的指標(biāo)稱為偏相關(guān)系數(shù)。

第八頁(yè),共44頁(yè)。偏相關(guān)系數(shù)與簡(jiǎn)單相關(guān)系數(shù)區(qū)別

在計(jì)算簡(jiǎn)單相關(guān)系數(shù)時(shí):只需要掌握兩個(gè)變量的觀測(cè)數(shù)據(jù),并不考慮其他變量對(duì)這兩個(gè)變量可能產(chǎn)生的影響。

在計(jì)算偏相關(guān)系數(shù)時(shí):需要掌握多個(gè)變量的數(shù)據(jù),一方面考慮多個(gè)變量相互之間可能產(chǎn)生的影響,一方面又采用一定的方法控制其他變量,專門考察兩個(gè)特定變量的凈相關(guān)關(guān)系。變量1變量2關(guān)系變量1變量2關(guān)系變量3控制第九頁(yè),共44頁(yè)。例:在現(xiàn)實(shí)經(jīng)濟(jì)生活中,由于收入和價(jià)格常常都有不斷提高的趨勢(shì),如果不考慮收入對(duì)需求的影響,僅僅利用需求和價(jià)格的時(shí)間序列數(shù)據(jù)去計(jì)算簡(jiǎn)單相關(guān)系數(shù),就有可能得出價(jià)格越高需求越大的錯(cuò)誤結(jié)論。價(jià)格需求量收入水平上升未知上升還是下降呢?關(guān)系?第十頁(yè),共44頁(yè)。偏相關(guān)分析的公式表達(dá)在偏相關(guān)中,根據(jù)固定變量數(shù)目的多少,可分為零階偏相關(guān)、一階偏相關(guān)、…、(p-1)階偏相關(guān)。零階偏相關(guān)就是簡(jiǎn)單相關(guān)。如果用下標(biāo)0代表Y,下標(biāo)1代表X1,下標(biāo)2代表X2,則變量Y與變量X1之間的一階偏相關(guān)系數(shù)為:r01.2是剔除X2的影響之后,Y與X1之間的偏相關(guān)程度的度量。r01,r02,r12分別是Y,X1,X2兩兩之間的相關(guān)系數(shù)。第十一頁(yè),共44頁(yè)。如果增加變量X3,則變量Y與X1的二階偏相關(guān)系數(shù)為:依此類推變量Y與Xi的p-1階偏相關(guān)系數(shù)為:第十二頁(yè),共44頁(yè)。第四部分偏關(guān)分析的SPSS過(guò)程SPSS中相關(guān)分析可以通過(guò)Analyze菜單進(jìn)行(Correlate),Correlate菜單如圖所示。選擇其中第二個(gè)子菜單進(jìn)入到偏相關(guān)分析界面(Partial…)第十三頁(yè),共44頁(yè)。第一步:錄入數(shù)據(jù),打開偏相關(guān)分析對(duì)話框。第二步:將對(duì)話框中左側(cè)的變量列表框中選擇兩個(gè)變量,作為相關(guān)變量,移入Variables列表框中;選擇一個(gè)控制變量移入Controllingfor列表框中第十四頁(yè),共44頁(yè)。第三步:選擇檢驗(yàn)類型。變量窗口顯著性檢驗(yàn):雙尾檢驗(yàn)(默認(rèn))單尾檢驗(yàn)(相關(guān)方向明顯時(shí))顯示相關(guān)系數(shù)時(shí),顯示實(shí)際的顯著性概率相關(guān)變量控制變量第十五頁(yè),共44頁(yè)。第四步:打開OPTION選項(xiàng)框。均值與標(biāo)準(zhǔn)差,即顯示每個(gè)變量的均值、標(biāo)準(zhǔn)差和非缺失值的例數(shù)顯示零階相關(guān)矩陣,即Pearson相關(guān)矩陣僅剔除當(dāng)前分析的兩個(gè)變量值是缺失值的個(gè)案剔除帶有缺失值的所有個(gè)案第十六頁(yè),共44頁(yè)。已知有某河流的一年月平均流量觀測(cè)數(shù)據(jù)和該河流所在地區(qū)當(dāng)年的月平均雨量和月平均溫度觀測(cè)數(shù)據(jù),如表所示。試分析溫度與河水流量之間的相關(guān)關(guān)系。

第十七頁(yè),共44頁(yè)。第十八頁(yè),共44頁(yè)。相關(guān)分析的命令語(yǔ)句第十九頁(yè),共44頁(yè)。結(jié)果分析一、描述性統(tǒng)計(jì)量表中給出了個(gè)變量的均值、標(biāo)準(zhǔn)差和變量的非缺失值例數(shù)。第二十頁(yè),共44頁(yè)。相關(guān)系數(shù)

在月平均雨量作為控制變量的條件下,月平均流量和月平均氣溫間的偏相關(guān)為0.365,概率p值為0.270,在顯著性水平為0.05的條件下,月平均流量和月平均氣溫呈的正相關(guān)關(guān)系,說(shuō)明月平均流量和月平均氣溫的有線性影響但影響有限。第二十一頁(yè),共44頁(yè)。解釋看上去得到了兩個(gè)相反的結(jié)論,為什么呢?第二十二頁(yè),共44頁(yè)。距離分析一、距離分析的概念

距離分析是對(duì)觀測(cè)量之間或變量之間相似或不相似程度的一種測(cè)度,是計(jì)算一對(duì)變量之間或一對(duì)觀測(cè)量之間的廣義的距離。這些相似性或距離測(cè)度可以用于其它分析過(guò)程,例如因子分析、聚類分析等。在距離分析過(guò)程中,主要利用變量間的相似性測(cè)度(Similarities)和不相似性測(cè)度(Dissimilarities)度量?jī)烧咧g的關(guān)系有多像OR有多不像?第二十三頁(yè),共44頁(yè)。不相似性測(cè)度對(duì)定距型變量間距離描述的統(tǒng)計(jì)量,主要有:歐式距離(Euclideandistance)歐式距離的平方(SquaredEuclideandistan-ce)契比雪夫距離(Chebychev)絕對(duì)值距離(Block)閔可夫斯基距離(Minkowski)等。第二十四頁(yè),共44頁(yè)。對(duì)定序型變量之間距離的描述,主要有:卡方不相似測(cè)度(Chi-Squaremeasure)Phi方不相似測(cè)度(Phi-Squaremeasure)第二十五頁(yè),共44頁(yè)。對(duì)二值變量之間的距離描述,主要有:歐氏距離(Euclideandistance)平方歐氏距離(SquaredEuclideandistance)LaneandWilliams不相似性測(cè)度(LaneandWilliams)等。第二十六頁(yè),共44頁(yè)。相似性測(cè)度兩變量之間可以定義相似性測(cè)度統(tǒng)計(jì)量,用來(lái)對(duì)兩變量之間的相似性進(jìn)行數(shù)量化描述。針對(duì)定距型變量,主要有:

Peason相關(guān)系數(shù)夾角余弦距離等。對(duì)于二值變量的相似性測(cè)度主要包括:簡(jiǎn)單匹配系數(shù)(Simplematching)Jaccard相似性指數(shù)(Jaccard)Hamann相似性測(cè)度(Hamann)等20余種。相似性或不相似性測(cè)度還可用與其它模塊,例如:因子分析、聚類分析以及多維尺度分析的進(jìn)一步分析,以助于分析復(fù)合數(shù)據(jù)集。第二十七頁(yè),共44頁(yè)。Kulczynski1:KulczynskiⅠ型配對(duì)系數(shù),分母為總數(shù)與配對(duì)數(shù)之差,分子為非配對(duì)數(shù),分子與分母的權(quán)重相同;Kulczynski2:Kulczynski平均條件概率;SokalandSneath4:SokalandSneath條件概率;Hamann:Hamann概率;Lambda:Goodman-Kruskai相似測(cè)量的λ值;Anderberg'sD:以一個(gè)變量狀態(tài)預(yù)測(cè)另一個(gè)變量狀態(tài);Yule'sY:Yule綜合系數(shù),屬于2×2四格表的列聯(lián)比例函數(shù);Yule‘sQ:Goodman-Kruskalγ值,屬于2×2四格表的列聯(lián)比例函數(shù)。Ochiai:Ochiai二分余弦測(cè)量;SokalandSneath5:SokalandSneathⅤ型相似測(cè)量;Phi4pointcorrelation:Pearson相關(guān)系數(shù)的平方值;Dispersion:Dispersion相似測(cè)量。二值變量的相似性測(cè)度選項(xiàng)第二十八頁(yè),共44頁(yè)。RussellandRao:以二分點(diǎn)乘積為配對(duì)系數(shù);Simplematching:以配對(duì)數(shù)與總對(duì)數(shù)的比例為配對(duì)系數(shù);Jaccard:相似比例,分子與分母中的配對(duì)數(shù)與非配對(duì)數(shù)給予相同的權(quán)重;Dice:Dice配對(duì)系數(shù),分子與分母中的配對(duì)數(shù)給予加倍的權(quán)重;RogersandTanimoto:RogersandTanimoto配對(duì)系數(shù),分母為配對(duì)數(shù),分子為非配對(duì)數(shù),非配對(duì)數(shù)給予加倍的權(quán)重;SokalandSneath1:SokalandSneathⅠ型配對(duì)系數(shù),分母為配對(duì)數(shù),分子為非配對(duì)數(shù),配對(duì)數(shù)給予加倍的權(quán)重;SokalandSneath2:SokalandSneathⅡ型配對(duì)系數(shù),分子與分母均為非配對(duì)數(shù),但分子給予加倍的權(quán)重;SokalandSneath3:SokalandSneathⅢ型配對(duì)系數(shù),分母為配對(duì)數(shù),分子為非配對(duì)數(shù),分子與分母的權(quán)重相同;第二十九頁(yè),共44頁(yè)。已知有我國(guó)六城市2004年各月的日照時(shí)數(shù)數(shù)據(jù)如表所示。請(qǐng)分析各城市日照數(shù)是否近似。

第三十頁(yè),共44頁(yè)。執(zhí)行【Analyze】/【Correlate】/【Distances】命令,彈出【Distances】對(duì)話框變量列表選擇變量個(gè)案(觀測(cè)量)標(biāo)識(shí)變量計(jì)算距離選項(xiàng):個(gè)案距離,計(jì)算個(gè)案間的距離;變量距離,計(jì)算變量之間的距離第三十一頁(yè),共44頁(yè)。度量方式等距間隔數(shù)據(jù)選項(xiàng)計(jì)數(shù)數(shù)據(jù)選項(xiàng)二值數(shù)值選項(xiàng)轉(zhuǎn)換轉(zhuǎn)換選項(xiàng)轉(zhuǎn)換測(cè)度選項(xiàng)第三十二頁(yè),共44頁(yè)。結(jié)果解讀取值越大說(shuō)明近似程度越低,反之亦然第三十三頁(yè),共44頁(yè)。例:測(cè)得30名13歲男童的身高、體重、肺活量的數(shù)據(jù)。對(duì)身高、體重和肺活量進(jìn)行變量距離分析。編號(hào)身高體重肺活量1135930.420003163.646.227504146.533.525005156.237.127506156.435.520007167.841.527508149.7311500編號(hào)身高體重肺活量914533250010148.537.2225011165.549.530001213527.6125013153.34127501415232175015160.547.222501615347.21750第三十四頁(yè),共44頁(yè)。第三十五頁(yè),共44頁(yè)。距離分析命令語(yǔ)句PROXIMITIES

身高體重肺活量

/VIEW=VARIABLE/MEASURE=CORRELATION/STANDARDIZE=NONE.第三十六頁(yè),共44頁(yè)。結(jié)果分析距離分析的相似性矩陣,也就是Pearson相關(guān)系數(shù)矩陣。從表中可以看出,3個(gè)變量之間,身高和體重的相關(guān)系數(shù)最大,為0.735,體現(xiàn)出兩者之間具有更緊密的關(guān)系。比較而言,身高和肺活量之間的Pearson相關(guān)系數(shù)最小,兩者之間的相似性測(cè)度也最小,體現(xiàn)出兩者之間關(guān)系更遠(yuǎn)一些。

第三十七頁(yè),共44頁(yè)。實(shí)例二對(duì)飛機(jī)葉片的個(gè)案距離分析利用三種不同的儀器對(duì)飛機(jī)的10只葉片半徑分別進(jìn)行了測(cè)量,下表給出了測(cè)試結(jié)果。現(xiàn)對(duì)10只葉片進(jìn)行距離分析。10只葉片的3次測(cè)量數(shù)據(jù)第一次測(cè)量38.3238.1638.1937.9438.2237.7337.5737.6338.0738.47第二次測(cè)量38.4438.0737.9838.1637.8837.9437.8837.8238.2538.13第三次測(cè)量37.7638.2837.8537.8238.3237.5437.5137.8837.9838.63第三十八頁(yè),共44頁(yè)。步驟將三次測(cè)量變量移入變量列表,選擇“Bewteencases”其余選擇默認(rèn)值。命令語(yǔ)句為:PROXIMITIES第一次第二次第三次/VIEW=CASE/MEASURE=EUCLID/STANDARDIZE=NONE.第三十九頁(yè),共44頁(yè)。距離分析的相似性矩陣上表是個(gè)案距離分析的不相似矩陣。由于操作中利用默認(rèn)選項(xiàng)選擇距離統(tǒng)計(jì)量,所以這里的距離測(cè)度為Euclidean距離,是一種不相似距離測(cè)度,數(shù)值越大,表示兩個(gè)個(gè)案的不相似性越大,兩葉片差距也就越大。從表中可以看出,在給定的10只葉片中,第7只葉片和第10只葉片的距離最大;第6、7葉片距離最小。表示這兩只葉片半徑測(cè)量數(shù)據(jù)最接近。第四十頁(yè),共44頁(yè)。第九次實(shí)驗(yàn)內(nèi)容兩變量的相關(guān)分析(Bivariate過(guò)程)某地區(qū)10名健康兒童頭發(fā)和全血中的硒含量(1000ppm)如下,試作發(fā)硒與血硒的相關(guān)分析。編號(hào)發(fā)硒血硒編號(hào)發(fā)硒血硒123456789107466886991736696587313101311169714510第四十一頁(yè),共44頁(yè)。第十次實(shí)驗(yàn)內(nèi)容1.偏相關(guān)分析(Partial過(guò)程)某地29名13歲男童身高(cm)、體重(kg)和肺活量(ml)的數(shù)據(jù)如下表,試對(duì)該資料作控制體重影響作用的身高與肺活量相關(guān)分析。編號(hào)身體重肺活量編號(hào)身高體重肺活量123456789101112131415135.1139.9163.6146.5156.2156.4167.8149.7145.0148.5165.5135.0153.3152.0160.532.030.446.233.537.135.541.531.033.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論