




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
SPSS第十四講偏相關(guān)性分析第一頁(yè),共44頁(yè)。第十四講偏相關(guān)分析第一部分Excel與SPSS方式對(duì)比第二部分偏相關(guān)分析的概念第三部分偏相關(guān)分析的SPSS過(guò)程第四部分距離分析第二頁(yè),共44頁(yè)。相關(guān)分析的Excel方式例:一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國(guó)家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來(lái),該銀行的貸款額平穩(wěn)增長(zhǎng),但不良貸款額也有較大比例的提高,這給銀行業(yè)務(wù)的發(fā)展帶來(lái)較大壓力。為弄清楚不良貸款形成的原因,管理者希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)做些定量分析,以便找出控制不良貸款的辦法。第三頁(yè),共44頁(yè)。下表就是該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)。第四頁(yè),共44頁(yè)。第五頁(yè),共44頁(yè)。散點(diǎn)圖第六頁(yè),共44頁(yè)。Spss結(jié)果比較第七頁(yè),共44頁(yè)。偏相關(guān)分析
在多變量的情況下,變量之間的相關(guān)關(guān)系是很復(fù)雜的。因此,多元相關(guān)分析除了要利用上一講的簡(jiǎn)單相關(guān)系數(shù)外,還要計(jì)算偏相關(guān)系數(shù)。在對(duì)其他變量的影響進(jìn)行控制的條件下,衡量多個(gè)變量中某兩個(gè)變量之間的線性相關(guān)程度的指標(biāo)稱為偏相關(guān)系數(shù)。
第八頁(yè),共44頁(yè)。偏相關(guān)系數(shù)與簡(jiǎn)單相關(guān)系數(shù)區(qū)別
在計(jì)算簡(jiǎn)單相關(guān)系數(shù)時(shí):只需要掌握兩個(gè)變量的觀測(cè)數(shù)據(jù),并不考慮其他變量對(duì)這兩個(gè)變量可能產(chǎn)生的影響。
在計(jì)算偏相關(guān)系數(shù)時(shí):需要掌握多個(gè)變量的數(shù)據(jù),一方面考慮多個(gè)變量相互之間可能產(chǎn)生的影響,一方面又采用一定的方法控制其他變量,專門考察兩個(gè)特定變量的凈相關(guān)關(guān)系。變量1變量2關(guān)系變量1變量2關(guān)系變量3控制第九頁(yè),共44頁(yè)。例:在現(xiàn)實(shí)經(jīng)濟(jì)生活中,由于收入和價(jià)格常常都有不斷提高的趨勢(shì),如果不考慮收入對(duì)需求的影響,僅僅利用需求和價(jià)格的時(shí)間序列數(shù)據(jù)去計(jì)算簡(jiǎn)單相關(guān)系數(shù),就有可能得出價(jià)格越高需求越大的錯(cuò)誤結(jié)論。價(jià)格需求量收入水平上升未知上升還是下降呢?關(guān)系?第十頁(yè),共44頁(yè)。偏相關(guān)分析的公式表達(dá)在偏相關(guān)中,根據(jù)固定變量數(shù)目的多少,可分為零階偏相關(guān)、一階偏相關(guān)、…、(p-1)階偏相關(guān)。零階偏相關(guān)就是簡(jiǎn)單相關(guān)。如果用下標(biāo)0代表Y,下標(biāo)1代表X1,下標(biāo)2代表X2,則變量Y與變量X1之間的一階偏相關(guān)系數(shù)為:r01.2是剔除X2的影響之后,Y與X1之間的偏相關(guān)程度的度量。r01,r02,r12分別是Y,X1,X2兩兩之間的相關(guān)系數(shù)。第十一頁(yè),共44頁(yè)。如果增加變量X3,則變量Y與X1的二階偏相關(guān)系數(shù)為:依此類推變量Y與Xi的p-1階偏相關(guān)系數(shù)為:第十二頁(yè),共44頁(yè)。第四部分偏關(guān)分析的SPSS過(guò)程SPSS中相關(guān)分析可以通過(guò)Analyze菜單進(jìn)行(Correlate),Correlate菜單如圖所示。選擇其中第二個(gè)子菜單進(jìn)入到偏相關(guān)分析界面(Partial…)第十三頁(yè),共44頁(yè)。第一步:錄入數(shù)據(jù),打開偏相關(guān)分析對(duì)話框。第二步:將對(duì)話框中左側(cè)的變量列表框中選擇兩個(gè)變量,作為相關(guān)變量,移入Variables列表框中;選擇一個(gè)控制變量移入Controllingfor列表框中第十四頁(yè),共44頁(yè)。第三步:選擇檢驗(yàn)類型。變量窗口顯著性檢驗(yàn):雙尾檢驗(yàn)(默認(rèn))單尾檢驗(yàn)(相關(guān)方向明顯時(shí))顯示相關(guān)系數(shù)時(shí),顯示實(shí)際的顯著性概率相關(guān)變量控制變量第十五頁(yè),共44頁(yè)。第四步:打開OPTION選項(xiàng)框。均值與標(biāo)準(zhǔn)差,即顯示每個(gè)變量的均值、標(biāo)準(zhǔn)差和非缺失值的例數(shù)顯示零階相關(guān)矩陣,即Pearson相關(guān)矩陣僅剔除當(dāng)前分析的兩個(gè)變量值是缺失值的個(gè)案剔除帶有缺失值的所有個(gè)案第十六頁(yè),共44頁(yè)。已知有某河流的一年月平均流量觀測(cè)數(shù)據(jù)和該河流所在地區(qū)當(dāng)年的月平均雨量和月平均溫度觀測(cè)數(shù)據(jù),如表所示。試分析溫度與河水流量之間的相關(guān)關(guān)系。
第十七頁(yè),共44頁(yè)。第十八頁(yè),共44頁(yè)。相關(guān)分析的命令語(yǔ)句第十九頁(yè),共44頁(yè)。結(jié)果分析一、描述性統(tǒng)計(jì)量表中給出了個(gè)變量的均值、標(biāo)準(zhǔn)差和變量的非缺失值例數(shù)。第二十頁(yè),共44頁(yè)。相關(guān)系數(shù)
在月平均雨量作為控制變量的條件下,月平均流量和月平均氣溫間的偏相關(guān)為0.365,概率p值為0.270,在顯著性水平為0.05的條件下,月平均流量和月平均氣溫呈的正相關(guān)關(guān)系,說(shuō)明月平均流量和月平均氣溫的有線性影響但影響有限。第二十一頁(yè),共44頁(yè)。解釋看上去得到了兩個(gè)相反的結(jié)論,為什么呢?第二十二頁(yè),共44頁(yè)。距離分析一、距離分析的概念
距離分析是對(duì)觀測(cè)量之間或變量之間相似或不相似程度的一種測(cè)度,是計(jì)算一對(duì)變量之間或一對(duì)觀測(cè)量之間的廣義的距離。這些相似性或距離測(cè)度可以用于其它分析過(guò)程,例如因子分析、聚類分析等。在距離分析過(guò)程中,主要利用變量間的相似性測(cè)度(Similarities)和不相似性測(cè)度(Dissimilarities)度量?jī)烧咧g的關(guān)系有多像OR有多不像?第二十三頁(yè),共44頁(yè)。不相似性測(cè)度對(duì)定距型變量間距離描述的統(tǒng)計(jì)量,主要有:歐式距離(Euclideandistance)歐式距離的平方(SquaredEuclideandistan-ce)契比雪夫距離(Chebychev)絕對(duì)值距離(Block)閔可夫斯基距離(Minkowski)等。第二十四頁(yè),共44頁(yè)。對(duì)定序型變量之間距離的描述,主要有:卡方不相似測(cè)度(Chi-Squaremeasure)Phi方不相似測(cè)度(Phi-Squaremeasure)第二十五頁(yè),共44頁(yè)。對(duì)二值變量之間的距離描述,主要有:歐氏距離(Euclideandistance)平方歐氏距離(SquaredEuclideandistance)LaneandWilliams不相似性測(cè)度(LaneandWilliams)等。第二十六頁(yè),共44頁(yè)。相似性測(cè)度兩變量之間可以定義相似性測(cè)度統(tǒng)計(jì)量,用來(lái)對(duì)兩變量之間的相似性進(jìn)行數(shù)量化描述。針對(duì)定距型變量,主要有:
Peason相關(guān)系數(shù)夾角余弦距離等。對(duì)于二值變量的相似性測(cè)度主要包括:簡(jiǎn)單匹配系數(shù)(Simplematching)Jaccard相似性指數(shù)(Jaccard)Hamann相似性測(cè)度(Hamann)等20余種。相似性或不相似性測(cè)度還可用與其它模塊,例如:因子分析、聚類分析以及多維尺度分析的進(jìn)一步分析,以助于分析復(fù)合數(shù)據(jù)集。第二十七頁(yè),共44頁(yè)。Kulczynski1:KulczynskiⅠ型配對(duì)系數(shù),分母為總數(shù)與配對(duì)數(shù)之差,分子為非配對(duì)數(shù),分子與分母的權(quán)重相同;Kulczynski2:Kulczynski平均條件概率;SokalandSneath4:SokalandSneath條件概率;Hamann:Hamann概率;Lambda:Goodman-Kruskai相似測(cè)量的λ值;Anderberg'sD:以一個(gè)變量狀態(tài)預(yù)測(cè)另一個(gè)變量狀態(tài);Yule'sY:Yule綜合系數(shù),屬于2×2四格表的列聯(lián)比例函數(shù);Yule‘sQ:Goodman-Kruskalγ值,屬于2×2四格表的列聯(lián)比例函數(shù)。Ochiai:Ochiai二分余弦測(cè)量;SokalandSneath5:SokalandSneathⅤ型相似測(cè)量;Phi4pointcorrelation:Pearson相關(guān)系數(shù)的平方值;Dispersion:Dispersion相似測(cè)量。二值變量的相似性測(cè)度選項(xiàng)第二十八頁(yè),共44頁(yè)。RussellandRao:以二分點(diǎn)乘積為配對(duì)系數(shù);Simplematching:以配對(duì)數(shù)與總對(duì)數(shù)的比例為配對(duì)系數(shù);Jaccard:相似比例,分子與分母中的配對(duì)數(shù)與非配對(duì)數(shù)給予相同的權(quán)重;Dice:Dice配對(duì)系數(shù),分子與分母中的配對(duì)數(shù)給予加倍的權(quán)重;RogersandTanimoto:RogersandTanimoto配對(duì)系數(shù),分母為配對(duì)數(shù),分子為非配對(duì)數(shù),非配對(duì)數(shù)給予加倍的權(quán)重;SokalandSneath1:SokalandSneathⅠ型配對(duì)系數(shù),分母為配對(duì)數(shù),分子為非配對(duì)數(shù),配對(duì)數(shù)給予加倍的權(quán)重;SokalandSneath2:SokalandSneathⅡ型配對(duì)系數(shù),分子與分母均為非配對(duì)數(shù),但分子給予加倍的權(quán)重;SokalandSneath3:SokalandSneathⅢ型配對(duì)系數(shù),分母為配對(duì)數(shù),分子為非配對(duì)數(shù),分子與分母的權(quán)重相同;第二十九頁(yè),共44頁(yè)。已知有我國(guó)六城市2004年各月的日照時(shí)數(shù)數(shù)據(jù)如表所示。請(qǐng)分析各城市日照數(shù)是否近似。
第三十頁(yè),共44頁(yè)。執(zhí)行【Analyze】/【Correlate】/【Distances】命令,彈出【Distances】對(duì)話框變量列表選擇變量個(gè)案(觀測(cè)量)標(biāo)識(shí)變量計(jì)算距離選項(xiàng):個(gè)案距離,計(jì)算個(gè)案間的距離;變量距離,計(jì)算變量之間的距離第三十一頁(yè),共44頁(yè)。度量方式等距間隔數(shù)據(jù)選項(xiàng)計(jì)數(shù)數(shù)據(jù)選項(xiàng)二值數(shù)值選項(xiàng)轉(zhuǎn)換轉(zhuǎn)換選項(xiàng)轉(zhuǎn)換測(cè)度選項(xiàng)第三十二頁(yè),共44頁(yè)。結(jié)果解讀取值越大說(shuō)明近似程度越低,反之亦然第三十三頁(yè),共44頁(yè)。例:測(cè)得30名13歲男童的身高、體重、肺活量的數(shù)據(jù)。對(duì)身高、體重和肺活量進(jìn)行變量距離分析。編號(hào)身高體重肺活量1135930.420003163.646.227504146.533.525005156.237.127506156.435.520007167.841.527508149.7311500編號(hào)身高體重肺活量914533250010148.537.2225011165.549.530001213527.6125013153.34127501415232175015160.547.222501615347.21750第三十四頁(yè),共44頁(yè)。第三十五頁(yè),共44頁(yè)。距離分析命令語(yǔ)句PROXIMITIES
身高體重肺活量
/VIEW=VARIABLE/MEASURE=CORRELATION/STANDARDIZE=NONE.第三十六頁(yè),共44頁(yè)。結(jié)果分析距離分析的相似性矩陣,也就是Pearson相關(guān)系數(shù)矩陣。從表中可以看出,3個(gè)變量之間,身高和體重的相關(guān)系數(shù)最大,為0.735,體現(xiàn)出兩者之間具有更緊密的關(guān)系。比較而言,身高和肺活量之間的Pearson相關(guān)系數(shù)最小,兩者之間的相似性測(cè)度也最小,體現(xiàn)出兩者之間關(guān)系更遠(yuǎn)一些。
第三十七頁(yè),共44頁(yè)。實(shí)例二對(duì)飛機(jī)葉片的個(gè)案距離分析利用三種不同的儀器對(duì)飛機(jī)的10只葉片半徑分別進(jìn)行了測(cè)量,下表給出了測(cè)試結(jié)果。現(xiàn)對(duì)10只葉片進(jìn)行距離分析。10只葉片的3次測(cè)量數(shù)據(jù)第一次測(cè)量38.3238.1638.1937.9438.2237.7337.5737.6338.0738.47第二次測(cè)量38.4438.0737.9838.1637.8837.9437.8837.8238.2538.13第三次測(cè)量37.7638.2837.8537.8238.3237.5437.5137.8837.9838.63第三十八頁(yè),共44頁(yè)。步驟將三次測(cè)量變量移入變量列表,選擇“Bewteencases”其余選擇默認(rèn)值。命令語(yǔ)句為:PROXIMITIES第一次第二次第三次/VIEW=CASE/MEASURE=EUCLID/STANDARDIZE=NONE.第三十九頁(yè),共44頁(yè)。距離分析的相似性矩陣上表是個(gè)案距離分析的不相似矩陣。由于操作中利用默認(rèn)選項(xiàng)選擇距離統(tǒng)計(jì)量,所以這里的距離測(cè)度為Euclidean距離,是一種不相似距離測(cè)度,數(shù)值越大,表示兩個(gè)個(gè)案的不相似性越大,兩葉片差距也就越大。從表中可以看出,在給定的10只葉片中,第7只葉片和第10只葉片的距離最大;第6、7葉片距離最小。表示這兩只葉片半徑測(cè)量數(shù)據(jù)最接近。第四十頁(yè),共44頁(yè)。第九次實(shí)驗(yàn)內(nèi)容兩變量的相關(guān)分析(Bivariate過(guò)程)某地區(qū)10名健康兒童頭發(fā)和全血中的硒含量(1000ppm)如下,試作發(fā)硒與血硒的相關(guān)分析。編號(hào)發(fā)硒血硒編號(hào)發(fā)硒血硒123456789107466886991736696587313101311169714510第四十一頁(yè),共44頁(yè)。第十次實(shí)驗(yàn)內(nèi)容1.偏相關(guān)分析(Partial過(guò)程)某地29名13歲男童身高(cm)、體重(kg)和肺活量(ml)的數(shù)據(jù)如下表,試對(duì)該資料作控制體重影響作用的身高與肺活量相關(guān)分析。編號(hào)身體重肺活量編號(hào)身高體重肺活量123456789101112131415135.1139.9163.6146.5156.2156.4167.8149.7145.0148.5165.5135.0153.3152.0160.532.030.446.233.537.135.541.531.033.
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于閱讀策略的檔案袋評(píng)價(jià)在高中英語(yǔ)閱讀教學(xué)中的應(yīng)用研究
- 清代宜陽(yáng)縣聚落地理研究
- 兒科疾病健康教育
- 課堂如何組織管理學(xué)生
- 剪切音樂(lè)教案小班健康
- 領(lǐng)土安全課件教學(xué)
- 預(yù)防氣象災(zāi)害班會(huì)課件
- 森林防火安全培訓(xùn)
- 項(xiàng)目采購(gòu)管理課件教學(xué)
- 汽車配套產(chǎn)業(yè)基地項(xiàng)目安全管理方案
- 腦卒中溶栓護(hù)理課件
- 2025年城建技師考試題庫(kù)及答案
- 2025年中國(guó)LTCC技術(shù)行業(yè)市場(chǎng)現(xiàn)狀、前景分析研究報(bào)告(智研咨詢發(fā)布)
- 租賃住房培訓(xùn)課件下載
- 房管員試題資料
- 2025至2030中國(guó)扭蛋機(jī)行業(yè)市場(chǎng)發(fā)展現(xiàn)狀及商業(yè)模式與投融資戰(zhàn)略報(bào)告
- 2024年蘇州昆山國(guó)創(chuàng)投資集團(tuán)有限公司招聘筆試真題
- 商場(chǎng)吸煙區(qū)管理制度
- 2025年四川省成都市中考地理真題(原卷版)
- 糖尿病足截肢術(shù)后護(hù)理
- 廣東省東莞市2022-2023學(xué)年高二下學(xué)期期末物理試題(含答案)
評(píng)論
0/150
提交評(píng)論