多元統(tǒng)計分析(數(shù)學(xué)建模)市公開課一等獎省賽課獲獎?wù)n件_第1頁
多元統(tǒng)計分析(數(shù)學(xué)建模)市公開課一等獎省賽課獲獎?wù)n件_第2頁
多元統(tǒng)計分析(數(shù)學(xué)建模)市公開課一等獎省賽課獲獎?wù)n件_第3頁
多元統(tǒng)計分析(數(shù)學(xué)建模)市公開課一等獎省賽課獲獎?wù)n件_第4頁
多元統(tǒng)計分析(數(shù)學(xué)建模)市公開課一等獎省賽課獲獎?wù)n件_第5頁
已閱讀5頁,還剩180頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)學(xué)建模講座多元統(tǒng)計分析為振興中華而讀書!第1頁第一部分理論分析1.1相關(guān)分析1.2路徑分析1.3結(jié)構(gòu)方程模型1.4聚類分析1.5因子分析第2頁相關(guān)分析第3頁(一)相關(guān)關(guān)系(1)函數(shù)關(guān)系:(如:銷售額與銷售量;圓面積和圓半徑.)是事物間一個一一對應(yīng)確實(shí)定性關(guān)系.即:當(dāng)一個變量x取一定值時,另一變量y能夠依確定關(guān)系取一個確定值(2)統(tǒng)計關(guān)系:(如:收入和消費(fèi);身高遺傳.)事物間關(guān)系不是確定性.即:當(dāng)一個變量x取一定值時,另一變量y取值可能有幾個.一個變量值不能由另一個變量唯一確定第4頁概述統(tǒng)計關(guān)系常見類型:線性相關(guān):正線性相關(guān)、負(fù)線性相關(guān)非線性相關(guān)統(tǒng)計關(guān)系不象函數(shù)關(guān)系那樣直接,但卻普遍存在,且有強(qiáng)有弱.怎樣測度?第5頁概述(二)相關(guān)分析任務(wù)研究對象:統(tǒng)計關(guān)系相關(guān)分析意在測度變量間線性關(guān)系強(qiáng)弱程度第6頁相關(guān)分析(一)目標(biāo)經(jīng)過樣本數(shù)據(jù),研究兩變量間線性相關(guān)程度強(qiáng)弱.

(二)基本方法繪制散點(diǎn)圖、計算相關(guān)系數(shù)第7頁

繪制散點(diǎn)圖(一)散點(diǎn)圖將數(shù)據(jù)以點(diǎn)形式繪制在直角平面上.比較直觀,能夠用來發(fā)覺變量間關(guān)系和可能趨勢.表達(dá)了正相關(guān)趨勢第8頁繪制散點(diǎn)圖(二)基本操作步驟(1)菜單項選擇項:graphs->scatter(2)選擇散點(diǎn)圖類型:simple:簡單散點(diǎn)圖(顯示一對變量散點(diǎn)圖)overlay:重合散點(diǎn)圖(顯示多對變量散點(diǎn)圖)(3)選擇x軸和y軸變量(4)選擇分組變量(setmarkersby):分別以不一樣顏色點(diǎn)表示(5)選擇標(biāo)識變量(labelcaseby):散點(diǎn)圖上可帶有標(biāo)識變量值(如:職員號)第9頁計算相關(guān)系數(shù)(一)相關(guān)系數(shù)(1)作用:以準(zhǔn)確相關(guān)系數(shù)(r)表達(dá)兩個變量間線性關(guān)系程度.r:[-1,+1];r=1:完全正相關(guān);r=-1:完全負(fù)相關(guān);r=0:無線性相關(guān);|r|>0.8:強(qiáng)相關(guān);|r|<0.3:弱相關(guān)第10頁計算相關(guān)系數(shù)(一)相關(guān)系數(shù)(2)說明:相關(guān)系數(shù)只是很好地度量了兩變量間線性相關(guān)程度,不能描述非線性關(guān)系.如:x和y取值為:(-1,-1)(-1,1)(1,-1)(1,1)

r=0但xi2+yi2=2數(shù)據(jù)中存在極端值時不好如:(1,1)(2,2)(3,3),(4,4),(5,5),(6,1)r=0.33但總體上表現(xiàn)出:x=y應(yīng)結(jié)合散點(diǎn)圖分析第11頁計算相關(guān)系數(shù)(一)相關(guān)系數(shù)(3)種類:簡單線性相關(guān)系數(shù)(Pearson):針對定距數(shù)據(jù).

(如:身高和體重)第12頁計算相關(guān)系數(shù)(一)相關(guān)系數(shù)(3)種類:Spearman相關(guān)系數(shù):用來度量定序或定類變量間線性相關(guān)關(guān)系(如:不一樣年紀(jì)段與不一樣收入段,職稱和受教育年份)利用秩(數(shù)據(jù)排序次序).認(rèn)為:假如x與y相關(guān),則對應(yīng)秩Ui、Vi也含有同時性.首先得到兩變量中各數(shù)據(jù)秩(Ui、Vi),并計算Di2統(tǒng)計量.計算Spearman秩相關(guān)系數(shù),與簡單相關(guān)系數(shù)形式完全相同.若兩變量存在強(qiáng)正相關(guān)性,則Di2應(yīng)較小,秩序相關(guān)系數(shù)較大.若兩變量存在強(qiáng)負(fù)相關(guān)性,則Di2應(yīng)較大,秩序相關(guān)系數(shù)為負(fù),絕對值較大第13頁計算相關(guān)系數(shù)(一)相關(guān)系數(shù)(3)種類:Kendall相關(guān)系數(shù):度量定序定類變量間線性相關(guān)關(guān)系首先計算一致對數(shù)目(U)和非一致對數(shù)目(V)如:對x和y求秩后為:x:24351y:34152x秩按自然次序排序后:x:12345

y:23145

一致對:(2,3)(2,4)(2,5)(3,4)(3,5)(1,4)(1,5)(4,5)非一致對:(2,1)(3,1)然后計算Kendall相關(guān)系數(shù).若兩變量存在強(qiáng)相關(guān)性,則V較小,秩序相關(guān)系數(shù)較大;若兩變量存在強(qiáng)負(fù)關(guān)性,則V較大,秩序相關(guān)系數(shù)為負(fù),絕對值較大第14頁計算相關(guān)系數(shù)(二)相關(guān)系數(shù)檢驗(yàn)應(yīng)對兩變量來自總體是否相關(guān)進(jìn)行統(tǒng)計推斷.原因:抽樣隨機(jī)性、樣本容量小等(1)H0:兩總體零相關(guān)(2)結(jié)構(gòu)統(tǒng)計量簡單相關(guān)系數(shù)Spearman系數(shù),大樣本下,近似正態(tài)分布kendall系數(shù),大樣本下,近似正態(tài)分布第15頁計算相關(guān)系數(shù)(二)相關(guān)系數(shù)檢驗(yàn)(3)計算統(tǒng)計量值,并得到對應(yīng)相伴概率p(4)結(jié)論:假如p<=a,則拒絕H0,兩總體存在線性相關(guān);假如p>a,不能拒絕H0.第16頁計算相關(guān)系數(shù)(三)基本操作步驟(1)菜單項選擇項:analyze->correlate->bivariate...(2)選擇計算相關(guān)系數(shù)變量到variables框.(3)選擇相關(guān)系數(shù)(correlationcoefficients).(4)顯著性檢驗(yàn)(testofsignificance)tow-tailed:輸出雙尾概率P.one-tailed:輸出單尾概率P第17頁計算相關(guān)系數(shù)(四)其它選項statistics選項:僅當(dāng)計算簡單相關(guān)系數(shù)時,選擇輸出哪些統(tǒng)計量.meansandstandarddeviations:均值、標(biāo)準(zhǔn)差;cross-productdeviationsandcovariances:分別輸出兩變量離差平方和(sumofsquare分母)、兩變量差積和(cross-products分子)、協(xié)方差(covariance以上各個數(shù)據(jù)除以n-1)第18頁偏相關(guān)分析(一)偏相關(guān)系數(shù)(1)含義: 在控制了其它變量影響下計算兩變量相關(guān)系數(shù)。虛假相關(guān).研究商品需求量和價格、消費(fèi)者收入之間關(guān)系.因?yàn)?需求量和價格之間相關(guān)關(guān)系包含了消費(fèi)者收入對商品需求量影響;收入對價格也產(chǎn)生影響,并經(jīng)過價格變動傳遞到對商品需求量影響中。又如:糧食產(chǎn)量與平均氣溫、月降水量、平均日照時間、溫度之間關(guān)系研究。第19頁偏相關(guān)分析(2)計算方法:第20頁偏相關(guān)分析(二)基本操作步驟(1).菜單項選擇項:analyze->correlate->partial…(2).選擇將參加計算變量到variable框.(3).選擇控制變量到controllingfor框。(4)option選項:zero-ordercorrelations:輸出簡單相關(guān)系數(shù)矩陣第21頁路徑分析第22頁2025/4/3023第十章路徑分析

目錄上頁下頁返回結(jié)束

20世紀(jì)初,“Pearson原理”占著生物遺傳學(xué)(在過去幾乎就是我們現(xiàn)在所稱作統(tǒng)計學(xué))統(tǒng)治地位。Pearson原理一個基本內(nèi)容就是相關(guān)關(guān)系是現(xiàn)實(shí)生活中最基本關(guān)系,而因果關(guān)系僅僅是完全相關(guān)(理論)極限。這種理論認(rèn)為沒必要尋找變量之間因果關(guān)系,只需計算相關(guān)系數(shù)。然而相關(guān)分析逐步暴露出本身很多局限:一是相關(guān)分析僅僅反應(yīng)變量之間線性關(guān)系;二是相關(guān)分析反應(yīng)變量之間關(guān)系是對稱,而很多變量之間關(guān)系是非對稱;三是只有在正態(tài)假設(shè)下,相關(guān)思想才是有效。第23頁2025/4/3024第十章路徑分析

目錄上頁下頁返回結(jié)束

在遺傳學(xué)中,很多現(xiàn)象含有顯著因果關(guān)系,如父代與子代基因關(guān)系,父代在前,子代在后,二者關(guān)系只能是單向,而非對稱。對這種變量結(jié)構(gòu)進(jìn)行思索,遺傳學(xué)家SewallWright于1918-1921年提出路徑分析(pathanalysis),用來分析變量間因果關(guān)系。當(dāng)代路徑分析由生物遺傳學(xué)家、心理測驗(yàn)學(xué)家、計量經(jīng)濟(jì)學(xué)家以及社會學(xué)家推進(jìn),引入隱變量(latentvariable,又稱unmeasuredvariable,不可觀察變量),并允許變量間含有測量誤差,而且極大似然預(yù)計代替了最小二乘法,成為路徑系數(shù)主流預(yù)計方法。第24頁2025/4/3025第十章路徑分析

目錄上頁下頁返回結(jié)束

路徑分析現(xiàn)在成為多元分析一個主要方法,廣泛應(yīng)用于遺傳學(xué)、社會學(xué)、心理學(xué)、經(jīng)濟(jì)問題和市場調(diào)研領(lǐng)域。然而習(xí)慣上把基于最小二乘傳統(tǒng)路徑分析稱作路徑分析,而把基于極大似然路徑分析稱作結(jié)構(gòu)方程式模型(StructuralEquationModeling,SEM)。本節(jié)主要介紹傳統(tǒng)路徑分析,不進(jìn)行尤其說明,本節(jié)所提到路徑分析均指基于最小二乘路徑分析,結(jié)構(gòu)方程式模型方在下節(jié)介紹。第25頁2025/4/3026

目錄上頁下頁返回結(jié)束

一、路徑圖路徑分析主要工具是路徑圖,它采取一條帶箭頭線(單箭頭表示變量間因果關(guān)系,雙箭頭表示變量間相關(guān)關(guān)系)表示變量間預(yù)先設(shè)定關(guān)系,箭頭表明變量間關(guān)系是線性,很顯著,箭頭表示著一個因果關(guān)系發(fā)生方向。在路徑圖中,觀察變量普通寫在矩形框內(nèi),不可觀察變量普通寫在橢圓框內(nèi),對于簡單路徑模型,能夠直接用字母表示變量,繪出路徑圖。第26頁2025/4/3027

目錄上頁下頁返回結(jié)束

圖10-1是一個簡單路徑路,A是父親智商,B是母親智商,C1、C2是兩個成年兒女智商,是與A,B不相關(guān)另外原因變量。普通來說,父母親智商之間不存在關(guān)系;父母親智商對兒女智商存在因果關(guān)系,用單箭頭表示,兒女之間,存在相關(guān)關(guān)關(guān)系,用雙箭頭表示。箭頭上字母表示路徑系數(shù),路徑系數(shù)反應(yīng)原因變量對結(jié)果變量相對影響大小。在路徑分析中普通采取經(jīng)過標(biāo)準(zhǔn)化后變量,沒有尤其說明,均指經(jīng)過標(biāo)準(zhǔn)化后變量。能夠把圖10-1寫為方程式形式:(10.1)第27頁2025/4/3028

目錄上頁下頁返回結(jié)束

式(10.1)實(shí)際上是普通多元回歸方程,多元回歸分析是因果關(guān)系模型一個,但它是一個比較簡單因果關(guān)系模型,各個自變量對因變量作用并列存在,它僅包含一個步驟因果結(jié)構(gòu)。路徑分析優(yōu)勢在于它能夠容納多步驟因果結(jié)構(gòu),經(jīng)過路徑圖把這些因果關(guān)系很清楚地表示出來,據(jù)此進(jìn)行更深層次分析,如比較各種原因之間相對主要程度,計算變量與變量之間直接與間接影響,這在后面會包括到。圖10-2是相關(guān)一個消費(fèi)性電子產(chǎn)品(如手機(jī))路徑分析例子(這里省略了路徑系數(shù)),四個變量耐用性、操作簡單性、通話效果和價格兩兩相關(guān),決定感知價值,同時經(jīng)過感知價值決定忠誠度。相對于圖10-1,它含有兩層因果關(guān)系。接下來主要以圖10-2為例,說明路徑圖中一些基本概念。第28頁2025/4/3029

目錄上頁下頁返回結(jié)束

§10.1.1

路徑圖第29頁2025/4/3030

目錄上頁下頁返回結(jié)束

路徑圖上變量分為兩大類:一類是外生變量(exogenousvariable,又稱獨(dú)立變量,源變量),它不受模型中其它變量影響,如圖10-2中耐用性、操作簡單性、通話效果和價格。與此相反,另一類是內(nèi)生變量(endogenousvariable,又稱因變量或下游變量),在路徑圖上最少有一個箭頭指向它,它被模型中其它一些變量所決定,如圖10-2中感知價值由耐用性、操作簡單性、通話效果和價格四個變量和隨機(jī)誤差e5決定,忠誠度取決于四個外生變量、感知價值和隨機(jī)誤差e6。另外,我們能夠?qū)⒙窂綀D中不影響其它變量內(nèi)生變量稱為最終止果變量(ultimateresponsevariable),最終止果變量不一定只有一個。圖10-2中忠誠度是最終止果變量。第30頁2025/4/3031

目錄上頁下頁返回結(jié)束

其它變量(A)對內(nèi)生變量(B)影響有兩種情況:若A直接經(jīng)過單向箭頭對B含有因果影響,稱A對B有直接作用(directeffect);若A對B作用是間接地經(jīng)過其它變量(C)起作用,稱A對B有間接作用(indirecteffect),稱C為中間變量(mediatorvariable)。變量間間接作用經(jīng)常由各種路徑最終總合而成。圖10-2中,四個外生變量耐用性、操作簡單性、通話效果和價格既對忠誠度有直接作用,同時經(jīng)過感知價值對忠誠度含有間接作用。第31頁2025/4/3032

目錄上頁下頁返回結(jié)束

假如模型中包含中間變量,首先從理論角度考慮,這個中間作用是否有理論依據(jù),其次實(shí)際工作者會提出這么問題:“模型中中間變量中間影響顯著嗎?”,這些問題包括到對中間變量間接作用進(jìn)行檢驗(yàn)。Barron,R.M.&KennyD.(1986)提出了檢驗(yàn)中間變量間接作用是否統(tǒng)計顯著一個做法。他們利用基于普通最小二乘多元回歸進(jìn)行,以圖10-2為例說明這種做法:第一步:用中間變量(感知價值)對外生變量耐用性、操作簡單性、通話效果和價格四個變量進(jìn)行回歸;第二步:用內(nèi)生變量(忠誠度)對第一步中四個變量進(jìn)行回歸;第三步:用忠誠度對第一步中四個變量以及中間變量感知價值進(jìn)行回歸。第32頁2025/4/3033

目錄上頁下頁返回結(jié)束

Agarwal,S.&Teas,R.K.(1997)工作表明“假如(a)在第一步預(yù)計中解釋變量統(tǒng)計顯著;(b)在第二步預(yù)計中解釋變量統(tǒng)計顯著;(c)在第三步預(yù)計中中間變量統(tǒng)計顯著,則說明中間變量間接作用顯著”.假設(shè)對圖10-2進(jìn)行間接作用檢驗(yàn),得到表10-1。第33頁2025/4/3034

目錄上頁下頁返回結(jié)束

對每一外生變量,存在三種可能中間結(jié)果:沒有間接作用(nomediation),部分間接作用(partialmediation)和完全間接作用(fullmediation)。假如第一步中外生變量回歸系數(shù)不是統(tǒng)計顯著或者第三步中(中間變量)感知價值回歸系數(shù)不顯著,說明該外生變量不存在間接作用;假如某一外生變量(如耐用性、操作簡單性和通話效果)在第一步和第三步中回歸系數(shù)都是統(tǒng)計顯著,說明該外生變量存在部分間接作用;假如某外生變量(價格)回歸系數(shù)在第一步顯著,而在第三步不顯著,說明該外生變量存在完全間接作用。第34頁2025/4/3035

目錄上頁下頁返回結(jié)束

廣義路徑模型有兩種基本類型:遞歸模型和非遞歸模型。兩種模型在分析時有所不一樣,遞歸模型能夠直接經(jīng)過最小二乘求解,而非遞歸模型求解比較復(fù)雜。盡管本章主要介紹基于最小二乘路徑分析(即遞歸路徑模型),但同時也要求讀者能夠預(yù)先正確判斷一個模型所屬類型,才能確保應(yīng)用路徑分析不會犯錯。因果關(guān)系結(jié)構(gòu)中全部為單向鏈條關(guān)系、無反饋?zhàn)饔媚P头Q為遞歸模型(recursivemodel)。無反饋?zhàn)饔靡馕吨?,各?nèi)生變量與其原因變量誤差項之間或各兩個內(nèi)生變量誤差項之間必須相互獨(dú)立。與遞歸模型相正確另一類模型稱作非遞歸模型(nonrecursivemodel)。普通來說,非遞歸模型相對來說輕易判斷,假如一個模型不包含非遞規(guī)模型特征,它便是遞歸模型。第35頁2025/4/3036

目錄上頁下頁返回結(jié)束

假如一個路徑模型包含以下四種情況,便是非遞歸模型。情況一:模型中任何兩個變量之間存在直接反饋?zhàn)饔?,在路徑圖上表示為雙向因果關(guān)系。如圖10-3(a)所表示。情況二:某變量存在本身反饋?zhàn)饔?,即該變量存在自相關(guān),如圖10-3(b)所表示。第36頁2025/4/3037

目錄上頁下頁返回結(jié)束

情況三:變量之間即使沒有直接反饋,不過存在間接反饋?zhàn)饔?,即順著某一變量及隨即變量路徑方向循序前進(jìn),經(jīng)過若干變量后,又能返回這一起始變量,如圖10-3(c)所表示。第37頁2025/4/3038

目錄上頁下頁返回結(jié)束

情況四:內(nèi)生變量誤差項與其它相關(guān)項相關(guān),如結(jié)果變量誤差項與其原因項相關(guān)(圖10-3(d)),或者不一樣變量之間誤差項之間存在相關(guān)(圖10-3(e))。第38頁2025/4/3039

目錄上頁下頁返回結(jié)束

使用最小二乘預(yù)計方法要求路徑模型含有一些假設(shè)要求和限制,現(xiàn)在總結(jié)以下:

(1)首先要求模型中各變量函數(shù)關(guān)系為線性、可加;不然不能采取回歸方法預(yù)計路徑系數(shù)。假如處理變量之間交互作用,把交互項看作一個單獨(dú)變量,此時它與其它變量函數(shù)關(guān)系一樣滿足線性、可加。

(2)模型中各變量均為等間距測度。盡管路徑分析中通常會使用二分?jǐn)?shù)據(jù)(dichotomiesdata)或者次序數(shù)據(jù)(ordinaldata),然而不能使用超出一個值虛擬變量,因?yàn)檫@會違反遞歸性要求。第39頁2025/4/3040

目錄上頁下頁返回結(jié)束

(3)每一內(nèi)生變量誤差項不得與其前置變量相關(guān),同時也不得與其它內(nèi)生變量及其誤差項相關(guān)。這是對模型遞歸性要求。另外,模型不考慮外生變量相關(guān)性,即不對外生變量相關(guān)進(jìn)行分析。(4)模型中因果關(guān)系必須為單向,不得包含各種形式反饋?zhàn)饔?。這一樣是對模型遞歸性要求。(5)各變量均為可觀察變量,而且各變量測量不能存在誤差。這兩個弱點(diǎn)在SEM技術(shù)中得到了克服,已經(jīng)發(fā)展了一套成熟處理隱變量和測量誤差技術(shù)。(6)變量間多重共線性程度不能太高,不然路徑系數(shù)預(yù)計值誤差將會很大。(7)需要有足夠樣本量。Kline(1998)提議樣本量個數(shù)應(yīng)該是需要預(yù)計參數(shù)個數(shù)10倍(20倍愈加理想)。第40頁2025/4/3041

目錄上頁下頁返回結(jié)束

其中,(10.2)在上述假設(shè)下,采取最小二乘法能夠很輕易求解各個參數(shù)值,見文件[3],而且能夠單獨(dú)對其中一個方程求解。上述假設(shè)條件用數(shù)學(xué)符號很輕易說明,但有些抽象。任何一個(遞歸)路徑模型都能夠用結(jié)構(gòu)方程組表示,假設(shè)和分別為模型中內(nèi)生和外生可觀側(cè)變量向量;是參系數(shù)矩陣,能夠證實(shí),若為路徑遞歸模型,則總能夠?qū)憺樯先蔷仃?。是參系?shù)矩陣,e為內(nèi)生變量所對應(yīng)誤差項,滿足期望為零,兩兩不相關(guān)。則該路徑模型結(jié)構(gòu)方程組為:和

第41頁2025/4/3042

目錄上頁下頁返回結(jié)束

作為本節(jié)結(jié)束,我們需要提醒讀者:一個好路徑圖并不意味著一定包含有盡可能多箭頭;相反,統(tǒng)計學(xué)上最感興趣情形是:應(yīng)該尋找盡可能少箭頭去聯(lián)結(jié)盡可能少變量,而這時路徑圖又能對所代表樣本擬合得好,即所謂模型簡約性(parsimony),在后面相關(guān)模型擬合度檢驗(yàn)中我們對這段話會有更深體會。第42頁2025/4/3043

目錄上頁下頁返回結(jié)束

路徑分析技術(shù)是從分解相關(guān)系數(shù)發(fā)展出來,所以分解相關(guān)系數(shù)在路徑分析中帶有普通性意義,而且是路徑分析中很主要一部分。經(jīng)過對原因變量和結(jié)果變量相關(guān)系數(shù)分解,我們能夠很清楚地看出造成相關(guān)關(guān)系各種原因。有時也包括到對回歸系數(shù)分解,我們這里不進(jìn)行介紹。下面以一例子說明相關(guān)系數(shù)分解過程。圖10-4為一假想六個變量路徑圖:A,B,C為三個兩兩相關(guān)外生變量,A,B和殘差項e4共同決定D,B,C,D和殘差項e5決定E,最終,D,E和殘差項e6影響最終止果變量F,共含有三層因果關(guān)系。對應(yīng)于路徑圖,我們寫出結(jié)構(gòu)方程組:第43頁2025/4/3044

目錄上頁下頁返回結(jié)束

第44頁2025/4/3045

目錄上頁下頁返回結(jié)束

外生變量相關(guān)關(guān)系在圖中表達(dá),內(nèi)生變量誤差項之間獨(dú)立,內(nèi)生變量誤差項與其前置變量之間獨(dú)立。在式(10.3)中,假如路徑系數(shù)p14,p24已知,則D方差能夠從上式計算出大小。很輕易看出,對其它表示式存在一樣結(jié)果,這里只是提醒讀者,殘差項路徑系數(shù)由其它路徑系數(shù)決定,而且該內(nèi)生變量與其誤差項相關(guān)系數(shù)即為誤差項路徑系數(shù);另外,殘差項路徑系數(shù)可由多元回歸決定系數(shù)計算出,它們之間關(guān)系為:

,詳細(xì)證實(shí)可參考[8]。第45頁2025/4/3046

目錄上頁下頁返回結(jié)束

下面考慮相關(guān)系數(shù)分解,首先分解A,D之間相關(guān)系數(shù),因?yàn)楦髯兞烤?jīng)過標(biāo)準(zhǔn)化處理,所以A,D相關(guān)系數(shù)

等于A,D乘積期望值。即(變量D用式10.3代替)第46頁2025/4/3047

目錄上頁下頁返回結(jié)束

第47頁2025/4/3048

目錄上頁下頁返回結(jié)束

第48頁2025/4/3049

目錄上頁下頁返回結(jié)束

第49頁2025/4/3050

目錄上頁下頁返回結(jié)束

第50頁2025/4/3051

目錄上頁下頁返回結(jié)束

第51頁2025/4/3052

目錄上頁下頁返回結(jié)束

經(jīng)過上面對相關(guān)系數(shù)分解,我們能夠總結(jié)出,相關(guān)系數(shù)分解可能產(chǎn)生四種類型組成部分:(1)直接作用;(2)間接作用;(3)因?yàn)樵蜃兞肯嚓P(guān)而產(chǎn)生未析部分;(4)因?yàn)楣餐虼嬖诙a(chǎn)生偽相關(guān)部分。路徑系數(shù)分解結(jié)果普通經(jīng)過報表形式把各種作用展現(xiàn)出來,第五節(jié)實(shí)例分析會給讀者提供一個報表形式。然而,假如按照上面步驟,相關(guān)系數(shù)分解將是非常繁瑣。Wright提供了從路徑圖直接分解規(guī)則。Wright認(rèn)為,對于一個遞歸性路徑模型,任何兩個變量相關(guān)系數(shù)都能夠表示成連接這兩點(diǎn)之間全部復(fù)合路徑之和;而這個復(fù)合路徑是按下述三個規(guī)則選?。╓right規(guī)則):第52頁2025/4/3053

目錄上頁下頁返回結(jié)束

(1)這個復(fù)合路徑?jīng)]有閉合環(huán)路;(2)在這個復(fù)合路徑中箭頭取向是不可有“先向前,再向后”,也就是說該路徑鏈上不止兩個箭頭時,要“先向后”盡可能多次數(shù),“再向前”盡可能少次數(shù)。(3)對于有多個雙箭頭鏈,只能夠取最遠(yuǎn)距離一個雙箭頭。即一條路徑中不能夠包含兩個雙向箭頭。結(jié)合Wright規(guī)則,在圖10-5(a)中,若計算D和E相關(guān)系數(shù),路徑DCE是合理,而路徑DCABCE則不能夠(規(guī)則(1));在圖10-5(b)中,若計算B和C相關(guān)系數(shù),路徑BAC是合理,而路徑BDC則不能夠(規(guī)則(2));在圖10-5(c)中,若計算D和F相關(guān)系數(shù),路徑DACF是合理,而路徑DABCF則不能夠(規(guī)則(3))。第53頁2025/4/3054

目錄上頁下頁返回結(jié)束

第54頁2025/4/3055

目錄上頁下頁返回結(jié)束

第55頁2025/4/3056

目錄上頁下頁返回結(jié)束

第56頁2025/4/3057

目錄上頁下頁返回結(jié)束

路徑分析流程圖及SPSS指令分析流程圖進(jìn)行路徑分析所使用SPSS指令第57頁2025/4/3058

目錄上頁下頁返回結(jié)束

分析流程圖第58頁2025/4/3059

目錄上頁下頁返回結(jié)束

進(jìn)行路徑分析所使用SPSS指令下面以SPSSAmos模塊為例說明路徑分析實(shí)現(xiàn)過程;然而依據(jù)上面介紹,路徑分析也能夠利用回歸分析手工完成。在AmosGraphics模塊中,首先需要選擇數(shù)據(jù)文件,在File菜單下,選擇“DataFiles”給出需要進(jìn)行分析文件名。然后繪出路徑分析圖:在Diagram菜單下,選擇“DrawObserved”繪制觀察變量;選擇“DrawUnobserved”繪制不可觀察變量,在路徑分析中是殘差項;選擇“DrawPath”繪制兩變量因果關(guān)系;選擇“DrawCovariance”繪制兩變量相關(guān)關(guān)系;然后對繪出各個變量指定變量名。第59頁2025/4/3060

目錄上頁下頁返回結(jié)束

進(jìn)行路徑分析所使用SPSS指令接著要指定殘差項方差為1,選定某個殘差項后,擊右鍵,選擇“ObjectProperties”后,在“Parameteres”下設(shè)定方差為1。并在菜單下View/Set下選擇“AnalysisProperties”,在“Estimation”一項中選擇預(yù)計方法為“Scale-freeleastsquare”,關(guān)閉該窗口。最終就能夠點(diǎn)擊Model-Fit菜單下選項“CalculateEstimates”計算路徑系數(shù)了。能夠經(jīng)過三種方式察看結(jié)果:文字法,表格法和圖表法。第60頁2025/4/3061

目錄上頁下頁返回結(jié)束

案例分析從對路徑模型介紹能夠知道,路徑系數(shù)預(yù)計并不復(fù)雜,用普通多元回歸方法就可實(shí)現(xiàn)。SPSS軟件是一個能夠選擇軟件,然而路徑分析又不全部是靠軟件實(shí)現(xiàn),變量相關(guān)系數(shù)分解,對模型調(diào)試和檢驗(yàn)經(jīng)過手工就可完成。下面以詳細(xì)實(shí)例說明路徑分析整個實(shí)現(xiàn)過程。第61頁2025/4/3062

目錄上頁下頁返回結(jié)束

模型設(shè)定【例10.1】我們采取SPSS10.0自帶數(shù)據(jù)文件Employeedata進(jìn)行路徑分析。該數(shù)據(jù)共有474個觀察值,473個有效,標(biāo)號為434出生日期缺失,在下面分析中,不考慮該樣品;該數(shù)據(jù)包含10個變量:標(biāo)號(id)、性別(gender)、出生日期(bdate,DateofBirth)、受教育水平(educ,EducationalLevel)、工作類別(jobcat,EmploymentCategory)、當(dāng)前工資(salary,CurrentSalary)、初始工資(salbegin,BeginningSalary)、已經(jīng)工作時間(jobtime,MonthssinceHire)、以前工作經(jīng)驗(yàn)(preexp,PreviousExperience)、是否是少數(shù)民族(minority)。性別為屬性變量,用“f”表示女性,“m”表示男性;受教育水平使用受教育年數(shù)衡量;工作類別分為三類:公務(wù)員(“1”),監(jiān)督人(“2”)以及經(jīng)理人員(“3”)。第62頁2025/4/3063

目錄上頁下頁返回結(jié)束

模型設(shè)定當(dāng)前工資和初始工資以實(shí)際額為準(zhǔn)。已經(jīng)工作時間和以前工作經(jīng)驗(yàn)均以發(fā)生月份衡量;是否是少數(shù)民族為0,1變量,1表示是少數(shù)民族,0表示非少數(shù)民族。假設(shè)數(shù)據(jù)采集時間為1997,則用1997減出生日期年份數(shù)作為年紀(jì)(age)衡量指標(biāo)。比如若某人在1952年出生,則年紀(jì)測度為1997-1952=45。表10-2為樣本相關(guān)系數(shù)矩陣。第63頁2025/4/3064

目錄上頁下頁返回結(jié)束

模型設(shè)定對標(biāo)號、性別、民族不進(jìn)行區(qū)分,關(guān)注其余7個變量之間因果關(guān)系。表10-2為這7個變量樣本相關(guān)系數(shù)。依據(jù)時間和邏輯次序,我們得到幾條因果路徑:受教育水平影響初始工資和當(dāng)前工資,因?yàn)榇罅拷y(tǒng)計結(jié)果表明,個人受教育水平越高,所取得工資也越高;同時也認(rèn)為,一個人受教育水平越高,以前工作經(jīng)驗(yàn)越多,他從事工作類別應(yīng)該越高;另外,初始工資會影響工作類別,在相關(guān)系數(shù)矩陣中,我們已經(jīng)看到二者相關(guān)系數(shù)較大;年紀(jì)影響已經(jīng)工作時間以及以前工作經(jīng)驗(yàn),因?yàn)槟昙o(jì)越大,(在本職位)已經(jīng)工作時間或者以前工作經(jīng)驗(yàn)會越長;其次,年紀(jì)和受教育水平應(yīng)該存在負(fù)相關(guān),這里不關(guān)注二者因果關(guān)系,僅僅簡單假設(shè)二者相關(guān)。第64頁2025/4/3065

目錄上頁下頁返回結(jié)束

模型設(shè)定最終,初始工資、工作類別、已經(jīng)工作時間以及以前工作經(jīng)驗(yàn)都影響當(dāng)前工資,普通來說,初始工資越高,工作類別越高(按1,2,3次序),以前工作經(jīng)驗(yàn)越多,時間越長,當(dāng)前工資越高,這些變量間均應(yīng)有正因果關(guān)系。依據(jù)這些邏輯理由,我們假設(shè)路徑模型如圖10-8所表示,不妨稱此模型為模型1。很顯然,模型1為遞歸路徑模型,各外生變量不存在測量誤差,假設(shè)各路徑因果關(guān)系均為線性、可加,并深入假設(shè)各內(nèi)生變量之間不存在相關(guān)關(guān)系。第65頁2025/4/3066

目錄上頁下頁返回結(jié)束

模型設(shè)定第66頁2025/4/3067

目錄上頁下頁返回結(jié)束

路徑系數(shù)預(yù)計采取Amos軟件對圖10-8進(jìn)行預(yù)計,輸出結(jié)果如圖10-9所表示。第67頁2025/4/3068

目錄上頁下頁返回結(jié)束

路徑系數(shù)預(yù)計依據(jù)圖10-9,我們發(fā)覺年紀(jì)對已經(jīng)工作時間路徑系數(shù)僅為0.003,為0.001,方程擬合效果不好;同時,以前工作經(jīng)驗(yàn)對當(dāng)前工資路徑系數(shù)也很小??紤]刪除上面兩條路徑以及殘差項e6,并重新預(yù)計模型,結(jié)果如圖10-10。第68頁2025/4/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心69

目錄上頁下頁返回結(jié)束

模型調(diào)試和檢驗(yàn)假設(shè)圖10-9對應(yīng)模型是基準(zhǔn)模型,圖10-10對應(yīng)模型為待檢模型。下面分別計算基準(zhǔn)模型和待檢模型擬合指數(shù)和,對模型進(jìn)行調(diào)試:

第69頁2025/4/3070

目錄上頁下頁返回結(jié)束

模型調(diào)試和檢驗(yàn)

從而W統(tǒng)計量為:若基準(zhǔn)模型正確,W服從自由度為2分布。這里Wp值為0.1891,統(tǒng)計不顯著。能夠認(rèn)為圖10-10對應(yīng)模型正確。第70頁2025/4/3071

目錄上頁下頁返回結(jié)束

路徑系數(shù)分解

表10-3是Amos軟件總效應(yīng)分解報表:表10-3路徑系數(shù)分解報表原因變量結(jié)果變量總影響直接影響間接影響受教育水平初始工資0.5700.5700.000工作類別0.5300.1290.401當(dāng)前工資0.6580.1960.462年紀(jì)以前工作經(jīng)驗(yàn)0.8010.8010.000工作類別0.1230.0000.123當(dāng)前工資0.0220.0000.022已經(jīng)工作時間當(dāng)前工資0.0840.0840.000以前工作經(jīng)驗(yàn)工作類別0.1540.1540.000當(dāng)前工資0.0280.0000.028初始工資工作類別0.7050.7050.000當(dāng)前工資0.7690.6400.129工作類別當(dāng)前工資0.1830.1830.000第71頁2025/4/3072

目錄上頁下頁返回結(jié)束

路徑系數(shù)分解

能夠看出,受教育水平對當(dāng)前工資影響主要是經(jīng)過工作類別和初始工資傳遞間接影響,教育水平對初始工資(工作)含有很大影響作用,但隨即(直接)影響便較弱(0.196),這與我們常識相一致,初始工作可能取決于學(xué)歷,然而以后主要看工作經(jīng)歷及個人能力了。年紀(jì)對當(dāng)前工資影響主要經(jīng)過工作類別和以前工作經(jīng)驗(yàn)傳遞完成,它對當(dāng)前工資影響為正。其它分析類似,讀者不妨自己動手分析。

下面再舉一個例子。第72頁2025/4/3073

目錄上頁下頁返回結(jié)束

路徑系數(shù)分解

【例10.2】一家大型商業(yè)銀行在多個地域設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國家重點(diǎn)項目建設(shè)、固定資產(chǎn)投資等項目標(biāo)貸款。今年來,該銀行貸款額平穩(wěn)增加,但不良貸款額也有較大百分比增加,這給銀行業(yè)務(wù)發(fā)展帶來較大壓力。為搞清楚不良貸款形成原因,管理者希望利用銀行業(yè)務(wù)相關(guān)數(shù)據(jù)做些定量分析,方便找出控制不量貸款方法。圖10-11就是該銀行所屬25家分行年相關(guān)業(yè)務(wù)數(shù)據(jù)。第73頁圖10.11商業(yè)銀行所屬25家分行年相關(guān)業(yè)務(wù)數(shù)據(jù)2025/4/3074

目錄上頁下頁返回結(jié)束

第74頁2025/4/3075

目錄上頁下頁返回結(jié)束

路徑系數(shù)分解

注:不良貸款(y)、貸款余額(x1)、累計應(yīng)收貸款(x2)、貸款項目個數(shù)(x3)和固定資產(chǎn)投資額(x4)依據(jù)經(jīng)驗(yàn)可知,各項貸款余額越高則不良貸款越高,但同時,各項貸款余額也會受其它變量影響,所以綜合考慮之下,本例應(yīng)該建立以下路徑分析模型:第75頁2025/4/3076

目錄上頁下頁返回結(jié)束

路徑系數(shù)分解

下面考慮對該模型加以擬合,因?yàn)檎麄€模型是一個遞歸模型,能夠在SPSS中使用分別擬合回歸方程方法來實(shí)現(xiàn)對模型中各參數(shù)預(yù)計,首先對各項貸款余額回歸方程進(jìn)行預(yù)計,結(jié)果見表10-4和10-5:表10-4第76頁2025/4/3077

目錄上頁下頁返回結(jié)束

路徑系數(shù)分解

表10-5可見,應(yīng)收貸款、貸款項目、固定資產(chǎn)均對各項貸款余額有影響。應(yīng)收貸款、貸款項目則各項貸款余額越高。下面對第二個方程進(jìn)行預(yù)計,參數(shù)結(jié)果見表10-6和表10-7:第77頁2025/4/3078

目錄上頁下頁返回結(jié)束

路徑系數(shù)分解

表10-6表10-7第78頁2025/4/3079

目錄上頁下頁返回結(jié)束

路徑系數(shù)分解

固定資產(chǎn)和各項貸款對不良貸款有影響,而應(yīng)收貸款、貸款項目對其影響不顯著。從上面分析可知,假如只是擬合第二個方程,則所得結(jié)果其實(shí)就是一個簡單多重回歸方程結(jié)果,而且可知自變量間存在共線性。顯然,對于不良貸款而言,使用路徑分析并不會使得模型對最終止果變量預(yù)測愈加準(zhǔn)確。但經(jīng)過對自變量間復(fù)雜關(guān)聯(lián)刻畫,路徑分析模型能夠很準(zhǔn)確地預(yù)計出每一個自變量終究是經(jīng)過那些方式來作用于最終因變量,從而使得研究者對問題了解愈加深入和全方面。經(jīng)過上面分析,能夠?qū)⑸鲜瞿P图右院喕?,去除那些無統(tǒng)計意義變量后重新加以擬合,分析結(jié)果見表10-8和表10-9:第79頁2025/4/3080

目錄上頁下頁返回結(jié)束

路徑系數(shù)分解表10-8表10-9第80頁2025/4/3081

目錄上頁下頁返回結(jié)束

路徑系數(shù)分解可見方程決定系數(shù)基本未變,自變量都有統(tǒng)計學(xué)意義。顯然,化簡后路徑分析模型對數(shù)據(jù)解釋程度與前一個模型相比無顯著差異,但愈加簡練。本例所擬合路徑分析模型能夠使用標(biāo)準(zhǔn)化系數(shù)繪制出路徑如圖10-12.圖10-12第81頁結(jié)構(gòu)方程模型第82頁2025/4/3083目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型結(jié)構(gòu)方程模型SEM(structuralequationmodeling)是近二十年應(yīng)用統(tǒng)計學(xué)領(lǐng)域中發(fā)展最為快速一個分支。它是一個實(shí)證分析模型,經(jīng)過尋找變量間內(nèi)在結(jié)構(gòu)關(guān)系,去驗(yàn)證某種結(jié)構(gòu)關(guān)系或模型假設(shè)是否合理,模型是否正確,而且假如模型存在問題,能夠指出怎樣加以修改。結(jié)構(gòu)方程模型另一大特點(diǎn)是能夠?qū)﹄[變量(latentvariables)進(jìn)行分析。多元回歸分析、因子分析和路徑分析等都可看成是結(jié)構(gòu)方程模型一個特例。現(xiàn)實(shí)生活中,有許多變量諸如健康、優(yōu)異、樂觀、智力、滿意、公正等概念即使是客觀存在,但因?yàn)槿苏J(rèn)識水平或事物本身抽象性、復(fù)雜性等原因,我們是無法直接測量,我們稱這么變量為隱變量。結(jié)構(gòu)方程能夠經(jīng)過一些可觀察變量對這些隱變量特征及其相互之間關(guān)系進(jìn)行描述,所以,有時也稱結(jié)構(gòu)方程模型為隱變量分析模型。第83頁2025/4/3084目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型結(jié)構(gòu)方程模型應(yīng)用始見于20世紀(jì)60年代發(fā)表論文中,1987年Loehlin用路徑分析模型和結(jié)構(gòu)方程模型對隱變量模型作了出眾介紹,兩年之后Bollen提出了處理測量誤差模型更專門化統(tǒng)計方法。到了90年代,結(jié)構(gòu)方程模型得到了廣泛應(yīng)用。當(dāng)前,結(jié)構(gòu)方程模型已發(fā)展成內(nèi)容非常豐富一個主要領(lǐng)域,在此,僅介紹結(jié)構(gòu)方程模型一些基本內(nèi)容,有興趣讀者能夠深入?yún)㈤喯嚓P(guān)書籍。第84頁2025/4/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心85目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型基本思想結(jié)構(gòu)方程模型是反應(yīng)隱變量和顯變量一組方程,其目標(biāo)是經(jīng)過顯變量測量推斷隱變量,并對假設(shè)模型正確性進(jìn)行檢驗(yàn)。結(jié)構(gòu)方程模型是模型驗(yàn)證技術(shù)。即利用結(jié)構(gòu)方程模型分析過程實(shí)際上是對假定模型驗(yàn)證過程。對于某個領(lǐng)域?qū)I(yè)人員依據(jù)本事域知識或常識建立反應(yīng)結(jié)構(gòu)關(guān)系模型,因?yàn)閷I(yè)人員認(rèn)識水平和各種原因限制,這一模型未必是客觀現(xiàn)實(shí)反應(yīng),有可能存在偏差和主觀性,怎樣發(fā)覺模型問題,怎樣依據(jù)分析結(jié)果深入修正模型,這些正是結(jié)構(gòu)方程模型能夠處理問題。第85頁2025/4/3086目錄上頁下頁返回結(jié)束詳細(xì)來說,結(jié)構(gòu)方程模型分析過程是:在設(shè)定結(jié)構(gòu)模型基礎(chǔ)上,為證實(shí)模型準(zhǔn)確性,首先要判斷這些方程是否可識別模型,對于可識別模型,經(jīng)過搜集顯變量數(shù)據(jù),利用最大似然預(yù)計(maximumlikelihood)或廣義最小二乘預(yù)計(generalizedleastsquares)等預(yù)計方法對未知參數(shù)進(jìn)行預(yù)計。對于模型結(jié)果,需要對模型與數(shù)據(jù)之間是否擬合進(jìn)行評價。假如,模型與數(shù)據(jù)擬合得不好,就需要對模型進(jìn)行修正,重新設(shè)定模型,一個擬合很好模型往往需要重復(fù)試驗(yàn)屢次。在進(jìn)行模型預(yù)計之前,研究者需要依據(jù)專業(yè)知識或經(jīng)驗(yàn)設(shè)定假設(shè)初始模型。而結(jié)構(gòu)方程模型主要用途即為確定該假定模型是否合理。第86頁2025/4/3087目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型通常是借助路徑圖將初始模型描述出來,對于復(fù)雜模型尤其如此。這里從與結(jié)構(gòu)方程結(jié)合角度,對上一章內(nèi)容簡單回顧一下,并在此基礎(chǔ)上看怎樣得出結(jié)構(gòu)方程模型。路徑圖中變量能夠是不一樣類型,按能否被直接測量,路徑圖中變量能夠分為顯變量(manifestvariable)和隱變量(latentvariable)。通常前者是能夠直接測量,在圖中用方框來標(biāo)識;而后者即使是客觀存在,但因?yàn)槿苏J(rèn)識水平或事物本身抽象性、復(fù)雜性等原因,我們無法直接測量,通慣用橢圓形框來標(biāo)識。

第87頁2025/4/3088目錄上頁下頁返回結(jié)束按照變量之間關(guān)系,又可分為外生變量(exogenousvariable)和內(nèi)生變量(endogenousvariable),內(nèi)生變量是由隱變量決定變量,外生變量是由顯變量決定變量。變量之間關(guān)系用線條表示,能夠是直接作用也能夠是間接作用,當(dāng)二者之間有直接聯(lián)線時,稱為直接作用。假如變量之間沒有直接聯(lián)線則是假設(shè)變量之間沒有直接聯(lián)絡(luò),但能夠經(jīng)過其它變量發(fā)生聯(lián)絡(luò),稱之為間接聯(lián)絡(luò)。線條既能夠加單箭頭,也能夠加雙箭頭。單箭頭表示存在因果關(guān)系,雙箭頭則表示含有相關(guān)關(guān)系。

第88頁2025/4/3089目錄上頁下頁返回結(jié)束下面用一個詳細(xì)事例來看一下路徑圖,然后在此基礎(chǔ)上寫出結(jié)構(gòu)方程模型。這是Wheatonetal在1977年給出一個廣為人知例子。這是一個測度“神精錯亂平穩(wěn)性”例子,在他給出數(shù)據(jù)集中使用了Illinois農(nóng)村地域932個人調(diào)查數(shù)據(jù),調(diào)查了六個變量:y1:1967年異常程度;y2:1967年軟弱程度;y3:1971年異常程度;y4:1971年軟弱程度;x1:受教育情況(上年數(shù));x2:當(dāng)?shù)厣鐣?jīng)濟(jì)指數(shù)。第89頁2025/4/3090目錄上頁下頁返回結(jié)束第90頁2025/4/3091目錄上頁下頁返回結(jié)束第91頁2025/4/3092目錄上頁下頁返回結(jié)束路徑圖實(shí)際上提供了一個假設(shè)模型,它表達(dá)了隱變量與隱變量之間、隱變量與顯變量之間(包含內(nèi)生隱變量與顯變量和外生隱變量與顯變量之間)可能存在關(guān)系,而且,這種關(guān)系詳細(xì)程度,能夠經(jīng)過路徑系數(shù)來反應(yīng)。在這些變量中,顯變量是能夠觀察,而每個隱變量都對應(yīng)著幾個顯變量,如上圖中隱變量“社會經(jīng)濟(jì)情況”就對應(yīng)著兩個顯變量“受教育情況”和“社會經(jīng)濟(jì)指數(shù)”。給出路徑圖后,我們就能夠?qū)@些假設(shè)結(jié)構(gòu)關(guān)系,利用顯變量數(shù)據(jù),經(jīng)過建立結(jié)構(gòu)方程模型,深入檢驗(yàn)?zāi)P图僭O(shè)合理性并確定模型中路徑系數(shù)。第92頁2025/4/3093目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型結(jié)構(gòu)結(jié)構(gòu)方程模型普通由測量方程(MeasurementEquation)和結(jié)構(gòu)方程(StructuralEquation)兩部分組成。測量方程描述潛變量與指標(biāo)之間關(guān)系;結(jié)構(gòu)方程則反應(yīng)潛變量之間關(guān)系。指標(biāo)含有隨機(jī)誤差和系統(tǒng)誤差。前者指測量上不準(zhǔn)確性行為,后者反應(yīng)指標(biāo)同時測量潛變量以外特征。隨機(jī)誤差和系統(tǒng)誤差統(tǒng)稱為測量誤差,但潛變量則不含這些誤差。第93頁2025/4/3094目錄上頁下頁返回結(jié)束第94頁2025/4/3095目錄上頁下頁返回結(jié)束第95頁2025/4/3096目錄上頁下頁返回結(jié)束第96頁2025/4/3097目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型優(yōu)點(diǎn)(1)能同時處理多個因變量。結(jié)構(gòu)方程模型可同時考慮并處理多個因變量。而回歸分析中,只能處理一個因變量,假如有多個因變量需要處理,則需要分別計算,這么在計算一個因變量時,就忽略了其它因變量存在及影響。第97頁2025/4/3098目錄上頁下頁返回結(jié)束(2)允許自變量和因變量均包含測量誤差。從測量方程中可看到,很多變量如學(xué)業(yè)成績、社會經(jīng)濟(jì)地位等潛變量觀察值不能用單一指標(biāo)來測量,往往還包含了大量測量誤差。從結(jié)構(gòu)方程模型特點(diǎn)看出:結(jié)構(gòu)方程分析允許自變量和因變量均含有測量誤差。而回歸分析只允許因變量存在測量誤差,假定自變量沒有誤差。(3)預(yù)計整個模型擬和程度。在傳統(tǒng)路徑分析中,我們只預(yù)計每條路徑變量間關(guān)系得強(qiáng)弱。在結(jié)構(gòu)方程分析中,能夠經(jīng)過結(jié)構(gòu)方程軟件LISREL計算出多個擬和參數(shù)值,能夠判斷不一樣模型對同一個樣本數(shù)據(jù)整體擬和程度,從中選取最準(zhǔn)確模型描述樣本數(shù)據(jù)體展現(xiàn)特征。第98頁2025/4/3099目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型構(gòu)建

由上一節(jié)介紹結(jié)構(gòu)方程模型結(jié)構(gòu)模式能夠看出,結(jié)構(gòu)方程模型普通由測量方程(MeasurementEquation)和結(jié)構(gòu)方程(StructuralEquation)兩部分組成。要很好完成這兩部分結(jié)構(gòu),關(guān)鍵是利用結(jié)構(gòu)方程模型中分析變量(包含顯變量和隱變量)關(guān)系,依據(jù)相關(guān)領(lǐng)域?qū)I(yè)知識和研究目標(biāo),構(gòu)建出理論模型,然后用測得數(shù)據(jù)去驗(yàn)證這個理論模型合理性。下面以一經(jīng)典實(shí)例來說明模型建立過程。第99頁2025/4/30100目錄上頁下頁返回結(jié)束第100頁2025/4/30101目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型構(gòu)建

(1)結(jié)構(gòu)方程建立依據(jù)模型假設(shè)條件能夠建立反應(yīng)隱變間關(guān)系路徑圖,見圖11-2。第101頁2025/4/30102目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型構(gòu)建

第102頁2025/4/30103目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型構(gòu)建

(2)測量方程建立。依據(jù)模型假設(shè)條件能夠建立反應(yīng)顯變量和隱變量關(guān)系路徑圖,如圖11-3、圖11-4、圖11-5所表示。第103頁2025/4/30104目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型構(gòu)建

第104頁2025/4/30105目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型構(gòu)建

第105頁2025/4/30106目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型構(gòu)建

至此,測量方程和結(jié)構(gòu)方程都得到了建立,整個結(jié)構(gòu)方程模型也得以建立。當(dāng)然,初始建立理論模型有可能不是較理想模型,需要在數(shù)據(jù)擬合過程中重復(fù)修改,直到建立較理想模型。第106頁2025/4/30107目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型預(yù)計

第107頁2025/4/30108目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型預(yù)計最常見預(yù)計方法有沒有加權(quán)最小二乘法(ULS)、廣義最小二乘法(GLS)和最大似然預(yù)計(ML)。每種計算方法都是要找到參數(shù)預(yù)計使得擬合損失函數(shù)到達(dá)最小。擬合損失函數(shù)是度量觀察樣本協(xié)差陣和參數(shù)預(yù)計給出預(yù)測協(xié)差陣之間差異程度函數(shù)。ML方法對于多數(shù)應(yīng)用問題尤其是考慮到統(tǒng)計問題時是首選方法。GLS通常得出與ML方法類似結(jié)論。ML和GLS這兩種方法在不考慮協(xié)差陣尺度時是適用,而且需要顯變量是連續(xù)和多元正態(tài)。這是因?yàn)樽兞科珣B(tài)或高峰度會造成很差預(yù)計及其不正確標(biāo)準(zhǔn)誤和較高卡方值。ULS方法適合用于僅當(dāng)這些變量是可比較尺度上被測量時得到協(xié)差陣,不然ULS方法使用相關(guān)陣。若預(yù)測或觀察協(xié)差陣是奇異,則不能使用ML和GLS這兩種方法,這時要么去掉線性相關(guān)變量,要么用ULS方法。第108頁2025/4/30109目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

當(dāng)前,國際上一些著名軟件企業(yè)都推出了利用結(jié)構(gòu)方程模型進(jìn)行統(tǒng)計分析計算機(jī)應(yīng)用軟件,比如瑞典阿帕薩拉大學(xué)(TheUniversityofUppsala,Sweden)喬瑞斯考格(KarlG.Joreskog)和索爾波姆(DagSorbom)專門為進(jìn)行結(jié)構(gòu)方程模型分析所編寫LISREL軟件、以及我們所熟悉SAS軟件中CALIS和SPSSAMOS等等,這么,我們就能夠很方便利用結(jié)構(gòu)方程模型來處理各領(lǐng)域問題。依據(jù)我國統(tǒng)計軟件應(yīng)用情況,在這里主要對國內(nèi)比較流行SAS軟件中CALIS和LISREL軟件進(jìn)行介紹。第109頁2025/4/30110目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

11.5.1結(jié)構(gòu)方程模型分析流程依據(jù)前面關(guān)于結(jié)構(gòu)方程模型分析過程分析,利用結(jié)構(gòu)方程模型進(jìn)行分析結(jié)構(gòu)流程圖以下,這是我們進(jìn)行計算機(jī)實(shí)現(xiàn)基礎(chǔ):第110頁2025/4/30111目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

從這一流程圖能夠看出,在利用結(jié)構(gòu)方程模型進(jìn)行分析時,首先要對分析實(shí)際問題進(jìn)行模型設(shè)定,這一模型建立好壞直接影響深入分析。要想建立一個好模型往往需要研究人員對研究對象有比較透徹了解,搞清指標(biāo)之間關(guān)系,為了使模型建立更直觀,并深入寫出結(jié)構(gòu)方程模型,往往借助路徑圖;接下來,就需要對建立模型進(jìn)行模式識別,看建立模型屬于恰好識別結(jié)構(gòu)模型、識別不足結(jié)構(gòu)模型還是過渡識別結(jié)構(gòu)模型,只有可識別模型才能夠進(jìn)入下一個步驟;第111頁2025/4/30112目錄上頁下頁返回結(jié)束§11.5結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

對于可識別模型就能夠利用下面將要介紹相關(guān)軟件預(yù)計結(jié)構(gòu)方程模型中相關(guān)參數(shù)并給出相關(guān)檢驗(yàn)參數(shù);利用這些參數(shù),就能夠?qū)δP瓦M(jìn)行評價,依據(jù)相關(guān)指標(biāo)標(biāo)準(zhǔn),評價模型是否需要深入修正;假如模型不需要修正,就能夠?qū)δP瓦M(jìn)行應(yīng)用。對于需要修正模型,需要回到模型設(shè)定階段,再按上面過程逐步進(jìn)行,直到模型不需要修正、能夠應(yīng)用為止。第112頁2025/4/30113目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

SAS中CALIS過程介紹SAS/STAT軟件6.06版本以后新增加了線性結(jié)構(gòu)方程組協(xié)方差過程CALIS(covarianceanalysisoflinearstructuralequation),該過程能夠經(jīng)過協(xié)方差結(jié)構(gòu)分析,來預(yù)計參數(shù)并檢驗(yàn)結(jié)構(gòu)方程正確性。在SASCALIS過程中,又提供了各種模型來建立結(jié)構(gòu)方程模型,如RAM模型、LINEQS模型、LISREL模型等,在此介紹RAM模型,其它模型請參看相關(guān)書籍。

第113頁2025/4/30114目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

1、路徑圖描述CALIS中RAM語句能夠方便地描述路徑圖,假定有n個顯變量,按它們在SAS數(shù)據(jù)集中次序用整數(shù)1,2,3,…,n編號。每個箭頭便可由路徑圖中它所連接兩個變量編號所確認(rèn),RAM語句包含了路徑圖中全部箭頭說明,說明之間用逗號隔開,每一說明項包含3或4個數(shù)字或可選擇一個名字,次序以下:第114頁2025/4/30115目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

(1)箭頭有幾個;(2)箭頭指向變量編號,若是雙箭頭則為任意變量編號;(3)箭頭出發(fā)變量編號,若是雙箭頭則取另一變量編號;(4)箭頭表示系數(shù)、(協(xié))方差值;(5)若箭頭代表參數(shù)待估,這寫上名字,這時前一個數(shù)字表示參數(shù)初始值。若箭頭代表一個常量,能夠省略名字;若用名字,第4個數(shù)字能夠省略。第115頁2025/4/30116目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

2、選擇預(yù)計方法CALIS提供三種預(yù)計方法,能夠用選項METHOD=來要求:ULS沒有加權(quán)最小二乘預(yù)計GLS廣義最小二乘預(yù)計ML多元正態(tài)分布最大似然預(yù)計

第116頁2025/4/30117目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

沒有尤其要求時(即缺省時)預(yù)計方法使用METHOD=ML,因?yàn)镸L對于多數(shù)統(tǒng)計問題是首選方法。比如,對于前面我們已經(jīng)給出例子,假如選擇廣義最小二乘法作為預(yù)計方法時,可使用語句proccaliscovdata=wheatonmethod=glstech=lmedf=931;其中proccalis是調(diào)用SAS中CALIS過程,選項cov要求對協(xié)方差陣進(jìn)行分析,沒有cov選項時則計算和分析相關(guān)陣;而data=wheaton是調(diào)用我們分析所用數(shù)據(jù)庫(注:這是SAS自帶數(shù)據(jù)庫);選項tech=lm代表是使用Levenberg-Marquandt或Newton-Raphson最優(yōu)化方法,這里使用是后者;選項edf=931指明了自由度個數(shù),即931個樣本數(shù)據(jù)。

第117頁2025/4/30118目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

依據(jù)這些要求,表11-1語句給出了上例中“神經(jīng)錯亂”數(shù)據(jù)RAM結(jié)構(gòu)模型(注意表11-1中第五列給出字母與圖11-1中稍有不一樣)。其中Vnames1F1-F3,2E1-E6D1-D3;給出了隱變量和誤差變量名字。拿ram語句第一行來說明路徑圖描述,即該箭頭為單箭頭,從變量7出發(fā),指向變量1,箭頭表示系數(shù)值為1。第118頁2025/4/30119目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

經(jīng)過運(yùn)行上面程序,輸出結(jié)果11-1(這里僅給出了檢驗(yàn)結(jié)果,讀者運(yùn)行時還會看到反應(yīng)變量關(guān)系其它結(jié)果,在此不一一列出),能夠經(jīng)過這一結(jié)果對模型正確性進(jìn)行判斷。第119頁2025/4/30120目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

LISREL軟件介紹LISREL(linearstructuralrelations)是專門為進(jìn)行結(jié)構(gòu)方程分析而編寫統(tǒng)計分析軟件。與SAS軟件中CALIS有所不一樣是,LISREL路徑圖能夠在輸出結(jié)果中直觀給出,并能夠在圖形窗口進(jìn)行編輯和修改。LISREL能夠在圖形窗口進(jìn)行編輯和修改路徑圖。用光標(biāo)點(diǎn)擊命令行pathdiagram或?qū)?yīng)圖標(biāo),即進(jìn)入圖形窗口。在圖形窗口命令行點(diǎn)擊model,能夠選擇顯示不一樣圖形。對模板圖形進(jìn)行修改和變動,能夠得到所需路徑圖。圖形窗口命令行其它命令用途分別是:exit退出該窗口,kind調(diào)出其它統(tǒng)計結(jié)果方便對路徑圖進(jìn)行修改,options修改統(tǒng)計數(shù)值得小數(shù)位顯示長度,print打印路徑圖,zoom對路徑圖進(jìn)行放大和縮小,re-estimate是依據(jù)統(tǒng)計分析結(jié)果對路徑圖進(jìn)行修改之后再次運(yùn)行預(yù)計程序。第120頁2025/4/30121目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

首先,需要編寫并運(yùn)行程序命令。LISREL程序包含一子程序PRELIS,該子程序?qū)Y(jié)構(gòu)方程模型數(shù)據(jù)進(jìn)行預(yù)處理。該程序包含多個指令,指示原始數(shù)據(jù)出處以及變量信息和結(jié)果存入。表11-2以程序形式簡略給出了PRELIS基本指令。第121頁2025/4/30122目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

原始數(shù)據(jù)經(jīng)過預(yù)處理能夠得到其協(xié)方差矩陣。依據(jù)協(xié)方差矩陣開始編寫LISREL程序。如表11-3所表示。第122頁2025/4/30123目錄上頁下頁返回結(jié)束§11.5結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

第123頁2025/4/30124目錄上頁下頁返回結(jié)束結(jié)構(gòu)方程模型計算機(jī)實(shí)現(xiàn)

LISREL能夠提供結(jié)果路徑圖而且能夠在圖形窗口進(jìn)行編輯和修改路徑圖。用光標(biāo)點(diǎn)擊命令行pathdiagram或?qū)?yīng)圖標(biāo),即進(jìn)入圖形窗口。在圖形窗口命令行點(diǎn)擊model,能夠選擇顯示不一樣圖形(x模型、y模型和結(jié)構(gòu)模型)。因?yàn)槠蓿瑢ISREL介紹只限于此。有興趣讀者請參閱相關(guān)LISREL軟件書籍或該軟件命令行中help。第124頁2025/4/30125目錄上頁下頁返回結(jié)束一個實(shí)例

為了使讀者對結(jié)構(gòu)方程模型實(shí)際應(yīng)用過程有一個總體把握,本章引用了一個利用結(jié)構(gòu)方程模型處理問題真實(shí)案例供讀者參考。此案例是RichardRosenfeld;StevenFMessner;EricPBaumer等人將社會資本作為隱變量,考查社會資本(socialcapital)和社會謀殺率(homiciderate)之間結(jié)構(gòu)關(guān)系。第125頁2025/4/30126目錄上頁下頁返回結(jié)束一個實(shí)例

社會資本與謀殺率之間假定關(guān)系如圖11-7所表示,依據(jù)RobertPutnam對社會資本定義,社會資本指是社會組織特點(diǎn),比如社會網(wǎng)絡(luò)、社會標(biāo)準(zhǔn)、信任、為共同利益而采取行動和合作。所以Rosenfeldetal對社會資本評價著重考慮了兩個方面:人與人之間信任(trust)和公眾對公共事業(yè)參加(civicengagement)。為何社會資本與社會謀殺率之間存在聯(lián)絡(luò)呢?主要從經(jīng)典犯罪學(xué)三個方面來考慮:社會控制力度(informalandformalsocialcontrol)、道德水準(zhǔn)下降程度(anomie)和社會壓力(strain)。社會資本改變對上述三個原因產(chǎn)生影響,從而影響了謀殺率高低。對模型中人與人之間信任和公眾對公共事業(yè)參加兩個外生變量數(shù)量化采取了GSS(generalsocialsurvey)數(shù)據(jù),如表11-4所表示。第126頁2025/4/30127目錄上頁下頁返回結(jié)束一個實(shí)例

第127頁2025/4/30128目錄上頁下頁返回結(jié)束一個實(shí)例

為了得到無偏預(yù)計,影響謀殺率其它原因必須考慮在模型之內(nèi)。依據(jù)以前關(guān)于謀殺率模型研究并經(jīng)過主成份分析,得到了兩個主要因子。第一個因子定義為“剝奪”(deprivation),對應(yīng)“人口結(jié)構(gòu)”(populationstructure)、年紀(jì)組成(agecomposition)、失業(yè)率(unemployment)、男性離婚率(maledivorce)和南方州(south)為其它幾個因子。第128頁2025/4/30129目錄上頁下頁返回結(jié)束一個實(shí)例

依據(jù)LISREL8.14,并采取極大似然預(yù)計對上述所討論模型進(jìn)行預(yù)計。文中比較了兩個模型:模型1沒有將隱變量社會資本加入模型;模型2則考慮了社會資本。如表11-5所表示:第129頁2025/4/30130目錄上頁下頁返回結(jié)束一個實(shí)例

從模型2擬合指數(shù)能夠看出模型擬合很好,均方根殘差RMSEM也表明模型擬合很好。將社會資本加入模型提升了謀殺率解釋方差。接下來做是考慮一個遞歸模型,即認(rèn)為社會資本和謀殺率之間作用是相互,而且在新模型中對老模型作了一些修改,將不顯著變量年紀(jì)組成和失業(yè)率去掉,結(jié)果如表11-6所表示。路徑圖如圖11-8所表示。第130頁2025/4/30131目錄上頁下頁返回結(jié)束一個實(shí)例

第131頁第132頁聚類分析第133頁聚類分析概述概念:聚類分析是統(tǒng)計學(xué)中研究“物以類聚”一個方法,屬多元統(tǒng)計分析方法.比如:細(xì)分市場、消費(fèi)行為劃分聚類分析是建立一個分類,是將一批樣本(或變量)按照在性質(zhì)上“親疏”程度,在沒有先驗(yàn)知識情況下自動進(jìn)行分類方法.其中:類內(nèi)個體含有較高相同性,類間差異性較大.第134頁聚類分析概述兩類:(AB)(CDE)三類:(AB)(C)(DE)依據(jù)平均得分差距,差距較小為一類.分類過程中,沒有事先指定分類標(biāo)準(zhǔn).完全依據(jù)樣本數(shù)據(jù)客觀產(chǎn)生分類結(jié)果.第135頁親疏遠(yuǎn)程度衡量指標(biāo)相同性:數(shù)據(jù)間相同程度度量距離:數(shù)據(jù)間差異程度度量.距離越近,越“親密”,聚成一類;距離越遠(yuǎn),越“疏遠(yuǎn)”,分別屬于不一樣類定距型個體間距離:把每個個案數(shù)據(jù)看成是n維空間上點(diǎn),在點(diǎn)和點(diǎn)之間定義某種距離.普通適合用于定距數(shù)據(jù)歐氏距離(EUCLID)平方歐氏距離(SEUCLID)聚類分析概述第136頁品質(zhì)型個體間距離姓名講課方式上機(jī)時間選某門課程張三1

1

1李四110王五001聚類分析概述第137頁品質(zhì)型個體間距離簡單匹配(simplematching)系數(shù):適用二值變量。個體j個體i101ab0cda為個體i與個體j在全部變量上同時取1個數(shù);d為同時取0個數(shù)特點(diǎn):排除同時擁有或同時不擁有某特征情況;取0和1地位等價,編碼方案改變不會引發(fā)系數(shù)改變。聚類分析概述第138頁品質(zhì)型個體間距離簡單匹配(simplematching)系數(shù):適用二值變量。姓名講課方式上機(jī)時間選某門課程張三1

1

1李四110王五001(張三,李四):a=2b=1c=0d=0d(x,y)=1/(1+2)=1/3(張三,王五):a=1b=2c=0d=0d(x,y)=2/(1+2)=2/3張三距李四近聚類分析概述第139頁品質(zhì)型個體間距離依據(jù)臨床表現(xiàn)研究病人是否有類似病姓名性別發(fā)燒咳嗽檢驗(yàn)1檢驗(yàn)2檢驗(yàn)3檢驗(yàn)4張三男101000李四女101010王五男110000……..聚類分析概述第140頁品質(zhì)型個體間距離雅科比(Jaccard)系數(shù):適用二值變量個體j個體i1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論