




已閱讀5頁,還剩109頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第五講 內生性,OLS經(jīng)典假設 所有的解釋變量Xi與隨機誤差項彼此之間不相關。,若解釋變量Xi和ui相關,則OLS估計量是非一致的,也就是即使當樣本容量很大時,OLS估計量也不會接近回歸系數(shù)的真值。 當解釋變量和隨機誤差項相關時,模型存在著內生性問題。,在計量經(jīng)濟學中,把所有與擾動項相關的解釋變量都稱為“內生變量”。這與一般經(jīng)濟學理論中的定義有所不同。 1。與誤差項相關的變量稱為內生變量(endogenous variable)。 2。與誤差項不相關的變量稱為外生變量(exogenous variable)。,造成誤差項與回歸變量相關(內生性)的原因很多,但我們主要考慮如下幾個方面: 遺漏變量偏差 變量有測量誤差 雙向因果關系。,遺漏變量偏差,變量有測量誤差 測量數(shù)據(jù)正確時:假設方程為:,當存在測量誤差時:方程為:,所以我們有:,可知,誤差項中包含,所以可以得到:如果,則回歸結果有偏,非一致,我們假設,則有,結論:1。由于,2?;貧w的性質決定于w的標準差,雙向因果關系 之前我們假定因果關系是從回歸變量到因變量的(X導致了Y)。但如果因果關系同時也是從因變量到一個或多個回歸變量(Y導致了X)的呢?如果是這樣的話,因果關系是向前的也是“向后” 的,即存在雙向因果關系,如果存在雙向因果關系,則OLS回歸中同時包含了這兩個效應,因此OLS估計量是有偏的、非一致的。,可以推導出:,檢驗方法:豪斯曼檢驗檢驗,豪斯曼檢驗(Hausman specification test) H0 :所有解釋變量均為外生變量。 H1:至少有一個解釋變量為內生變量。 quietly reg lw80 s80 expr80 tenure80 iq est store ols quietly ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age) est store iv hausman iv ols ,若 Hausman 檢驗失效(檢驗統(tǒng)計量為負值),則使用dmexogxt,否則仍Hausman檢驗為主。,使用Davidson-MacKinnon檢驗,xtivreg 后 使用 dmexogxt * Davidson-MacKinnon (1993) 檢驗 * H0:OLS 和 xtivreg 都是一致的,即內生性問題對OLS的估計結果影響不大 xtivreg tl size ndts tang (npr=tobin L1.npr), fe dmexogxt Davidson-MacKinnon檢驗得到F統(tǒng)計量的P值小于0.05,代表有內生性,遺漏變量偏差可采用在多元回歸中加入遺漏變量的方法加以解決,但前提是只有當你有遺漏變量數(shù)據(jù)時上述方法才可行。 雙向因果關系偏差是指如果有時因果關系是從X到Y又從Y到X時,此時僅用多元回歸無法消除這一偏差。同樣, 變量有測量誤差也無法用我們前面學過的方法解決。 因此我們就必須尋找一種新的方法。,二、內生性的解決方案,事實上,僅僅為了解決內生性問題,并不需要我們對內生性問題的緣起有很深入的理解。對于應用型的實證研究而言,我們只需要掌握解決內生性問題的具體方案即可。內生性問題的解決方案一共四種,理論上來講,這四種方案應對內生性問題都很有效。但于我個人而言,我對四種方法的評價是有高低的,由高到低分別介紹如下。,1.自然實驗法,所謂自然實驗,就是發(fā)生了某些外部突發(fā)事件,使得研究對象仿佛被隨機分成了實驗組或控制組。 這是我最喜歡的方法,只是自然實驗需要尋找一個事件,并且這個事件只影響解釋變量而不影響被解釋變量。遇著這種事件是一種緣分,還要能識別出來,這對學者的眼光也是一種挑戰(zhàn)。 有很多文章聲稱使用了自然實驗,但嚴格來講,并沒有做到對研究對象進行了隨機分組。雖然如此,我對此類文章仍然很是喜歡。,自然實驗包括的要素有:一個政策措施(treatment),一個觀察到的結果(outeome),一個對照組(contorlgoruP)。在評估“政策措施”對“結果”是否發(fā)揮作用時,對照組充當一個參照系。而一個“準自然實驗”和自然實驗的區(qū)別在于處理組和對照組的選取是否隨機。 這里的“結果”是以受政策影響的縣和沒有受政策影響的縣之間在增長速度上的差異來衡量。 簡單連接改革措施和被直管縣績效的做法并不恰當。這樣的做法無法排除其他政策或是整體經(jīng)濟的影響,因而是無法衡量改革真實效果的。,17,2.雙重差分法,Difference-in-Difference (DID)一般稱為雙重差分法,或倍差法。倘若出現(xiàn)了一次外部沖擊,這次沖擊影響了一部分樣本,對另一部分樣本則無影響,而我們想看一下這次外部沖擊到底有何影響,雙重差分法就是用來研究這次沖擊的凈效應的。 其基本思想是,將受沖擊的樣本視作實驗組,再按照一定標準在未受沖擊的樣本中尋求與實驗組匹配的對照組,而后做差,做差剩下來的便是這次沖擊的凈效應。 雙重差分法實際上是固定效應的一個變種,差分的過程實際上是排除固定效應的過程。ZERA在計量論文寫作和發(fā)表的黑客教程有一個非常簡明風趣的舉例,我轉述于此,以饗讀者。,19,Difference in difference models,Maybe the most popular identification strategy in applied work today Attempts to mimic random assignment with treatment and “comparison” sample Application of two-way fixed effects model,20,Problem set up,Cross-sectional and time series data One group is treated with intervention Have pre-post data for group receiving intervention Can examine time-series changes but, unsure how much of the change is due to secular changes,21,Difference in difference models,Basic two-way fixed effects model Cross section and time fixed effects Use time series of untreated group to establish what would have occurred in the absence of the intervention Key concept: can control for the fact that the intervention is more likely in some types of states,22,Three different presentations,Tabular Graphical Regression equation,23,Difference in Difference,24,time,Y,t1,t2,Yt1,Yt2,treatment,control,Yc1,Yc2,Treatment effect= (Yt2-Yt1) (Yc2-Yc1),25,Key Assumption,Control group identifies the time path of outcomes that would have happened in the absence of the treatment In this example, Y falls by Yc2-Yc1 even without the intervention Note that underlying levels of outcomes are not important (return to this in the regression equation),26,Basic Econometric Model,Data varies by state (i) time (t) Outcome is Yit Only two periods Intervention will occur in a group of observations (e.g. states, firms, etc.),27,Three key variables Tit =1 if obs i belongs in the state that will eventually be treated Ait =1 in the periods when treatment occurs TitAit - interaction term, treatment states after the intervention Yit = 0 + 1Tit + 2Ait + 3TitAit + it,28,Yit = 0 + 1Tit + 2Ait + 3TitAit + it,29,More general model,Data varies by state (i) time (t) Outcome is Yit Many periods Intervention will occur in a group of states but at a variety of times,30,ui is a state effect vt is a complete set of year (time) effects Analysis of covariance model Yit = 0 + 3 TitAit + ui + t + it,31,Group effects Capture differences across groups that are constant over time Year effects Capture differences over time that are common to all groups,32,其中,d 就是雙重差分估計量,Y 為研究的結局變量,右側腳標中 treatment 和 control 分布代表干預組和對照組,t0 和 t1 分別代表干預前和干預后。構造了差分估計量之后,就要根據(jù)不同的數(shù)據(jù)類型和不同的結局變量 Y,分別選用相應的參數(shù)檢驗方法來進行建模 。,( 1) 適 用 于 獨 立 混 合 橫 截 面 數(shù) 據(jù),33,獨立混合橫截面數(shù)據(jù)是在不同時點從同一個的大總體內部分別進行隨機抽樣,將所得的數(shù)據(jù)混合起來的一種數(shù)據(jù)集。該類數(shù)據(jù)的特點為每一條數(shù)據(jù)都是獨立的觀測值。通過將不同時點的多個觀測值結合起來,從而可以加大樣本量以獲得更精密的估計量和更具功效的檢驗統(tǒng)計量; 也可加入新的變量時間( 即干預前后) ,以便判斷干預前后的差別。對于總體一致、范圍較大、涉及不同時間點的調查研究,多收集此類數(shù)據(jù),34,35,36,( 2) 適用于綜列數(shù)據(jù)面板數(shù)據(jù)的 DID 模型,37,面板數(shù)據(jù)要求在不同時點調查相同的研究對象 。它與獨立混合橫截面數(shù)據(jù)最大的不同在于,不同時點的觀測值并不是獨立分布的 。這類數(shù)據(jù)的特點在于: 由于研究的個體相同,一些不隨時間改變的不可觀測的因素( 如個 人特質等) 對不同時點的觀測值會產生影響,可以通過控制這些影響從而得到較為真實的結果;,38,39,40,由于一般大規(guī)模的人群調查存在較大的變異性問題,僅在模型中納入虛擬變量“分 組 ( A) ”、“時 間( T) ”是遠遠不夠的。為了提高解釋系數(shù) R2,需要加入其他可能影響被解釋變量的因素,即控制除分組、時間變量以外的其他變量。,ssc install diff help diff diff y ,t(treated) p(t) robust 如果有控制變量,可以利用cov()添加,41,工具變量(instrumental variable, IV)回歸是當回歸變量X與誤差項u相關時獲得總體回歸方程未知系數(shù)一致估計量的一般方法。我們經(jīng)常稱其為IV估計。 其基本思想是:假設方程是:,我們假設ui與Xi相關,則OLS估計量一定是有偏的和非一致的。工具變量估計是利用另一個“工具”變量Z將Xi分離成與ui相關和不相關的兩部分。,3.工具變量法,我們的工作就是要尋找相應的工具變量將解釋變量分解成內生變量和外生變量,然后利用兩階段最小二乘法(TSLS)進行估計。,工具變量的選取,一個有效的工具變量必須滿足稱為工具變量相關性和工具變量外生性兩個條件:即,(1)工具變量相關性:工具變量與所替代的隨機解釋變量高度相關; (2)工具變量外生性:工具變量與隨機誤差項不相關;,一個合適的工具變量應該同時滿足兩個條件:第一要能很好地解釋內生變量,也就是說工具變量和內生變量之間要足夠相關;第二,工具變量要來自系統(tǒng)之外,即工具變量具備外生性。 如果內生性表現(xiàn)為聯(lián)立性問題,第二個標準尤其必要。雖然統(tǒng)計證據(jù)可以告訴我們工具變量和內生變量是否相關,但是其背后的因果鏈條和工具變量是否具備外生性的證明一樣,必須依賴令人置信的邏輯推導 。 工具變量的外生性在回歸中表現(xiàn)為和方程的殘差項正交,即工具變量不會對方程被解釋變量產生影響,如果產生影響則只能通過內生變量起作用 。,兩階段最小二乘估計量,若工具變量Z滿足工具變量相關性和外生性的條件,則可用稱為兩階段最小二乘(TSLS)的IV估計量估計系數(shù)1。 兩階段最小二乘估計量分兩階段計算: 第一階段把X分解成兩部分:即與回歸誤差項相關的一部分以及與誤差項無關的一部分。 第二階段是利用與誤差項無關的那部分進行估計。,一般IV回歸模型,因變量 Yi。 外生解釋變量 W1i、 W2i、 Wri。 內生解釋變量 X1i、 X2i、 Xki。 我們引入工具變量Z1i、 Z2i、 Zmi 。,第一階段回歸:利用OLS建立每個內生變量( X1i、 X2i、 Xki)關于工具變量( Z1i、Z2i、 Zmi)和外生變量(W1i、 W2i、 Wri)的回歸,并得到所有回歸結果的擬合值Xi_hat。 第二階段回歸:用Xi_hat取代原有的Xi,與原有的外生變量Wi一起進行第二次回歸,得到TSLS統(tǒng)計量TSLS。 注意:工具變量出現(xiàn)在第一階段回歸,但不出現(xiàn)在第二階段回歸。,引入工具變量的個數(shù),假設我們有n個內生解釋變量,引入了m個工具變量,n和m的關系是什么? n=m 恰好識別 nm 不可識別 只有恰好識別和過度識別才能用IV方法估計。,兩階段最小二乘法的stata命令: ivregress 2sls depvar varlist1 (varlist2 =instlist),r,first 其中,“depvar”為被解釋變量,varlist1為外生解釋變量,varlist2為所有的內生解釋變量集合,instlist為工具變量集合。 選擇項r表示使用異方差穩(wěn)健的標準誤,選擇項“first”表示顯示第一階段的回歸。,工具變量有效性的檢驗,工具變量相關性 工具變量相關性越強,也就是工具變量能解釋越多的X變動,則IV回歸中能用的信息就越多,因此利用相關性更強的工具變量得到的估計量也更精確。 弱工具變量:如果雖然 但是 弱工具變量幾乎不能解釋X的變動。,弱工具變量檢驗準則,1. 偏R2(Sheas partial R2) 含義:在第一階段回歸中,在控制外生變量 影響的前提下,看其它變量對某內生變量的解釋力,或者說,在第一階段回歸中,剔除掉外生變量的影響。 2.最小特征值統(tǒng)計量F:經(jīng)驗上F應該大于10。 Stata 命令: estat firststage,all forcenonrobust,3. Cragg-Donald Wald F 統(tǒng)計量 4. Kleibergen-Paap Wald rk F 統(tǒng)計量” (當假定殘差項不滿足獨立同分布時,就看這個來判斷是否弱工具,原假設是弱工具,所以拒絕原假設就可以) F檢驗臨界值表 CHIDIST F(12(自變量數(shù)據(jù)m),600(自由度df=n(樣本數(shù))-m-1)) = 87.06 Stata命令:ivreg2,如果存在弱工具變量該怎么辦?,1. 如果有很多工具變量,有部分強工具變量和部分弱工具變量,可以舍棄較弱的工具變量而選用相關性較強的工具變量子集。在stata中,可以使用ivreg2命令進行“冗余檢驗”,以決定選擇舍棄哪個工具變量。(直觀上,冗余工具變量是那些第一階段回歸中不顯著的變量。) 2. 如果系數(shù)是恰好識別的,則你不能略去弱工具變量。在這種情況下,有兩個選擇: 第一個選擇是尋找其他較強的工具變量。(難度較大),第二個選擇是利用弱工具變量繼續(xù)進行實證分析,但采用的方法不再是TSLS。而是對弱工具變量不太敏感的有限信息極大似然法(LIML)。在大樣本下,LIML 與2SLS是漸近等價的,但在存在弱工具變量的情況下,LIML 的小樣本性質可能優(yōu)于2SLS。 LIML 的 Stata 命令為 ivregress liml depvar varlist1 (varlist2 =instlist),工具變量外生性的檢驗,剛才我們提到:只有恰好識別和過度識別才能用IV方法估計。 一個很重要的命題是:只有過度識別情況下才能檢驗工具變量的外生性,而恰好識別情況下無法檢驗。,過度識別約束檢驗,基本思想: 假設有一個內生回歸變量,兩個工具變量且沒有包含的外生變量。則你可以計算兩個不同的TSLS估計量:其中一個利用第一個工具變量,而另一個利用第二個工具變量。由于抽樣變異性,這兩個估計量不會相同,但如果兩個工具變量都是外生的,則這兩個估計量往往比較接近。如果由這兩個工具變量得到估計非常不同,則你可以得出其中一個或兩個工具變量都有內生性問題的結論。,識別標準: Sargan 統(tǒng)計量:ivregress 2sls過程中,實際的工具變量(組)是x*與z*。Sagan檢驗即檢驗這些工具變量是否外生(是否與擾動項相關),原假設是這些變量都與擾動項不相關。利用殘差對這些工具變量回歸。 sargen檢驗的P值應該越大越好,一般超過0.1既可以說明不能拒絕工具變量有效的零假設,不宜接近于1,一般大于0.4就是危險信號,工具變量過多,導致檢驗結果不可信。 Sargan統(tǒng)計量服從自由度為L-k的卡方分布,查表。在excel中輸入CHIDIST(x,iv-v),其中x是sargan統(tǒng)計量的值,iv是工具變量的秩,v是估計參數(shù)個數(shù)?;剀嚒?Hansen J統(tǒng)計量 C統(tǒng)計量,說明采用工具變量的合理性 過度識別檢驗的 Stata 命令: estat overid,xtabond2 also reports tests of over-identifying restrictions-of whether the instruments, as a group, appear exogenous. For one-step, non-robust estimation, it reports the Sargan statistic, which is the minimized value of the one-step GMM criterion function. The Sargan statistic is not robust to heteroskedasticity or autocorellation. So for one-step, robust estimation (穩(wěn)健估計and for all two-step estimation), xtabond2 also reports the Hansen J statistic, which is the minimized value of the two-step GMM criterion function, and is robust. xtabond2 still reports the Sargan statistic in these cases because the J test has its own problem: it can be greatly weakened by instrument proliferation.,究竟該用 OLS 還是工具變量法,豪斯曼檢驗 原假設為: H0 :所有解釋變量均為外生變量 reg y x1 x2 est store ols ivregress 2sls y x1 (x2=z1 z2) est store iv hausman iv ols, sigmamore,上述檢驗的缺點是,它假設在H0成立的情況下,OLS 最有效率。但如果存在異方差,OLS 并不最有效率(不是 BLUE)。故傳統(tǒng)的豪斯曼檢驗不適用于異方差的情形。 此時可以使用杜賓-吳-豪斯曼檢驗(DWH),該檢驗在異方差的情況下也適用,更為穩(wěn)健。 stata命令: estat endogenous 為負值不存在內生性,例一,Mincer (1958)最早研究了工資與受教育年限的正相關關系,但遺漏了“能力”這個變量,導致遺漏變量偏差。針對美國面板調查數(shù)據(jù)中的年輕男子組群(Young Mens Cohort of the National Longitudinal Survey,簡記 NLS-Y),Griliches (1976)采用工具變量法對遺漏變量問題進行了校正。Blackburn and Neumark (1992)更新 了 Griliches (1976)的數(shù)據(jù),即這個例子中將要使用的數(shù)據(jù)集grilic.dta。,該數(shù)據(jù)集中包括以下變量:lw(工資對數(shù)),s(受教育年限),age(年齡),expr(工齡),tenure(在現(xiàn)單位的工作年數(shù)),iq(智商),med(母親的受教育年限),kww(在“knowledge of the World of Work”測試中的成績),mrt(婚姻虛擬變量,已婚=1),rns(美國南方虛擬變量,住在南方=1),smsa(大城市虛擬變量,住在大城市=1),year(有數(shù)據(jù)的最早年份,19661973年中的某一年)。,這是一個兩期面板數(shù)據(jù),初始期為當以上變量有數(shù)據(jù)的最早年份,結束期為1980 年。不帶80字樣的變量名為初始期,帶80字樣的變量名為1980年數(shù)據(jù)。比如,iq 指的是初始期的智商,而lw80指的是1980年的工資對數(shù)。,(1) 先看一下數(shù)據(jù)的統(tǒng)計特征。 use grilic.dta,clear sum (2) 考察智商與受教育年限的相關關系。 pwcorr iq s,sig (3) 建立如下方程:,reg lw80 s80 expr80 tenure80,繼續(xù)對方程進行分析:我們發(fā)現(xiàn)了如下問題: 1。遺漏變量問題:認為方程遺漏了“能力”這個變量,加入iq(智商)作為“能力”的代理變量。 reg lw80 s80 iq expr80 tenure80,2。測量誤差問題:iq(智商)對“能力”的測量存在誤差。 3。變量內生性問題:s80可能與擾動項中除“能力”以外的其他因素相關,因此是內生變量。 解決方法:引入四個變量med,kww,mrt,age,作為內生解釋變量iq與s80的工具變量。 然后使用TSLS方法進行回歸。 ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first,也可以使用GMM估計方法 使用兩步GMM 。 ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age) 使用迭代GMM 。 ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age),igmm,幾點注意事項: 1。 first選項的目的是顯示TSLS第一階段的結果,如果省略,則僅顯示第二階段的結果。 2。命令的用法比較嚴格,將被解釋變量和所有外生解釋變量放到括號外面,內生解釋變量放到括號里面,等號后面為所有工具變量。 3。2SLS只能通過stata完成,利用定義手動計算的結果是錯誤的,因為殘差序列是錯誤的。,4。不可能單獨為每個內生變量指定一組特定的工具變量,而是給所有內生變量指定一系列工具變量 。 5。所有外生變變量都作為自己的工具變量。 6。為了檢驗工具變量的外生性,本題為過度識別。 7。在大樣本下,IV 估計是一致的,但在小樣本下,IV 估計并非無偏估計量,有些情況下偏誤可能很嚴重。,弱工具變量檢驗,檢驗方法: 1。初步判斷可以用偏R2(partial R2) (剔除掉模型中原有外生變量的影響)。 2。 Minimum eigenvalue statistic(最小特征值統(tǒng)計量),經(jīng)驗上此數(shù)應該大于10。 這個方法類似于與書上的“第一階段F統(tǒng)計量” 。,工具變量外生性檢驗,我們一般稱為過度識別約束J檢驗。 檢驗工具變量是否與干擾項相關,即工具變量是否為外生變量。 TSLS根據(jù)Sargan統(tǒng)計量進行過度識別檢驗 。 命令為: estat overid 檢驗工具變量的外生性。 H0:所有工具變量都是外生的。 H1:至少有一個工具變量不是外生的,與擾動項相關。,ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first estat firststage,all forcenonrobust estat firststage estat overid,究竟該用OLS 還是IV,解釋變量是否真的存在內生性? 假設能夠找到方程外的工具變量。 1。如果所有解釋變量都是外生變量,則OLS 比IV 更有效。在這種情況下使用IV,雖然估計量仍然是一致的,會增大估計量的方差。2。如果存在內生解釋變量,則OLS 是不一致的,而IV 是一致的。,4. 動態(tài)面板回歸法,基本思想是將解釋變量和被解釋變量的滯后項作為工具變量(IV)。其實,我是不認可這種處理方法,除非萬不得已,我不推薦這種方法,我也不太相信這種方法能真正緩解內生性問題。,廣義矩估計法:GMM,基本思想: 求解如下一般化目標函數(shù),使之最小化 J(b_GMM) = n*g(b_GMM)*W*g(b_GMM) 其中,W 為權重矩陣 在球型擾動項的假定下,2SLS 是最有效的。但如果擾動項存在異方差或自相關,則廣義矩估計方法效果更好。 GMM方法又分為兩步GMM法和迭代GMM方法。,異方差性是相對于同方差而言的。所謂同方差,是為了保證回歸參數(shù)估計量具有良好的統(tǒng)計性質,經(jīng)典線性回歸模型的一個重要假定:總體回歸函數(shù)中的隨機誤差項滿足同方差性,即它們都有相同的方差。如果這一假定不滿足,即:隨機誤差項具有不同的方差,則稱線性回歸模型存在異方差性。 對于模型 如果隨機誤差項的各期望值之間存在著相關關系,即 這時,稱隨機誤差項之間存在自相關性(autocorrelation)或序列相關,有關 GMM 的 Stata 命令為 ivregress gmm y x1 (x2=z1 z2) (兩步 GMM) ivregress gmm y x1 (x2=z1 z2),igmm (迭代 GMM) estat overid (過度識別檢驗),例二,reg lw s expr tenure rns smsa,r 引入智商(iq)作為“能力”的代理變量,再進行 OLS 回歸。 reg lw s iq expr tenure rns smsa,r,(2) 由于用 iq 來度量能力存在“測量誤差”,故 iq 是內生變量,考慮使用變量(med, kww, mrt, age)作為 iq 的工具變量,進行 2SLS回歸,并使用穩(wěn)健標準誤。 ivregress 2sls lw s expr tenure rns smsa (iq=med kww mrt age),r first (3) 進行過度識別檢驗,考察是否所有工具變量均外生,即與擾動項不相關。 estat overid,(4) 我們懷疑(mrt, age)不滿足外生性,故使用 C 統(tǒng)計量檢驗這兩個工具變量的外生性。 findit ivreg2 ivreg2 lw s expr tenure rns smsa (iq=med kww mrt age),r orthog(mrt age) (5) 考慮僅使用變量(med, kww)作為 iq 的工具變量,再次進行2SLS 回歸。 ivregress 2sls lw s expr tenure rns smsa (iq=med kww),r first,再次進行過度識別檢驗: estat overid (6) 弱工具變量檢驗 estat firststage,all forcenonrobust (7) 為了穩(wěn)健起見,下面使用對弱工具變量更不敏感的有限信息最大似然法(LIML): ivregress liml lw s expr tenure rns smsa (iq=med kww),r,(8) 進一步考察弱工具變量問題,對工具變量 kww 進行冗余檢驗 ivreg2 lw s expr tenure rns smsa (iq=med kww),r redundant(kww) (9) 利用豪斯曼檢驗判斷是否存在內生解釋變量。 qui reg lw iq s expr tenure rns smsa est store ols1 qui ivregress 2sls lw s expr tenure rns smsa (iq=med kww) estimates store iv1 hausman iv1 ols1, sigmamore,(10) 由于傳統(tǒng)的豪斯曼檢驗在異方差的情形下不成立,下面進行異方差穩(wěn)健的 DWH 檢驗: estat endogenous 異方差下也可以利用ivreg2命令進行文件的內生性檢驗: ivreg2 lw s expr tenure rns smsa (iq=med kww),r endog(iq),(11) 如果存在異方差,則 GMM 比 2SLS 更有效率。為此,進行如下最優(yōu) GMM 估計。 ivregress gmm lw s expr tenure rns smsa (iq=med kww) 進行過度識別檢驗: estat overid 考慮迭代GMM: ivregress gmm lw s expr tenure rns smsa (iq=med kww),igmm,(12) 結果的完整展現(xiàn): qui reg lw s expr tenure rns smsa,r est store ols_no_iq qui reg lw iq s expr tenure rns smsa,r est store ols_with_iq qui ivregress 2sls lw s expr tenure rns smsa (iq=med kww),r est store tsls qui ivregress liml lw s expr tenure rns smsa (iq=med kww),r est store liml qui ivregress gmm lw s expr tenure rns smsa (iq=med kww) est store gmm qui ivregress gmm lw s expr tenure rns smsa (iq=med kww),igmm est store igmm outreg2 ols_no_iq ols_with_iq tsls liml gmm igmm using output.doc,replace seeout,遇到內生性問題如何處理,1.使用內生解釋變量的滯后變量作為工具變量。 2. 尋找有創(chuàng)意的工具變量。,內生性的其它解決辦法(1)代理變量:某變量無法直接觀測,而用其它變量替代。 (2)前定變量:用變量的前一期或前幾期數(shù)據(jù)。 (3)面板數(shù)據(jù)模型。 到底如何對待內生性問題(1)需要重點考慮的問題之一; (2)最好的收集數(shù)據(jù)之前就加以考慮,尤其是準備獲取一手數(shù)據(jù)的情況下。如果考慮?應用經(jīng)濟理論。,本實例使用數(shù)據(jù)集“grilic.dta”。 考察智商與受教育年限的相關關系: 上表顯示,智商(在一定程度上可以視為能力的代理變量)與受教育年限具有強烈的正相關關系(相關系數(shù)為0.51)。 作為一個參考系,先進行OLS回歸,并使用穩(wěn)健標準差:,其中expr, tenure, rns, smsa均為控制變量,而我們主要感興趣的是變量受教育年限(s)。 回歸的結果顯示,教育投資的年回報率為10.26%,這個似乎太高了??赡艿脑蚴牵捎谶z漏變量“能力”與受教育正相關,故“能力”對工資的貢獻也被納入教育的貢獻,因此高估了教育的回報率。 引入智商iq作為能力的代理變量,再進行OLS回歸:,雖然教育的投資回報率有所下降,但是依然很高。 由于用iq作為能力的代理變量有測量誤差,故iq是內生變量,考慮使用變量(med(母親的受教育年限)、kww(在“knowledge of the World of Work”中的成績)、mrt(婚姻虛擬變量,已婚=1)age(年齡)作為iq的工具變量,進行2SLS回歸,并使用穩(wěn)健的標準差:,在此2SLS回歸中,教育回報率反而上升到13.73%,而iq對工資的貢獻居然為負值。使用工具變量的前提是工具變量的有效性。為此,進行過度識別檢驗,考察是否所有的工具變量均外生,即與擾動項不相關: 結果強烈拒絕所有工具變量均外生的原假設。 考慮僅使用變量(med, kww)作為iq的工具變量,再次進行2SLS回歸,同時顯示第一階段的回歸結果:,上表顯示,教育的回報率為6.08%,較為合理,再次進行過度識別檢驗: 接受原假設,認為(med,kww)外生,與擾動項不相關。 進一步考察有效工具變量的第二個條件,即工具變量與內生變量的相關性。從第一階段的回歸結果可以看出,工具變量對內生變量具有較好的解釋力。更正式的檢驗如下,從以上結果可看出,雖然Sheas partial R2不到0.04,但是F統(tǒng)計量為13.4010。 我們知道,雖然2SLS是一致的,但卻是有偏的,故使用2SLS會帶來“顯著性水平扭曲”(size distortion),而且這種扭曲隨著弱工具變量而增大。上表的最后部分顯示,如果在結構方程中對內生解釋變量的顯著性進行“名義顯著性水平”(nominal size)為5%的沃爾德檢驗,加入可以接受的“真實顯著性水平”(true size)不超過15%,則可以拒絕“弱工具變量”的原假設,因為最小特征值統(tǒng)計量為14.91,大于臨界值11.59。 總之我們有理由認為不存在弱工具變量。但為了穩(wěn)健起見,下面使用對弱工具變量更不敏感的有限信息最大似然法(LIML):,結果發(fā)現(xiàn),LIML的系數(shù)估計值與2SLS非常接近,這也從側面印證了“不存在弱工具變量”。 使用工具變量法的前提是存在內生解釋變量,為此須
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 認知能力發(fā)展教育
- 高中開學安全教育指南
- 甲狀腺切口引流管的護理
- 《智能網(wǎng)聯(lián)整車綜合測試》課件-超車場景測試評價
- 《社會財務共享服務實務》課件-個人所得稅申報
- 預防流感安全課件
- 預應力混凝土工程課件
- 船員上船前培訓指南
- 韻母un的課件教學課件
- 音樂鑒賞課件作品介紹
- 《樹立正確的“三觀”》班會課件
- 園林綠化移樹合同
- 醫(yī)療機構保潔人員培訓
- 企業(yè)員工健康促進計劃的設計與實施
- 助理工程師答辯演示
- 成人失禁相關性皮炎的預防與護理-護理團標
- 裝載機的基礎知識-裝載機的結構及儀表
- 現(xiàn)代低壓電器技術 課件 2. 常見低壓電器
- 浙江天垣新型墻體材料有限公司年產40萬立方米ALC板材項目環(huán)境影響報告
- 放射事件應急處理預案牙科
- GSV2.0反恐安全管理手冊
評論
0/150
提交評論