




已閱讀5頁,還剩51頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第四章多重共線性和虛擬變量的應用,本章要點,多重共線性的含義多重共線性產(chǎn)生的原因多重共線性的后果判斷多重共線性的方法及其修正方法虛擬變量的設置原則虛擬變量模型的應用鄒氏檢驗的做法及缺陷虛擬變量法檢驗結構穩(wěn)定性的優(yōu)點,多重共線性的概念,多重共線性(multicollinearity)一詞最早由挪威經(jīng)濟學家弗瑞希(R.Frisch)于1934年提出。其原義是指回歸模型中的一些或全部解釋變量中存在的一種完全(perfect)或準確(exact)的線性關系。而現(xiàn)在所說的多重共線性,除指上述提到的完全多重共線性(perfectmulticollinearity),也包括近似多重共線性(nearmulticollinearity)。,為對上述兩概念加以區(qū)別,我們以一組解釋變量為例如果存在一組不完全為零的常數(shù)滿足,即任一變量都可以由其它變量的線性組合推出,則這組變量滿足完全多重共線性。若變量組,滿足如下關系式,其中u表示隨機誤差項,即某一變量不僅取決于其它變量的線性組合,也取決于隨機誤差項,此時變量組之間存在非嚴格但近似的線性關系,解釋變量之間高度相關,也即變量組存在近似多重共線性關系。,多重共線性產(chǎn)生的原因,多重共線性問題在金融數(shù)據(jù)中是普遍存在的,不僅存在于時間序列數(shù)據(jù)中,也存在于橫截面數(shù)據(jù)中。具體而言,多重共線性產(chǎn)生的原因主要有以下幾點:(1)數(shù)據(jù)收集及計算方法。(2)模型或從中取樣的總體受到限制。(3)模型設定偏誤。此外,在觀測值個數(shù)較少,以至于小于解釋變量個數(shù)時,也會產(chǎn)生多重共線性;時間序列數(shù)據(jù)中,若同時使用解釋變量的當期值和滯后值,由于當期值和滯后值之間往往高度相關,也容易產(chǎn)生多重共線性。,多重共線性的后果,多重共線性不會改變最小二乘估計的無偏性,但在解釋變量之間存在嚴重的多重共線性而被忽略時,會對模型的估計、檢驗與預測產(chǎn)生嚴重的不良后果。以某一離差形式(即)表示的二元線性回歸模型為例若存在完全多重共線性,假設存在關系常數(shù)。則的估計值同理也是無法確定的,即不能求得參數(shù)估計值。,而對于參數(shù)估計值的方差,有同理,的方差也是無限大的。因此,當存在完全多重共線性時,我們將不能求得參數(shù)估計值,參數(shù)估計值的方差無限大。當存在近似多重共線性時,盡管可以求得參數(shù)估計值,但它們是不穩(wěn)定的,同時參數(shù)估計值的方差將變大,變大的程度取決于多重共線性的嚴重程度。,在實際金融數(shù)據(jù)中,完全多重共線性只是一種極端情況,各種解釋變量之間存在的往往是近似多重共線性,因此通常所說多重共線性造成的后果是指近似多重共線性造成的后果,具體而言,它將造成如下的后果:(1)回歸方程參數(shù)估計值將變得不精確,因為較大的方差將會導致置信區(qū)間變寬。(2)由于參數(shù)估計值的標準差變大,t值將縮小,使得t檢驗有可能得出錯誤的結論。(3)將無法區(qū)分單個變量對被解釋變量的影響作用。,多重共線性的檢驗,如前所述,多重共線性普遍存在于金融、經(jīng)濟數(shù)據(jù)中,因此對多重共線性的檢驗并不是要確定其是否存在,而是要確定多重共線性的程度。由于多重共線性是對被假定為非隨機變量的解釋變量的情況而言的,所以它是一種樣本而非總體特征,這決定了我們只能以某些經(jīng)驗法則(rulesofthumb)來檢驗模型的多重共線性。對多重共線性的檢驗主要包括以下內(nèi)容:(1)檢驗多重共線性問題是否嚴重(2)多重共線性的存在范圍,即確定多重共線性是由哪些主要變量引起的。(3)多重共線性的表現(xiàn)形式,即找出與主要變量有共線性的解釋變量。,檢驗多重共線性問題是否嚴重,若回歸模型的值高(如0.8),或F檢驗值顯著,但單個解釋變量系數(shù)估計值卻不顯著;或從金融理論知某個解釋變量對因變量有重要影響,但其估計值卻不顯著,則可以認為存在嚴重的多重共線性問題。若兩個解釋變量之間的相關系數(shù)高,比如說大于0.8,則可以認為存在嚴重的多重共線性。,判斷多重共線性的存在范圍,要確定多重共線性是由哪些主要變量引起的,可以采用輔助回歸法(auxiliaryregressionmethod)。所謂輔助回歸是指某一解釋變量對其余解釋變量的回歸,區(qū)別于因變量對所有解釋變量回歸的主回歸(mainregression)。輔助回歸法構造的檢驗統(tǒng)計量定義如下:服從自由度為k-1與n-k的F分布其中(i=1,2,k)為第i個解釋變量關于其余解釋變量的輔助回歸的擬和優(yōu)度,k為解釋變量的個數(shù),n代表樣本容量。,檢驗多重共線性的表現(xiàn)形式,當確定多重共線性是由哪些主要變量引起后,若要找出與主要變量有共線性的解釋變量,即確定多重共線性的表現(xiàn)形式,可采用偏相關系數(shù)法。解釋變量與偏相關系數(shù)即是在其它的解釋變量固定的情況下它們之間的相關系數(shù)。偏相關系數(shù)法構造的檢驗統(tǒng)計量定義如下:,服從自由度為n-k-1的t分布其中n為樣本容量,k為解釋變量的個數(shù),為與的偏相關系數(shù)。若顯著不為零,則認為、是引起多重共線性的原因,否則不是。,多重共線性的修正,如前所述,多重共線性在金融數(shù)據(jù)中是普遍存在的,是否對多重共線性采取修正措施取決于多重共線性的嚴重程度。若多重共線性程度較輕微,并不嚴重影響系數(shù)估計值(符號正確,t值顯著),則可以忽略多重共線性問題。若多重共線性對重要因素的系數(shù)估計值有嚴重的影響,則必須進行補救。采取何種補救措施,則取決于多重共線性因素的重要性、其它數(shù)據(jù)來源的可用性、所估計模型的目的以及其它需要考慮的事項。以下將介紹幾種補救措施。,多重共線性的修正,一、刪除不必要的變量如果在產(chǎn)生多重共線性的因素中有相對不重要的變量,則可試著將其刪除,這是解決多重共線性最簡單的方法,但刪除變量也可能會導致新問題的產(chǎn)生:(1)被刪除變量對因變量的影響將被其它解釋變量和隨機誤差項所吸收,這可能一方面解決了一部分變量的多重共線性問題,但另一方面卻又同時增強了另一部分變量的多重共線性問題,而且,還可能使隨機誤差項的自相關程度增強。(2)刪除某個變量可能會導致模型設定誤差(specificationerror)。所謂模型設定誤差,指的是在建立回歸模型的過程中,因為錯誤設定模型結構而產(chǎn)生的誤差。錯誤的刪除解釋變量將會導致最小二乘估計值是有偏的。,二、改變解釋變量的形式。1、差分法對于時間序列數(shù)據(jù)而言,若原始變量存在嚴重的多重共線性,則可以考慮對變量取差分形式,可在一定程度上降低多重共線性的程度。例如對于模型,可把變量變換為差分形式:2、指數(shù)增長率方法例如研究三種指數(shù)關系時,可用如下模型:,3、以比率代替高度相關的變量若模型中存在高度相關的變量,在不違反金融理論的前提下,可以求得兩者之間的比率,并以此比率代替相應變量出現(xiàn)在模型中。例如對于模型,若與之間高度相關,且模型的目的是用于預測,則可令,則可在一定程度上消除多重共線性此外,當模型中有較多解釋變量的滯后值,并存在嚴重多重共線性時,可以考慮用被解釋變量的滯后值代替解釋變量的滯后值;以人均形式的變量代替總體變量在某些狀況下也可以在一定程度上降低多重共線性的程度。,多重共線性的修正,三、補充新數(shù)據(jù)。由于多重共線性是一樣本特征,故有可能在關于同樣變量的另一樣本中共線性沒有第一個樣本那么嚴重。Christ(1966)認為:解釋變量之間的相關程度與樣本容量成反比,即樣本容量越小,相關程度越高;樣本容量越大,相關程度越小。因此,收集更多觀測值,增加樣本容量,就可以避免或減輕多重共線性的危害。,多重共線性的修正,四、利用先驗信息法。這里的先驗信息,包括從金融理論以及實際統(tǒng)計資料所獲得的解釋變量或所估計參數(shù)之間的關系。若發(fā)生多重共線性的那些解釋變量之間的關系可由先驗信息得到,則在所研究的模型中利用這種關系,便可以減輕多重共線性的程度。,金融數(shù)據(jù)的多重共線性處理:示例,理論上,股票代表著對公司未來現(xiàn)金流的所有權,因此,公司未來的收益以及利息是股票價格的決定因素。而宏觀經(jīng)濟形勢能夠影響到公司未來的收益,進而對股票價格產(chǎn)生影響。同時宏觀經(jīng)濟形勢也能夠通過其它的一些渠道直接對股票價格產(chǎn)生影響。我們將以整個股票市場為研究對象,來考慮影響股票價格指數(shù)的宏觀經(jīng)濟因素以及它們的影響程度。我們將采取從一般到特別的建模方式,即首先將模型中包含盡可能多的變量,然后通過各種檢驗逐步剔出對因變量沒有解釋能力的變量。,對影響股票價格指數(shù)宏觀經(jīng)濟因素的實證分析,我們選擇上證綜指(以Y表示)作為股票價格指數(shù)的代表。對于影響股票價格指數(shù)的宏觀經(jīng)濟因素,初步選定如下的十個宏觀變量:居民消費物價指數(shù)、商品零售物價指數(shù)、企業(yè)商品價格指數(shù)、工業(yè)增加值、固定資產(chǎn)投資、社會消費品零售總額、股市成交量、外匯市場交易量、匯率、貨幣供應量m1、進出口額。分別以至代表。其中前三個價格指數(shù)從不同側面反映了我國的市場環(huán)境,而則從不同側面反映了整體經(jīng)濟狀況,反映了我國金融環(huán)境的影響,股市成交量從一個側面反映了股市狀況。我們采用的數(shù)據(jù)是從2000.12004.9月的月度數(shù)據(jù),對于價格指數(shù)變量以及匯率,我們以原變量形式進入模型,而對于其它變量,我們?nèi)∑鋵?shù)形勢進入模型。,在對數(shù)據(jù)調(diào)整后,我們建立如下的模型:利用普通最小二乘法回歸方程,得到如下的結果:去掉不顯著的變量,對模型重新回歸得到:,在10%的顯著性水平下,變量系數(shù)估計值的t值都是顯著的,模型的=0.78,=0.75,總體上看模型是不錯的。盡管估計值的t值是顯著的,我們?nèi)詠頇z驗該模型解釋變量之間是否存在多重共線性,因為若兩個變量之間存在高度相關并且符號相反,他們的作用就會相互抵消,從而有可能兩個變量都是顯著的。首先,根據(jù)和t值,我們無法發(fā)現(xiàn)多重共線性,因此我們將利用變量之間的相關系數(shù)來判斷。,在Eviews軟件中,要獲得檢驗解釋變量兩兩之間的相關系數(shù)矩陣是很容易的,我們只需在命令窗口中鍵入“COR”命令以及相應的解釋變量。圖4-1相關系數(shù)矩陣,分別刪除、再進行回歸得到的結果如下:圖4-2刪除后的回歸結果,圖4-3刪除后的回歸結果,分別刪除X6、X10后得到的結果如下:圖4-4刪除X6后的回歸結果,圖4-5刪除X10后的回歸結果,最后得到的模型是:我們之所以在原回歸方程系數(shù)估計值都顯著的情況下仍進行多重共線性檢驗,并刪除一些變量,是因為在金融計量學中,在保證模型一定解釋能力的情況下,盡可能的使模型簡潔,是我們應該始終堅持的一個原則。在這個例子中,我們僅考慮了對模型解釋變量的多重共線性檢驗,在實際建模以及估計過程中,還應該考慮模型的自相關性、異方差性等的檢驗。,虛擬變量模型,在本章余下的四節(jié)中,我們將討論虛擬變量在回歸分析中的應用。虛擬變量既可以作為解釋變量出現(xiàn)在模型中,也可以作為因變量出現(xiàn)在模型中,我們統(tǒng)稱這類含虛擬變量的經(jīng)濟計量模型為虛擬變量模型。,虛擬變量的性質,在金融計量學中,所考慮的變量除了可以直接度量的數(shù)量變量(如價格、收益、收入等)之外,還有實質上是定性性質的變量,如性別、國家、戰(zhàn)爭及政府經(jīng)濟政策的變動等。這類定性變量常指某一性質、屬性出現(xiàn)或不出現(xiàn),例如男性或女性,中國人或外國人,戰(zhàn)爭期間或非戰(zhàn)爭期間等。由于其不能直接度量,為研究方便,可構造一個變量,令其取值為1或為0,取值為0時表示某一性質出現(xiàn)(不出現(xiàn)),取值為1時表示某性質不出現(xiàn)(出現(xiàn)),該變量即為虛擬變量(dummyvariables)。,一般的,在虛擬變量的設置中,基礎類型、否定類型取值為“0”,稱為基底(base)類、基準(benchmark)類或參考(reference)類;而比較類型、肯定類型取值“1”。虛擬變量和定量變量在回歸模型中的應用是一樣的。若一個模型中的解釋變量全部都是虛擬變量,則此模型被稱為方差分析模型(AnalysisofVarianceModel);若解釋變量中既有定量變量,又有虛擬變量,則該線性回歸模型可稱為協(xié)方差分析模型(AnalysisofCovarianceModel)。,例子,在我國上市公司中,個人做第一大股東的現(xiàn)象還非常少,主要是國家或法人作為公司的第一大股東。而國家作為第一大股東與法人相比,除了公司業(yè)績,還有其它考慮,例如就業(yè)、形象工程、負責人升遷、上繳利稅等,這些目標都或多或少有悖于公司利潤最大化的目標。另外,國家控股的公司由國家選擇代理人,而這些代理人往往是行政人員或官僚出身,沒有經(jīng)營管理的特長,進一步制約上市公司績效的發(fā)揮。因此,總體而言,國家作為第一大股東的上市公司的績效要低于法人做第一大股東的上市公司的績效。為驗證上述結論,我們建立如下的模型:,其中為每股收益,用以代表公司績效。的定義方式如下:1,國家是公司i的第一大股東=0,法人是公司i的第一大股東由模型可以得到:國家為第一大股東平均每股收益:=法人為第一大股東平均每股收益:=0)=,虛擬變量的設置原則,許多金融現(xiàn)象表明,金融數(shù)據(jù)特別是時間序列數(shù)據(jù)常因某些非正常因素(如戰(zhàn)爭、自然災害等)而產(chǎn)生較大的波動,這種波動使得被解釋變量與解釋變量之間的數(shù)量依存關系在某一期或暑期內(nèi)同其它各期相比具有顯著的差異。這種差異表現(xiàn)為描述變量之間關系的回歸線(面)在不同時期內(nèi)或截距項移動,或斜率移動,或截距項和斜率同時移動。,相應的,為表述這種移動,虛擬變量的引入方式也有如下的三種:(1)加法方式:(2)乘法方式:(3)同時以加法方式及乘法方式引入:在同一個模型中,可以引入多個虛擬變量,但其設置必須遵循如下的原則:如果一個定性變量有m個類別,則僅要引入m-1個虛擬變量。,虛擬變量模型的運用,1、虛擬變量模型在調(diào)整季節(jié)波動中的運用許多按月度或季度數(shù)據(jù)表示的金融時間序列,常呈現(xiàn)出季節(jié)變化的規(guī)律性,如公司銷售額、通貨膨脹率、節(jié)假日儲蓄額等。在研究中,有時需要消除季節(jié)性因素的影響,即需要進行季節(jié)調(diào)整(seasonaladjustment)。進行季節(jié)調(diào)整有多種方法,而利用虛擬變量進行季節(jié)調(diào)整是較為簡單的一種。原模型:引入虛擬變量:,2、虛擬變量模型在分段線性回歸中的應用在金融理論中,常常會出現(xiàn)一種情況:當某影響因素越過某一臨界值,或時間過了某一臨界點之后,因變量對影響因素的變化率將發(fā)生變化,在圖形中就表現(xiàn)為斜率不同的兩段連續(xù)折線。對構成折線的數(shù)據(jù)的回歸即為分段線性回歸。例如:利用虛擬變量,我們可以建立如下的回歸模型:,圖4-6有兩個轉折點的聯(lián)系折線,3、利用虛擬變量模型對平行數(shù)據(jù)進行混合回歸假定要研究某一類型上市公司資本結構與影響因素之間的關系,我們以總負債率(以Y表示)代表資本結構,其影響因素假設只有股權結構(以表示)、公司治理結構(以表示)、成長性(以表示)三個因素;遺憾的是,假設這一類型的上市公司只有兩家,而每家也只有從1991-2004年共14年的年度數(shù)據(jù)。很明顯,對每一年利用橫截面數(shù)據(jù)回歸是不能的(觀測值個數(shù)小于待估參數(shù)的個數(shù))。,而對每家公司利用時間序列數(shù)據(jù)回歸,盡管可以得到系數(shù)估計值,但實際上由于兩家公司類型相同,可能受某些相同因素的影響,所以兩方程的隨機誤差項可能是同期相關的,對每個方程分別應用普通最小二乘回歸是不合適的。在此情況下,我們可以利用虛擬變量模型對時間序列和橫截面數(shù)據(jù)的混合數(shù)據(jù)做出回歸:,回歸模型的結構穩(wěn)定性檢驗鄒氏檢驗,一、鄒氏檢驗的過程:鄒氏檢驗所依據(jù)的理論前提包括:在可能發(fā)生的結構變化前后,隨機誤差項具有相同的方差;隨機誤差項滿足獨立正態(tài)分布。在這些假定下,可按如下的步驟進行鄒氏檢驗:1、將數(shù)據(jù)以可能發(fā)生結構變化的點為界分為兩部分。分別利用全部數(shù)據(jù)、兩分樣本對模型進行回歸,并獲得三次回歸的殘差平方和。,2、此時,對全部數(shù)據(jù)進行回歸得到的模型是一個受約束的模型(假定模型在整段數(shù)據(jù)中不發(fā)生結構性變化,即假定系數(shù)估計值在整個樣本期間是穩(wěn)定的),而對兩分段數(shù)據(jù)的回歸則是不受約束的模型(利用兩個分樣本分別得到的系數(shù)估計值可以是不同的),因此對整段數(shù)據(jù)回歸得到的殘差平方和大于對兩分樣本進行回歸得到的殘差平方和之和,可建立如下的F檢驗:它服從F(k,T-2k)分布,3、查表求得在一定顯著性水平下的F臨界值。如果第二步計算出的F值大于臨界F值,則拒絕模型結構穩(wěn)定的假設;如果小于臨界F值,則不能拒絕模型結構穩(wěn)定性假設。應用鄒氏檢驗的過程中應注意以下幾點:必須滿足前提假設條件。鄒氏檢驗僅僅告訴我們模型結構是否穩(wěn)定,而不能告訴我們?nèi)绻Y構不穩(wěn)定,到底是截距還是斜率抑或兩者都發(fā)生了變化,在下一節(jié)中我們將引入虛擬變量來解決這個問題。鄒氏檢驗需要知道結構可能發(fā)生的時間點,如果不知道,則需要使用其它方法。,在Eviews軟件中如何做鄒氏檢驗,貨幣政策往往根據(jù)宏觀經(jīng)濟形勢的變化而發(fā)生變化,這就會導致貨幣供應量等貨幣政策的中間目標可能在某個時間點發(fā)生結構性變化。例如,以我國為例,1995-1997貨幣政策的主要目標是抑制通貨膨脹,而1998年后由于亞洲金融危機的沖擊等我國反而出現(xiàn)了通貨緊縮,這時的貨幣政策也轉變?yōu)椤胺€(wěn)健的貨幣政策”,主要目標變?yōu)榉乐雇ㄘ浘o縮,刺激經(jīng)濟增長,因此貨幣供應量的增長在1998年可能會發(fā)生結構性的變化。為檢驗上述猜想,我們利用1995年第一季度到2004年第二季度的季度數(shù)據(jù),以M2代表貨幣供應量,通過對GDP進行回歸(因GDP增長相對穩(wěn)定),并選定1998年第二季度為可能發(fā)生結構變化的轉折點,來進行鄒氏檢驗。,在Eviews中對下面模型進行回歸其中、分別表示廣義貨幣供應量M2和GDP.圖4-7回歸方程設定,,,圖4-8回歸結果,圖4-9選擇鄒氏檢驗,圖4-10確定鄒氏檢驗轉折點,圖4-11鄒氏檢驗結果,回歸模型的結構穩(wěn)定性檢驗虛擬變量法,鄒氏檢驗只能告訴我們結構是否發(fā)生變化,而不能告訴我們到底是截距還是斜率發(fā)生了變化,虛擬變量法則能有效地解決這一問題。下面我們將通過一個例子來說明如何運用虛擬變量法對模型進行結構穩(wěn)定性檢驗。對于一元線形模型,假定在時刻,由于外部事件的沖擊,我們懷疑模型的結構可能發(fā)生了變化。為驗證這一觀點,我們可以建立如下的虛擬變量模型,1其中=0可見,=0,)=,表示的是發(fā)生結構變化前的關系;=1,)=表示的是可能的結構變化發(fā)生后的關系。利用全部數(shù)據(jù)對上述虛擬變量模型進行最小二乘回歸,并對參數(shù)估計值進行顯著性
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 開放社區(qū)食堂管理辦法
- 西安代理記賬管理辦法
- 遵義養(yǎng)豬日常管理辦法
- 大眾服裝陳列培訓課件
- 肝臟腫瘤護理課件
- 員工培訓理論課件
- 佛山春招數(shù)學試卷
- 二模高質量數(shù)學試卷
- 高三沖刺班高中數(shù)學試卷
- 肘關節(jié)脫位護理課件
- 2023-6新高考語文答題卡(全國甲卷兩欄)可以編輯
- 校本研修活動方案設計與實施
- 總承包管理技術方案
- 2024山西航空產(chǎn)業(yè)集團有限公司招聘筆試參考題庫附帶答案詳解
- 大學生心理健康教育(周莉第四版) 課件 第1-5章 主動掌控:打造健康生活-戀愛與性:理解親密關系
- 家庭教育學整套課件
- 營銷人員財務必備之財務與營銷結合
- 公安出入境培訓課件
- 領袖涅盤培訓
- 鍛壓設備安裝工程施工及驗收規(guī)范
- 瑞安市工業(yè)固廢與污泥無害化處置及資源化利用項目階段性竣工環(huán)境保護驗收報告
評論
0/150
提交評論