普通最小二乘法.ppt_第1頁(yè)
普通最小二乘法.ppt_第2頁(yè)
普通最小二乘法.ppt_第3頁(yè)
普通最小二乘法.ppt_第4頁(yè)
普通最小二乘法.ppt_第5頁(yè)
已閱讀5頁(yè),還剩107頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章經(jīng)典單方程計(jì)量經(jīng)濟(jì)學(xué)模型 一元線性回歸模型 回歸分析概述一元線性回歸模型的參數(shù)估計(jì)一元線性回歸模型檢驗(yàn)一元線性回歸模型預(yù)測(cè)實(shí)例 2 1回歸分析概述 一 變量間的關(guān)系及回歸分析的基本概念二 總體回歸函數(shù) PRF 三 隨機(jī)擾動(dòng)項(xiàng)四 樣本回歸函數(shù) SRF 一 變量間的關(guān)系及回歸分析的基本概念 1 變量間的關(guān)系 1 確定性關(guān)系或函數(shù)關(guān)系 研究的是確定現(xiàn)象非隨機(jī)變量間的關(guān)系 2 統(tǒng)計(jì)依賴或相關(guān)關(guān)系 研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系 對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析 correlationanalysis 或回歸分析 regressionanalysis 來(lái)完成的 注意 不線性相關(guān)并不意味著不相關(guān) 有相關(guān)關(guān)系并不意味著一定有因果關(guān)系 回歸分析 相關(guān)分析研究一個(gè)變量對(duì)另一個(gè) 些 變量的統(tǒng)計(jì)依賴關(guān)系 但它們并不意味著一定有因果關(guān)系 相關(guān)分析對(duì)稱地對(duì)待任何 兩個(gè) 變量 兩個(gè)變量都被看作是隨機(jī)的 回歸分析對(duì)變量的處理方法存在不對(duì)稱性 即區(qū)分應(yīng)變量 被解釋變量 和自變量 解釋變量 前者是隨機(jī)變量 后者不是 2 回歸分析的基本概念回歸分析 regressionanalysis 是研究一個(gè)變量關(guān)于另一個(gè) 些 變量的具體依賴關(guān)系的計(jì)算方法和理論 其目的在于通過后者的已知或設(shè)定值 去估計(jì)和 或 預(yù)測(cè)前者的 總體 均值 被解釋變量 ExplainedVariable 或應(yīng)變量 DependentVariable 解釋變量 ExplanatoryVariable 或自變量 IndependentVariable 回歸分析構(gòu)成計(jì)量經(jīng)濟(jì)學(xué)的方法論基礎(chǔ) 其主要內(nèi)容包括 1 根據(jù)樣本觀察值對(duì)經(jīng)濟(jì)計(jì)量模型參數(shù)進(jìn)行估計(jì) 求得回歸方程 2 對(duì)回歸方程 參數(shù)估計(jì)值進(jìn)行顯著性檢驗(yàn) 3 利用回歸方程進(jìn)行分析 評(píng)價(jià)及預(yù)測(cè) 二 總體回歸函數(shù) 回歸分析關(guān)心的是根據(jù)解釋變量的已知或給定值 考察被解釋變量的總體均值 即當(dāng)解釋變量取某個(gè)確定值時(shí) 與之統(tǒng)計(jì)相關(guān)的被解釋變量所有可能出現(xiàn)的對(duì)應(yīng)值的平均值 例2 1 一個(gè)假想的社區(qū)有100戶家庭組成 要研究該社區(qū)每月家庭消費(fèi)支出Y與每月家庭可支配收入X的關(guān)系 即如果知道了家庭的月收入 能否預(yù)測(cè)該社區(qū)家庭的平均月消費(fèi)支出水平 為達(dá)到此目的 將該100戶家庭劃分為組內(nèi)收入差不多的10組 以分析每一收入組的家庭消費(fèi)支出 由于不確定因素的影響 對(duì)同一收入水平X 不同家庭的消費(fèi)支出不完全相同 但由于調(diào)查的完備性 給定收入水平X的消費(fèi)支出Y的分布是確定的 即以X的給定值為條件的Y的條件分布 Conditionaldistribution 是已知的 例如 P Y 561 X 800 1 4 因此 給定收入X的值Xi 可得消費(fèi)支出Y的條件均值 conditionalmean 或條件期望 conditionalexpectation E Y X Xi 該例中 E Y X 800 561描出散點(diǎn)圖發(fā)現(xiàn) 隨著收入的增加 消費(fèi) 平均地說(shuō) 也在增加 且Y的條件均值均落在一根正斜率的直線上 這條直線稱為總體回歸線 在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線 populationregressionline 或更一般地稱為總體回歸曲線 populationregressioncurve 稱為 雙變量 總體回歸函數(shù) populationregressionfunction PRF 相應(yīng)的函數(shù) 含義 回歸函數(shù) PRF 說(shuō)明被解釋變量Y的平均狀態(tài) 總體條件期望 隨解釋變量X變化的規(guī)律 函數(shù)形式 可以是線性或非線性的 例2 1中 將居民消費(fèi)支出看成是其可支配收入的線性函數(shù)時(shí) 為一線性函數(shù) 其中 0 1是未知參數(shù) 稱為回歸系數(shù) regressioncoefficients 三 隨機(jī)擾動(dòng)項(xiàng) 總體回歸函數(shù)說(shuō)明在給定的收入水平Xi下 該社區(qū)家庭平均的消費(fèi)支出水平 但對(duì)某一個(gè)別的家庭 其消費(fèi)支出可能與該平均水平有偏差 稱為觀察值圍繞它的期望值的離差 deviation 是一個(gè)不可觀測(cè)的隨機(jī)變量 又稱為隨機(jī)干擾項(xiàng) stochasticdisturbance 或隨機(jī)誤差項(xiàng) stochasticerror 例2 1中 給定收入水平Xi 個(gè)別家庭的支出可表示為兩部分之和 1 該收入水平下所有家庭的平均消費(fèi)支出E Y Xi 稱為系統(tǒng)性 systematic 或確定性 deterministic 部分 2 其他隨機(jī)或非確定性 nonsystematic 部分 i 稱為總體回歸函數(shù) PRF 的隨機(jī)設(shè)定形式 表明被解釋變量除了受解釋變量的系統(tǒng)性影響外 還受其他因素的隨機(jī)性影響 由于方程中引入了隨機(jī)項(xiàng) 成為計(jì)量經(jīng)濟(jì)學(xué)模型 因此也稱為總體回歸模型 隨機(jī)誤差項(xiàng)主要包括下列因素 在解釋變量中被忽略的因素的影響 變量觀測(cè)值的觀測(cè)誤差的影響 模型關(guān)系的設(shè)定誤差的影響 其他隨機(jī)因素的影響 產(chǎn)生并設(shè)計(jì)隨機(jī)誤差項(xiàng)的主要原因 理論的含糊性 數(shù)據(jù)的欠缺 節(jié)省原則 四 樣本回歸函數(shù) SRF 問題 能從一次抽樣中獲得總體的近似的信息嗎 如果可以 如何從抽樣中獲得總體的近似信息 例2 2 在例2 1的總體中有如下一個(gè)樣本 能否從該樣本估計(jì)總體回歸函數(shù)PRF 回答 能 該樣本的散點(diǎn)圖 scatterdiagram 畫一條直線以盡好地?cái)M合該散點(diǎn)圖 由于樣本取自總體 可以該直線近似地代表總體回歸線 該直線稱為樣本回歸線 sampleregressionlines 記樣本回歸線的函數(shù)形式為 稱為樣本回歸函數(shù) sampleregressionfunction SRF 注意 這里將樣本回歸線看成總體回歸線的近似替代 則 樣本回歸函數(shù)的隨機(jī)形式 樣本回歸模型 同樣地 樣本回歸函數(shù)也有如下的隨機(jī)形式 由于方程中引入了隨機(jī)項(xiàng) 成為計(jì)量經(jīng)濟(jì)模型 因此也稱為樣本回歸模型 sampleregressionmodel 回歸分析的主要目的 根據(jù)樣本回歸函數(shù)SRF 估計(jì)總體回歸函數(shù)PRF 即 根據(jù) 估計(jì) 注意 這里PRF可能永遠(yuǎn)無(wú)法知道 2 2一元線性回歸模型的參數(shù)估計(jì) 一 一元線性回歸模型的基本假設(shè)二 參數(shù)的普通最小二乘估計(jì) OLS 三 參數(shù)估計(jì)的最大或然法 ML 四 最小二乘估計(jì)量的性質(zhì)五 參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì) 說(shuō)明 單方程計(jì)量經(jīng)濟(jì)學(xué)模型分為兩大類 線性模型和非線性模型線性模型中 變量之間的關(guān)系呈線性關(guān)系非線性模型中 變量之間的關(guān)系呈非線性關(guān)系一元線性回歸模型 只有一個(gè)解釋變量 i 1 2 n Y為被解釋變量 X為解釋變量 0與 1為待估參數(shù) 為隨機(jī)干擾項(xiàng) 回歸分析的主要目的是要通過樣本回歸函數(shù) 模型 SRF盡可能準(zhǔn)確地估計(jì)總體回歸函數(shù) 模型 PRF 估計(jì)方法有多種 其中最廣泛使用的是普通最小二乘法 ordinaryleastsquares OLS 為保證參數(shù)估計(jì)量具有良好的性質(zhì) 通常對(duì)模型提出若干基本假設(shè) 實(shí)際這些假設(shè)與所采用的估計(jì)方法緊密相關(guān) 一 線性回歸模型的基本假設(shè) 假設(shè)1 解釋變量X是確定性變量 不是隨機(jī)變量 假設(shè)2 隨機(jī)誤差項(xiàng) 具有零均值 同方差和不序列相關(guān)性 E i 0i 1 2 nVar i 2i 1 2 nCov i j 0i ji j 1 2 n 假設(shè)3 隨機(jī)誤差項(xiàng) 與解釋變量X之間不相關(guān) Cov Xi i 0i 1 2 n假設(shè)4 服從零均值 同方差 零協(xié)方差的正態(tài)分布 i N 0 2 i 1 2 n 如果假設(shè)1 2滿足 則假設(shè)3也滿足 如果假設(shè)4滿足 則假設(shè)2也滿足 注意 以上假設(shè)也稱為線性回歸模型的經(jīng)典假設(shè)或高斯 Gauss 假設(shè) 滿足該假設(shè)的線性回歸模型 也稱為經(jīng)典線性回歸模型 ClassicalLinearRegressionModel CLRM 另外 在進(jìn)行模型回歸時(shí) 還有兩個(gè)暗含的假設(shè) 假設(shè)5 隨著樣本容量的無(wú)限增加 解釋變量X的樣本方差趨于一有限常數(shù) 即 假設(shè)6 回歸模型是正確設(shè)定的 假設(shè)5旨在排除時(shí)間序列數(shù)據(jù)出現(xiàn)持續(xù)上升或下降的變量作為解釋變量 因?yàn)檫@類數(shù)據(jù)不僅使大樣本統(tǒng)計(jì)推斷變得無(wú)效 而且往往產(chǎn)生所謂的偽回歸問題 spuriousregressionproblem 假設(shè)6也被稱為模型沒有設(shè)定偏誤 specificationerror 二 參數(shù)的普通最小二乘估計(jì) OLS 給定一組樣本觀測(cè)值 Xi Yi i 1 2 n 要求樣本回歸函數(shù)盡可能好地?cái)M合這組值 普通最小二乘法 Ordinaryleastsquares OLS 給出的判斷標(biāo)準(zhǔn)是 二者之差的平方和 最小 方程組 稱為正規(guī)方程組 normalequations 記 上述參數(shù)估計(jì)量可以寫成 稱為OLS估計(jì)量的離差形式 deviationform 由于參數(shù)的估計(jì)結(jié)果是通過最小二乘法得到的 故稱為普通最小二乘估計(jì)量 ordinaryleastsquaresestimators 順便指出 記 則有 可得 式也稱為樣本回歸函數(shù)的離差形式 注意 在計(jì)量經(jīng)濟(jì)學(xué)中 往往以小寫字母表示對(duì)均值的離差 三 參數(shù)估計(jì)的最大或然法 ML 最大或然法 MaximumLikelihood 簡(jiǎn)稱ML 也稱最大似然法 是不同于最小二乘法的另一種參數(shù)估計(jì)方法 是從最大或然原理出發(fā)發(fā)展起來(lái)的其他估計(jì)方法的基礎(chǔ) 基本原理 對(duì)于最大或然法 當(dāng)從模型總體隨機(jī)抽取n組樣本觀測(cè)值后 最合理的參數(shù)估計(jì)量應(yīng)該使得從模型中抽取該n組樣本觀測(cè)值的概率最大 在滿足基本假設(shè)條件下 對(duì)一元線性回歸模型 隨機(jī)抽取n組樣本觀測(cè)值 Xi Yi i 1 2 n 那么Yi服從如下的正態(tài)分布 于是 Y的概率函數(shù)為 i 1 2 n 假如模型的參數(shù)估計(jì)量已經(jīng)求得 為 因?yàn)閅i是相互獨(dú)立的 所以的所有樣本觀測(cè)值的聯(lián)合概率 也即或然函數(shù) likelihoodfunction 為 將該或然函數(shù)極大化 即可求得到模型參數(shù)的極大或然估計(jì)量 由于或然函數(shù)的極大化與或然函數(shù)的對(duì)數(shù)的極大化是等價(jià)的 所以 取對(duì)數(shù)或然函數(shù)如下 解得模型的參數(shù)估計(jì)量為 可見 在滿足一系列基本假設(shè)的情況下 模型結(jié)構(gòu)參數(shù)的最大或然估計(jì)量與普通最小二乘估計(jì)量是相同的 例2 2 1 在上述家庭可支配收入 消費(fèi)支出例中 對(duì)于所抽出的一組樣本數(shù) 參數(shù)估計(jì)的計(jì)算可通過下面的表2 2 1進(jìn)行 因此 由該樣本估計(jì)的回歸方程為 四 最小二乘估計(jì)量的性質(zhì) 當(dāng)模型參數(shù)估計(jì)出后 需考慮參數(shù)估計(jì)值的精度 即是否能代表總體參數(shù)的真值 或者說(shuō)需考察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì) 一個(gè)用于考察總體的估計(jì)量 可從如下幾個(gè)方面考察其優(yōu)劣性 1 線性性 即它是否是另一隨機(jī)變量的線性函數(shù) 2 無(wú)偏性 即它的均值或期望值是否等于總體的真實(shí)值 3 有效性 即它是否在所有線性無(wú)偏估計(jì)量中具有最小方差 這三個(gè)準(zhǔn)則也稱作估計(jì)量的小樣本性質(zhì) 擁有這類性質(zhì)的估計(jì)量稱為最佳線性無(wú)偏估計(jì)量 bestlinerunbiasedestimator BLUE 4 漸近無(wú)偏性 即樣本容量趨于無(wú)窮大時(shí) 是否它的均值序列趨于總體真值 5 一致性 即樣本容量趨于無(wú)窮大時(shí) 它是否依概率收斂于總體的真值 6 漸近有效性 即樣本容量趨于無(wú)窮大時(shí) 是否它在所有的一致估計(jì)量中具有最小的漸近方差 當(dāng)不滿足小樣本性質(zhì)時(shí) 需進(jìn)一步考察估計(jì)量的大樣本或漸近性質(zhì) 高斯 馬爾可夫定理 Gauss Markovtheorem 在給定經(jīng)典線性回歸的假定下 最小二乘估計(jì)量是具有最小方差的線性無(wú)偏估計(jì)量 證 易知 故 同樣地 容易得出 2 證明最小方差性 其中 ci ki di di為不全為零的常數(shù)則容易證明 普通最小二乘估計(jì)量 ordinaryleastSquaresEstimators 稱為最佳線性無(wú)偏估計(jì)量 bestlinearunbiasedestimator BLUE 由于最小二乘估計(jì)量擁有一個(gè) 好 的估計(jì)量所應(yīng)具備的小樣本特性 它自然也擁有大樣本特性 五 參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì) 2 隨機(jī)誤差項(xiàng) 的方差 2的估計(jì) 2又稱為總體方差 由于隨機(jī)項(xiàng) i不可觀測(cè) 只能從 i的估計(jì) 殘差ei出發(fā) 對(duì)總體方差進(jìn)行估計(jì) 可以證明 2的最小二乘估計(jì)量為 它是關(guān)于 2的無(wú)偏估計(jì)量 在最大或然估計(jì)法中 因此 2的最大或然估計(jì)量不具無(wú)偏性 但卻具有一致性 2 3一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn) 一 擬合優(yōu)度檢驗(yàn)二 變量的顯著性檢驗(yàn)三 參數(shù)的置信區(qū)間 說(shuō)明 回歸分析是要通過樣本所估計(jì)的參數(shù)來(lái)代替總體的真實(shí)參數(shù) 或者說(shuō)是用樣本回歸線代替總體回歸線 盡管從統(tǒng)計(jì)性質(zhì)上已知 如果有足夠多的重復(fù)抽樣 參數(shù)的估計(jì)值的期望 均值 就等于其總體的參數(shù)真值 但在一次抽樣中 估計(jì)值不一定就等于該真值 那么 在一次抽樣中 參數(shù)的估計(jì)值與真值的差異有多大 是否顯著 這就需要進(jìn)一步進(jìn)行統(tǒng)計(jì)檢驗(yàn) 主要包括擬合優(yōu)度檢驗(yàn) 變量的顯著性檢驗(yàn)及參數(shù)的區(qū)間估計(jì) 一 擬合優(yōu)度檢驗(yàn) 擬合優(yōu)度檢驗(yàn) 對(duì)樣本回歸直線與樣本觀測(cè)值之間擬合程度的檢驗(yàn) 度量擬合優(yōu)度的指標(biāo) 判定系數(shù) 可決系數(shù) R2 問題 采用普通最小二乘估計(jì)方法 已經(jīng)保證了模型最好地?cái)M合了樣本觀測(cè)值 為什么還要檢驗(yàn)擬合程度 1 總離差平方和的分解 已知由一組樣本觀測(cè)值 Xi Yi i 1 2 n得到如下樣本回歸直線 如果Yi i即實(shí)際觀測(cè)值落在樣本回歸 線 上 則擬合最好 可認(rèn)為 離差 全部來(lái)自回歸線 而與 殘差 無(wú)關(guān) 對(duì)于所有樣本點(diǎn) 則需考慮這些點(diǎn)與樣本均值離差的平方和 可以證明 TSS ESS RSS 記 總體平方和 TotalSumofSquares 回歸平方和 ExplainedSumofSquares 殘差平方和 ResidualSumofSquares Y的觀測(cè)值圍繞其均值的總離差 totalvariation 可分解為兩部分 一部分來(lái)自回歸線 ESS 另一部分則來(lái)自隨機(jī)勢(shì)力 RSS 在給定樣本中 TSS不變 如果實(shí)際觀測(cè)點(diǎn)離樣本回歸線越近 則ESS在TSS中占的比重越大 因此擬合優(yōu)度 回歸平方和ESS 總離差TSS 2 可決系數(shù)R2統(tǒng)計(jì)量 稱R2為 樣本 可決系數(shù) 判定系數(shù) coefficientofdetermination 可決系數(shù)的取值范圍 0 1 R2越接近1 說(shuō)明實(shí)際觀測(cè)點(diǎn)離樣本線越近 擬合優(yōu)度越高 在例2 1 1的收入 消費(fèi)支出例中 注 可決系數(shù)是一個(gè)非負(fù)的統(tǒng)計(jì)量 它也是隨著抽樣的不同而不同 為此 對(duì)可決系數(shù)的統(tǒng)計(jì)可靠性也應(yīng)進(jìn)行檢驗(yàn) 這將在第3章中進(jìn)行 二 變量的顯著性檢驗(yàn) 回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響因素 在一元線性模型中 就是要判斷X是否對(duì)Y具有顯著的線性性影響 這就需要進(jìn)行變量的顯著性檢驗(yàn) 變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中的假設(shè)檢驗(yàn) 計(jì)量經(jīng)濟(jì)學(xué)中 主要是針對(duì)變量的參數(shù)真值是否為零來(lái)進(jìn)行顯著性檢驗(yàn)的 1 假設(shè)檢驗(yàn) 所謂假設(shè)檢驗(yàn) 就是事先對(duì)總體參數(shù)或總體分布形式作出一個(gè)假設(shè) 然后利用樣本信息來(lái)判斷原假設(shè)是否合理 即判斷樣本信息與原假設(shè)是否有顯著差異 從而決定是否接受或否定原假設(shè) 假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法先假定原假設(shè)正確 然后根據(jù)樣本信息 觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理 從而判斷是否接受原假設(shè) 判斷結(jié)果合理與否 是基于 小概率事件不易發(fā)生 這一原理的 2 變量的顯著性檢驗(yàn) 檢驗(yàn)步驟 1 對(duì)總體參數(shù)提出假設(shè)H0 1 0 H1 1 0 2 以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量 并由樣本計(jì)算其值 3 給定顯著性水平 查t分布表得臨界值t 2 n 2 4 比較 判斷若 t t 2 n 2 則拒絕H0 接受H1 若 t t 2 n 2 則拒絕H1 接受H0 對(duì)于一元線性回歸方程中的 0 可構(gòu)造t統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn) 在上述收入 消費(fèi)支出例中 首先計(jì)算 2的估計(jì)值 t統(tǒng)計(jì)量的計(jì)算結(jié)果分別為 給定顯著性水平 0 05 查t分布表得臨界值t0 05 2 8 2 306 t1 2 306 說(shuō)明家庭可支配收入在95 的置信度下顯著 即是消費(fèi)支出的主要解釋變量 t2 2 306 表明在95 的置信度下 無(wú)法拒絕截距項(xiàng)為零的假設(shè) 假設(shè)檢驗(yàn)可以通過一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值的范圍 如是否為零 但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多 近 三 參數(shù)的置信區(qū)間 要判斷樣本參數(shù)的估計(jì)值在多大程度上可以 近似 地替代總體參數(shù)的真值 往往需要通過構(gòu)造一個(gè)以樣本參數(shù)的估計(jì)值為中心的 區(qū)間 來(lái)考察它以多大的可能性 概率 包含著真實(shí)的參數(shù)值 這種方法就是參數(shù)檢驗(yàn)的置信區(qū)間估計(jì) 如果存在這樣一個(gè)區(qū)間 稱之為置信區(qū)間 confidenceinterval 1 稱為置信系數(shù) 置信度 confidencecoefficient 稱為顯著性水平 levelofsignificance 置信區(qū)間的端點(diǎn)稱為置信限 confidencelimit 或臨界值 criticalvalues 一元線性模型中 i i 1 2 的置信區(qū)間 在變量的顯著性檢驗(yàn)中已經(jīng)知道 意味著 如果給定置信度 1 從分布表中查得自由度為 n 2 的臨界值 那么t值處在 t 2 t 2 的概率是 1 表示為 即 于是得到 1 的置信度下 i的置信區(qū)間是 在上述收入 消費(fèi)支出例中 如果給定 0 01 查表得 由于 于是 1 0的置信區(qū)間分別為 0 6345 0 9195 433 32 226 98 由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的 接近 程度 因此置信區(qū)間越小越好 要縮小置信區(qū)間 需要 1 增大樣本容量n 因?yàn)樵谕瑯拥闹眯潘较?n越大 t分布表中的臨界值越小 同時(shí) 增大樣本容量 還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減小 2 提高模型的擬合優(yōu)度 因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比 模型擬合優(yōu)度越高 殘差平方和應(yīng)越小 由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的 接近 程度 因此置信區(qū)間越小越好 要縮小置信區(qū)間 需 1 增大樣本容量n 因?yàn)樵谕瑯拥闹眯潘较?n越大 t分布表中的臨界值越小 同時(shí) 增大樣本容量 還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減小 2 提高模型的擬合優(yōu)度 因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比 模型擬合優(yōu)度越高 殘差平方和應(yīng)越小 2 4一元線性回歸分析的應(yīng)用 預(yù)測(cè)問題 一 0是條件均值E Y X X0 或個(gè)值Y0的一個(gè)無(wú)偏估計(jì)二 總體條件均值與個(gè)值預(yù)測(cè)值的置信區(qū)間 對(duì)于一元線性回歸模型 給定樣本以外的解釋變量的觀測(cè)值X0 可以得到被解釋變量的預(yù)測(cè)值 0 可以此作為其條件均值E Y X X0 或個(gè)別值Y0的一個(gè)近似估計(jì) 嚴(yán)格地說(shuō) 這只是被解釋變量的預(yù)測(cè)值的估計(jì)值 而不是預(yù)測(cè)值 原因 1 參數(shù)估計(jì)量不確定 2 隨機(jī)項(xiàng)的影響 說(shuō)明 一 0是條件均值E Y X X0 或個(gè)值Y0的一個(gè)無(wú)偏估計(jì) 對(duì)總體回歸函數(shù)E Y X X0 0 1X X X0時(shí)E Y X X0 0 1X0 于是 可見 0是條件均值E Y X X0 的無(wú)偏估計(jì) 對(duì)總體回歸模型Y 0 1X 當(dāng)X X0時(shí) 于是 二 總體條件均值與個(gè)值預(yù)測(cè)值的置信區(qū)間 1 總體均值預(yù)測(cè)值的置信區(qū)間 由于 于是 可以證明 因此 故 于是 在1 的置信度下 總體均值E Y X0 的置信區(qū)間為 其中 2 總體個(gè)值預(yù)測(cè)值的預(yù)測(cè)區(qū)間 由Y0 0 1X0 知 于是 式中 從而在1 的置信度下 Y0的置信區(qū)間為 在上述收入 消費(fèi)支出例中 得到的樣本回歸函數(shù)為 則在X0 1000處 0 103 172 0 777 1000 673 84 而 因此 總體均值E Y X 1000 的95 的置信區(qū)間為 673 84 2 306 61 05 E Y X 1000 673 84 2 306 61 05或 533 05 814 62 同樣地 對(duì)于Y在X 1000的個(gè)體值 其95 的置信區(qū)間為 673 84 2 306 61 05 Yx 1000 673 84 2 306 61 05或 372 03 975 65 總體回歸函數(shù)的置信帶 域 confidenceband 個(gè)體的置信帶 域 對(duì)于Y的總體均值E Y X 與個(gè)體值的預(yù)測(cè)區(qū)間 置信區(qū)間 1 樣本容量n越大 預(yù)測(cè)精度越高 反之預(yù)測(cè)精度越低 2 樣本容量一定時(shí) 置信帶的寬度當(dāng)在X均值處最小 其附近進(jìn)行預(yù)測(cè) 插值預(yù)測(cè) 精度越大 X越遠(yuǎn)離其均值 置信帶越寬 預(yù)測(cè)可信度下降 2 5實(shí)例 時(shí)間序列問題 一 中國(guó)居民人均消費(fèi)模型二 時(shí)間序列問題 一 中國(guó)居民人均消費(fèi)模型 例2 5 1考察中國(guó)居民

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論