人教版選修1-2§1.1.1對回歸模型的統(tǒng)計._第1頁
人教版選修1-2§1.1.1對回歸模型的統(tǒng)計._第2頁
免費預(yù)覽已結(jié)束,剩余6頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、人教版選修1 2 1-1.2對回歸模型的統(tǒng)計檢驗假設(shè)身高和隨機(jī)誤差的不同不會對體重產(chǎn)生任何彩響,那么所有人的體重 將相同.在體重不受任何變量形響的假設(shè)下,設(shè) 8 名女大學(xué)生的體重都是她們 的平均值,即 8 個人的體重都為54.5kg編號12345678身高/cm165165157170175165155170體重/kg54.554.554.554.554.554.554.554.5在散點圖中,所有的點應(yīng)該落在同一條 水平直線上,但是觀測到的數(shù)據(jù)并非如 此。這就意味著預(yù)報變址血重值 受解析變量(身高)或隨機(jī)誤差的影響。思考P5:如何刻畫預(yù)報變量(體重)的變化?這個變化在多大程度上 與解析變量(身

2、高)有關(guān)?在多大程度上與隨機(jī)誤差有關(guān)?編號12345678身高/cm165165157170175165155170體重/kg4857505464614359例如,編號為 6 的女大學(xué)生的體重并沒有落在水平直線上,她的體重為 61kg. 解析變量(身高)和隨機(jī)誤差共同把這名學(xué)生的體重從 545kg“推”到了 61kg, 相差 6. 5kg,所以6.5kg 是解析變量和隨機(jī)誤差的組合效應(yīng)。編號為 3 的女大學(xué)生的體重并也沒有落在水平直線上,她的體重為 50kgo 解析 變量(身高)和隨機(jī)誤差共同把這名學(xué)生的體重從 50kg推”到了 54.5kg,相差-4.5kg, 這時解析變量和隨機(jī)誤差的組合效

3、應(yīng)為 4.5 畑。用這種方法可以對所有預(yù)報變量計算組合效應(yīng).數(shù)學(xué)上,把每個效應(yīng)(觀測值減去總的平均值)的平方加起來,即用n藝(y-5)2 表示總的效應(yīng),稱為總偏差平方和。 在例1中,總偏差平方和為354。編號12345678身高/cm165165157170175165155170體巫/kg4857505464614359那么,在這個總的效應(yīng)(總偏差平方和)中,有多少來自于解析變量 (身高)?有多少來自于隨機(jī)誤差?假設(shè)隨機(jī)誤差對體重沒有影響,也就是說,體重僅受身高的影響,那么散點圖 中所有的點將完全落在回歸直線上。但是,在圖中,數(shù)據(jù)點并沒有完全落在回歸 直線上。這些點散布在回歸直線附近,所以一

4、定是隨機(jī)誤差把這些點從回歸 直線上“推”開了。因此,數(shù)據(jù)點和它在回歸直線上相應(yīng)位置的差異(必-兀)是隨機(jī)誤差的效應(yīng), 稱2=乩_0 為殘差。例如,編號為 6 的女大學(xué)生,計算隨機(jī)誤差的效應(yīng)(殘差)為:61-(0.849 x!65-85.712) = 6.627對每名來大學(xué)生計算這個差異,然后分別將所得的值平方后加起來,用數(shù)學(xué)符號表示為:X(y, -y,-)2稱為殘差平方和,它代表了隨機(jī)誤差的效應(yīng)。1=1在例 1 中,殘差平方和約為 128.361。由于解析變量和隨機(jī)誤差的總效應(yīng) (總偏差平方和) 為354,而隨機(jī)誤差的 效應(yīng)為128. 361,所以解析變量的效應(yīng)為354-128.361=225

5、.639這個値琳為回歸平方和。解析變量和隨機(jī)誤差的總效應(yīng)(總偏差平方和)二解析變量的效應(yīng)(回歸平方和)+隨機(jī)誤差的效應(yīng)(殘差平方和)我們可以用艸關(guān)指啓皿來刻畫回歸的效果, 其計算公式是 心 二殘差平方和。_齊總偏差平方和總偏差平方和-殘差平方和_回歸平方和總偏差平方和一總偏差平方和離差平方和的分解(三個平方和的意汶)1.總偏差平方和(SST)-反映因變量的力個觀察值與其均值的總離差2.回歸平方和(SS7?)-反映自變量 x 的變化對因變量 y 取值變化 的影踰,或爭說,是由于 x 與 y 之間的線 性關(guān)系引起的 y的取值變化,也稱為可解釋 的平方和3殘差平方和(SSE)-反映除 x 以外的其他

6、因素對 y取值的影響, 也稱為不可解釋的平方和或剩余平方和1=1F二-已-X(y,-y)2樣本決定系數(shù)(判定系數(shù)疋)1.回歸平方和占總離差平方和的比例“aNa尸2 =z 反=_ = 2_2.反映回歸直攻的擬合程度3.取值范圍在0,1之間4.說明回歸方程擬合的越好;“TO,說明回歸方程擬合的越差5判定系數(shù)等于相關(guān)系數(shù)的平方,即*=Cr)2我們可以用相關(guān)指數(shù) R2來刻畫回歸的效果,其計算公式是疋=1 一召 37=1_殘壟平歹和。乞(y _ $)2總備差平萬和顯然,R2 的值越大,說明殘差平方和越小,也就是說模型擬合效果越好.在線性回歸模型中,*表示解析變童對預(yù)報變童變化的貢獻(xiàn)率R2 越接近 1,表

7、示回歸的效果越好(因為 R2 越接近 1,表示解析變量和 預(yù)報變量的線性相關(guān)性越強(qiáng))如果某組數(shù)據(jù)可能采取幾種不同回歸方程進(jìn)行回歸分析,則 可以通過比較R2的值來做出選擇,即選取 R2 較大的模型作為這組 數(shù)據(jù)的模型.總的來說:相關(guān)指數(shù)H是度量模型擬合效果的一種指標(biāo)。在線性模型中,它代表自變量刻畫預(yù)報變量的能力。我們可以用相關(guān)指數(shù)皿來刻畫回歸的效果,其計算公式是Ha r川i召_叩=1殘差平方和v(y._亍)2總偏差平方和f=l表3來源平方和比例解釋變量225.6390.64隨機(jī)誤差128.3610.36總計3541從表3-1中可以看出,解析變量對總效應(yīng)約貢獻(xiàn)了64%,即R2 =0.64,可以敘述

8、為:“身高解析了64%的體重變化”,而隨機(jī)誤差貢獻(xiàn)了剩余的36%。 所以,身高對體重的效應(yīng) 比隨機(jī)誤差的效應(yīng)大得多。殘差分析與殘差圖的定義:在研究兩個變量間的關(guān)系時,首先要根據(jù)散點圖來粗略 判斷它們是否線性相關(guān),是否可以用回歸模型來擬合數(shù)據(jù)。然后,我們可以通過殘差&,:,2“來判斷模型擬合的效果,判斷原始 數(shù)據(jù)中是否存在可疑數(shù)據(jù),這方面的分析工作稱為殘差分析。表“4列出了女大學(xué)生身高和體重的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)據(jù)。編號12345678身離/cm165165157170175165155170體重/kg4857505464614359殘差-6.3732.6272.419-4.6181

9、.1376.627-2.8830.382我們可以利用圖形來分析殘差特性,作圖時縱坐標(biāo)為殘差, 橫坐標(biāo)可以選為樣本編號,或身高數(shù)據(jù),或體重估計值等,這樣 作出的圖形稱為殘差圖。幾點說明:第一個樣本點和第6個樣本點的殘差比較大,需要確認(rèn)在 釆集過程中是否有人為的錯誤。如果數(shù)據(jù)采集有錯誤,就予以糾 正,然后再重新利用線性回歸模型擬合數(shù)據(jù);如果數(shù)據(jù)釆集沒有 錯誤,則需要尋找其他的原因。另外,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選 用的模型計較合適,這樣的帶狀區(qū)域的寬度越窄,說明模型擬合 精度越高,回歸方程的預(yù)叛赭度越高。1、回歸方程只適用于我們所研究的樣本的總體;2、我們所建立的回歸方程一般都有

10、時間性;3、樣本采集的范圍會影響回歸方程的適用范圍;4、不能期望回歸方程得到的預(yù)報值就是預(yù)報變量的精確值。事實上,它是預(yù)報變量的可能取值的平均值。涉及到統(tǒng)計的一些思想:模型適用的總體;模型的時間性;樣本的取值范圍對模型的影響; 模型預(yù)報結(jié)果的正確理解。用身這些問題也使用于其他問題棋型問3.一般地,建立回歸模型的基本步驟為:(1)確定研究對象,明確哪個變量是解析變量, 哪個變量是預(yù)報變量。(2)畫出確定好的解析變量和預(yù)報變量的散點圖,觀察 它們之間的關(guān)系(如是否存在線性關(guān)系等)。(3)由經(jīng)驗確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線 性關(guān)系,則選用線性回歸方程:y=bx+a )(4)按一定規(guī)則估計回歸方程中的參數(shù)(如最小二乘法)(5)得出結(jié)果后分析殘差圖是否有異常(個別數(shù)據(jù)對應(yīng)殘 差過大,或殘差呈現(xiàn)不隨機(jī)的規(guī)律性,等等),過存在異常,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論