




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、2、3、2線性回歸方程講義編寫者:數(shù)學(xué)教師孟凡洲某小賣部為了了解熱茶銷售量與氣溫之間的關(guān)系,隨機(jī)統(tǒng)計(jì)并制作了某6天賣出熱茶的杯數(shù)與當(dāng)天氣溫的對照表:氣溫/261813104-1杯數(shù)202434385064 如果某天的氣溫是-5 ,你能根據(jù)這些數(shù)據(jù)預(yù)測這天小賣部賣出熱茶的杯數(shù)嗎?為解決這個(gè)問題我們接著學(xué)習(xí)兩個(gè)變量的線性相關(guān)回歸直線及其方程.一、【學(xué)習(xí)目標(biāo)】1、理解相關(guān)關(guān)系,能判斷兩個(gè)變量之間是否是相關(guān)關(guān)系;2、會(huì)求線性回歸方程,理解其真正含義(估計(jì)).【教學(xué)效果】:教學(xué)目標(biāo)的給出有利于學(xué)生整體把握課堂.二、【自學(xué)內(nèi)容和要求及自學(xué)過程】閱讀教材8689頁內(nèi)容,回答問題(回歸直線方程)<1&g
2、t;請你說出作散點(diǎn)圖的步驟和方法.<2>請你說出正、負(fù)相關(guān)的概念.<3>什么是線性相關(guān)?<4>看人體的脂肪百分比和年齡的散點(diǎn)圖,當(dāng)人的年齡增加時(shí),體內(nèi)脂肪含量到底是以什么方式增加的呢?<5>什么叫做回歸直線?<6>如何求回歸直線的方程?什么是最小二乘法?它有什么樣的思想?結(jié)論:<1>建立相應(yīng)的平面直角坐標(biāo)系,將各數(shù)據(jù)在平面直角坐標(biāo)中的對應(yīng)點(diǎn)畫出來,得到表示兩個(gè)變量的一組數(shù)據(jù)的圖形,這樣的圖形叫做散點(diǎn)圖.(a.如果所有的樣本點(diǎn)都落在某一函數(shù)曲線上,就用該函數(shù)來描述變量之間的關(guān)系,即變量之間具有函數(shù)關(guān)系b.如果所有的樣本點(diǎn)都落
3、在某一函數(shù)曲線附近,變量之間就有相關(guān)關(guān)系.c.如果所有的樣本點(diǎn)都落在某一直線附近,變量之間就有線性相關(guān)關(guān)系)<2>如果散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),稱為正相關(guān).如果散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),稱為負(fù)相關(guān).<3>如果所有的樣本點(diǎn)都落在某一直線附近,變量之間就有線性相關(guān)的關(guān)系.<4>大體上來看,隨著年齡的增加,人體中脂肪的百分比也在增加,呈正相關(guān)的趨勢,我們可以從散點(diǎn)圖上來進(jìn)一步分析.<5>如下圖;從散點(diǎn)圖上可以看出,這些點(diǎn)大致分布在通過散點(diǎn)圖中心的一條直線附近.如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在一條直線附近,我們就稱
4、這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線(regression line).如果能夠求出這條回歸直線的方程(簡稱回歸方程),那么我們就可以比較清楚地了解年齡與體內(nèi)脂肪含量的相關(guān)性.就像平均數(shù)可以作為一個(gè)變量的數(shù)據(jù)的代表一樣,這條直線可以作為兩個(gè)變量具有線性相關(guān)關(guān)系的代表.<6>從散點(diǎn)圖上可以發(fā)現(xiàn),人體的脂肪百分比和年齡的散點(diǎn)圖,大致分布在通過散點(diǎn)圖中心的一條直線. 那么,我們應(yīng)當(dāng)如何具體求出這個(gè)回歸方程呢? 有的同學(xué)可能會(huì)想,我可以采用測量的方法,先畫出一條直線,測量出各點(diǎn)與它的距離,然后移動(dòng)直線,到達(dá)一個(gè)使距離的和最小的位置,測量出此時(shí)的斜率和截距,就可得到回歸方程了
5、.但是,這樣做可靠嗎? 有的同學(xué)可能還會(huì)想,在圖中選擇這樣的兩點(diǎn)畫直線,使得直線兩側(cè)的點(diǎn)的個(gè)數(shù)基本相同.同樣地,這樣做能保證各點(diǎn)與此直線在整體上是最接近的嗎? 還有的同學(xué)會(huì)想,在散點(diǎn)圖中多取幾組點(diǎn),確定出幾條直線的方程,再分別求出各條直線的斜率、截距的平均數(shù),將這兩個(gè)平均數(shù)當(dāng)成回歸方程的斜率和截距. 同學(xué)們不妨去實(shí)踐一下,看看這些方法是不是真的可行?(學(xué)生討論:1.選擇能反映直線變化的兩個(gè)點(diǎn).2.在圖中放上一根細(xì)繩,使得上面和下面點(diǎn)的個(gè)數(shù)相同或基本相同.3.多取幾組點(diǎn)對,確定幾條直線方程.再分別算出各個(gè)直線方程斜率、截距的算術(shù)平均值,作為所求直線的斜率、截距.)教師:分別分析各方法的可靠性.如
6、下圖: 上面這些方法雖然有一定的道理,但總讓人感到可靠性不強(qiáng). 實(shí)際上,求回歸方程的關(guān)鍵是如何用數(shù)學(xué)的方法來刻畫“從整體上看,各點(diǎn)與此直線的距離最小”.人們經(jīng)過長期的實(shí)踐與研究,已經(jīng)得出了計(jì)算回歸方程的斜率與截距的一般公式其中,b是回歸方程的斜率,a是截距.推導(dǎo)公式的計(jì)算比較復(fù)雜,這里不作推導(dǎo).但是,我們可以解釋一下得出它的原理.假設(shè)我們已經(jīng)得到兩個(gè)具有線性相關(guān)關(guān)系的變量(x1,y1),(x2,y2),(xn,yn),且所求回歸方程是=bx+a,其中a、b是待定參數(shù).當(dāng)變量x取xi(i=1,2,n)時(shí)可以得到=bxi+a(i=1,2,n),它與實(shí)際收集到的yi之間的偏差是yi-=yi-(bxi
7、+a)(i=1,2,n).這樣,用這n個(gè)偏差的和來刻畫“各點(diǎn)與此直線的整體偏差”是比較合適的.由于(yi-)可正可負(fù),為了避免相互抵消,可以考慮用來代替,但由于它含有絕對值,運(yùn)算不太方便,所以改用Q=(y1-bx1-a)2+(y2-bx2-a)2+(yn-bxn-a)2 來刻畫n個(gè)點(diǎn)與回歸直線在整體上的偏差.這樣,問題就歸結(jié)為:當(dāng)a,b取什么值時(shí)Q最小,即總體偏差最小.經(jīng)過數(shù)學(xué)上求最小值的運(yùn)算,a,b的值由公式給出.通過求 式的最小值而得出回歸直線的方法,即求回歸直線,使得樣本數(shù)據(jù)的點(diǎn)到它的距離的平方和最小,這一方法叫做最小二乘法(method of least square).【教學(xué)效果】:
8、理解線性回歸的真正內(nèi)涵.三、【綜合練習(xí)與思考探索】例1 有一個(gè)同學(xué)家開了一個(gè)小賣部,他為了研究氣溫對熱飲銷售的影響,經(jīng)過統(tǒng)計(jì),得到一個(gè)賣出的熱飲杯數(shù)與當(dāng)天氣溫的對比表:溫度/-504712151923273136熱飲杯數(shù)15615013212813011610489937654(1)畫出散點(diǎn)圖;(2)從散點(diǎn)圖中發(fā)現(xiàn)氣溫與熱飲銷售杯數(shù)之間關(guān)系的一般規(guī)律;(3)求回歸方程;(4)如果某天的氣溫是2 ,預(yù)測這天賣出的熱飲杯數(shù).結(jié)論:(1)散點(diǎn)圖如下圖所示:(2)從上圖看到,各點(diǎn)散布在從左上角到右下角的區(qū)域里,因此,氣溫與熱飲銷售杯數(shù)之間呈負(fù)相關(guān),即氣溫越高,賣出去的熱飲杯數(shù)越少.(3)從散點(diǎn)圖可以看
9、出,這些點(diǎn)大致分布在一條直線的附近,因此,可用公式求出回歸方程的系數(shù).利用計(jì)算器容易求得回歸方程=-2.352x+147.767.(4)當(dāng)x=2時(shí),=143.063.因此,某天的氣溫為2 時(shí),這天大約可以賣出143杯熱飲. 思考:氣溫為2 時(shí),小賣部一定能夠賣出143杯左右熱飲嗎?為什么? 這里的答案是小賣部不一定能夠賣出143杯左右熱飲,原因如下:1.線性回歸方程中的截距和斜率都是通過樣本估計(jì)出來的,存在隨機(jī)誤差,這種誤差可以導(dǎo)致預(yù)測結(jié)果的偏差.2.即使截距和斜率的估計(jì)沒有誤差,也不可能百分之百地保證對應(yīng)于x的預(yù)報(bào)值,能夠與實(shí)際值y很接近.我們不能保證點(diǎn)(x,y)落在回歸直線上,甚至不能百分
10、之百地保證它落在回歸直線的附近,事實(shí)上,y=bx+a+e=+e. 這里e是隨機(jī)變量,預(yù)報(bào)值與實(shí)際值y的接近程度由隨機(jī)變量e的標(biāo)準(zhǔn)差所決定. 一些學(xué)生可能會(huì)提出問題:既然不一定能夠賣出143杯左右熱飲,那么為什么我們還以“這天大約可以賣出143杯熱飲”作為結(jié)論呢?這是因?yàn)檫@個(gè)結(jié)論出現(xiàn)的可能性最大.具體地說,假如我們規(guī)定可以選擇連續(xù)的3個(gè)非負(fù)整數(shù)作為可能的預(yù)測結(jié)果,則我們選擇142,143和144能夠保證預(yù)測成功(即實(shí)際賣出的杯數(shù)是這3個(gè)數(shù)之一)的概率最大.例2 下表為某地近幾年機(jī)動(dòng)車輛數(shù)與交通事故數(shù)的統(tǒng)計(jì)資料.機(jī)動(dòng)車輛數(shù)x千臺(tái)95110112120129135150180交通事故數(shù)y千件6.27
11、.57.78.58.79.810.213(1)請判斷機(jī)動(dòng)車輛數(shù)與交通事故數(shù)之間是否有線性相關(guān)關(guān)系,如果不具有線性相關(guān)關(guān)系,說明理由;(2)如果具有線性相關(guān)關(guān)系,求出線性回歸方程.結(jié)論:(1)在直角坐標(biāo)系中畫出數(shù)據(jù)的散點(diǎn)圖,如下圖.直觀判斷散點(diǎn)在一條直線附近,故具有線性相關(guān)關(guān)系(2)計(jì)算相應(yīng)的數(shù)據(jù)之和:=1 031,=71.6, =137 835,=9 611.7.將它們代入公式計(jì)算得b0.077 4,a=-1.024 1,所以,所求線性回歸方程為=0.077 4x-1.024 1.【教學(xué)效果】:通過練習(xí)鞏固新知.四、【作業(yè)】1、必做題:習(xí)題2.3A組3、4,B組1、2;2、選做題:完成課后練習(xí)
12、.五、【小結(jié)】 本節(jié)課主要學(xué)習(xí)了兩個(gè)內(nèi)容1o求線性回歸方程的步驟:(1)計(jì)算平均數(shù); (2)計(jì)算xi與yi的積,求xiyi; (3)計(jì)算xi2,yi2,(4)將上述有關(guān)結(jié)果代入公式求b,a,寫出回歸直線方程2o經(jīng)歷用不同估算方法描述兩個(gè)變量線性相關(guān)的過程.知道最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程.六、【教學(xué)反思】 因材施教說起來很容易,事實(shí)上很難.教師要認(rèn)識(shí)自己的學(xué)生,真正的認(rèn)識(shí)自己的學(xué)生,才能使你的學(xué)生進(jìn)步.七、【課后練習(xí)】1、下列兩個(gè)變量之間的關(guān)系哪個(gè)不是函數(shù)關(guān)系( )A.角度和它的余弦值 B.正方形邊長和面積C.正邊形的邊數(shù)和它的內(nèi)角和 D.人的年齡和身高答
13、案:2、三點(diǎn)(3,10),(7,20),(11,24)的線性回歸方程是( )A. B.=1.75+5.75x C. D.=5.75+1.75x答案:3、已知關(guān)于某設(shè)備的使用年限x與所支出的維修費(fèi)用y(萬元),有如下統(tǒng)計(jì)資料:使用年限x23456維修費(fèi)用y2238556570 設(shè)y對x呈線性相關(guān)關(guān)系試求:(1)線性回歸方程=bx+a的回歸系數(shù)a,b;(2)估計(jì)使用年限為10年時(shí),維修費(fèi)用是多少?答案:(1)b=1.23,a=0.08;(2)12.38.4、我們考慮兩個(gè)表示變量x與y之間的關(guān)系的模型,為誤差項(xiàng),模型如下:模型1:y=6+4x;模型2:y=6+4x+e(1)如果x=3,e=1,分別求
14、兩個(gè)模型中y的值;(2)分別說明以上兩個(gè)模型是確定性模型還是隨機(jī)模型解:(1)模型1:y=6+4x=6+4×3=18;模型2:y=6+4x+e=6+4×3+1=19.(2)模型1中相同的x值一定得到相同的y值,所以是確定性模型;模型2中相同的x值,因的不同,所得y值不一定相同,且為誤差項(xiàng)是隨機(jī)的,所以模型2是隨機(jī)性模型5、以下是收集到的新房屋銷售價(jià)格y與房屋大小x的數(shù)據(jù):房屋大小x(m2)80105110115135銷售價(jià)格y(萬元)18.42221.624.829.2(1)畫出數(shù)據(jù)的散點(diǎn)圖;(2)用最小二乘法估計(jì)求線性回歸方程.解:(1)散點(diǎn)圖如下圖.(2)n=5,=54
15、5,=109,=116,=23.2,=60 952,=12 952,b=0.199,a=23.2-0.199×1091.509,所以,線性回歸方程為y=0.199x+1.5096、下列關(guān)系中,是帶有隨機(jī)性相關(guān)關(guān)系的是 正方形的邊長面積之間的關(guān)系;水稻產(chǎn)量與施肥量之間的關(guān)系人的身高與年齡之間的關(guān)系降雪量與交通事故的發(fā)生率之間的關(guān)系.答案:兩變量之間的關(guān)系有兩種:函數(shù)關(guān)系與帶有機(jī)性的相關(guān)關(guān)系.正方形的邊長與面積之間的關(guān)系是函數(shù)關(guān)系.水稻產(chǎn)量與施肥量之間的關(guān)系不是嚴(yán)格的函數(shù)關(guān)系,但是具有相關(guān)性,因而是相關(guān)關(guān)系.人的身高與年齡之間的關(guān)系既不是函數(shù)關(guān)系,也不是相關(guān)關(guān)系,因?yàn)槿说哪挲g達(dá)到一定時(shí)期
16、身高就不發(fā)生明顯變化了,因而他們不具備相關(guān)關(guān)系.降雪量與交通事故的發(fā)生率之間具有相關(guān)關(guān)系,因此填、.7、現(xiàn)隨機(jī)抽取某校10名學(xué)生在入學(xué)考中的數(shù)學(xué)成績X與入學(xué)后的第一次數(shù)學(xué)考試成績Y,數(shù)據(jù)如下:學(xué)號(hào)12345678910X12010911710410311010410599108Y84648468696869465771問這10名同學(xué)的兩次數(shù)學(xué)考試成績是否具有相關(guān)關(guān)系?答案:應(yīng)用散點(diǎn)圖分析,(圖略)這10名同學(xué)的兩次數(shù)學(xué)考試成績具有相關(guān)關(guān)系.8、在下列各圖中,每個(gè)圖的兩個(gè)變量具有相關(guān)關(guān)系的圖是( ) A、(1)(2) B、(1)(3) C、(2)(4) D、(2)(3)9、線性回歸方程必過 A、(0,0)點(diǎn) B、(,0)點(diǎn) C、(0,)點(diǎn)心 D、()點(diǎn)10、設(shè)有一個(gè)直線回歸方程為y=21.5x, 則變量x增加一個(gè)單位時(shí)A、y平均增加1.5個(gè)單位于 B、y平均增加2個(gè)單位C、y平均減少1.5個(gè)單位 D、y平均減少2個(gè)單位10、下列變
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 貴州省黔東南、黔南、黔西南2025屆英語八年級(jí)第二學(xué)期期中綜合測試試題含答案
- 2025年銀發(fā)消費(fèi)市場:高品質(zhì)養(yǎng)老服務(wù)需求研究報(bào)告001
- 新能源汽車租賃服務(wù)在2025年新能源環(huán)衛(wèi)車市場的應(yīng)用前景報(bào)告
- 2025年農(nóng)業(yè)科技創(chuàng)新成果轉(zhuǎn)化機(jī)制報(bào)告:科技成果轉(zhuǎn)化機(jī)制創(chuàng)新與政策支持
- 商業(yè)銀行金融科技人才金融科技人才培養(yǎng)與人才培養(yǎng)評(píng)價(jià)研究報(bào)告
- 制造業(yè)綠色供應(yīng)鏈管理在綠色制造與綠色產(chǎn)業(yè)政策創(chuàng)新報(bào)告
- 2025年二手交易電商平臺(tái)信用評(píng)價(jià)體系與市場發(fā)展趨勢研究報(bào)告001
- 2025屆上海市長寧區(qū)八下英語期中統(tǒng)考模擬試題含答案
- 2025年醫(yī)院電子病歷系統(tǒng)在醫(yī)院信息化中的數(shù)據(jù)備份優(yōu)化報(bào)告
- 2025年養(yǎng)老金制度改革對金融市場投資機(jī)會(huì)與風(fēng)險(xiǎn)規(guī)避研究報(bào)告
- 2025版特種金屬礦山股權(quán)收購與轉(zhuǎn)讓合同2篇
- 曹楊二中數(shù)學(xué)試卷
- 農(nóng)業(yè)企業(yè)資產(chǎn)重組方案
- 幼兒園食堂舉一反三自查報(bào)告
- 患者發(fā)生窒息的應(yīng)急
- 《環(huán)氧樹脂生產(chǎn)工藝》課件
- 冶金員工安全培訓(xùn)
- 合理雅思學(xué)習(xí)計(jì)劃
- 腹股溝疝護(hù)理新進(jìn)展
- 機(jī)修工2025年上半年工作總結(jié)范文
- 食品標(biāo)準(zhǔn)操作規(guī)程
評(píng)論
0/150
提交評(píng)論