高考數(shù)學(xué)總復(fù)習(xí)專題系列——統(tǒng)計.板塊三.莖葉圖.學(xué)生版_第1頁
高考數(shù)學(xué)總復(fù)習(xí)專題系列——統(tǒng)計.板塊三.莖葉圖.學(xué)生版_第2頁
高考數(shù)學(xué)總復(fù)習(xí)專題系列——統(tǒng)計.板塊三.莖葉圖.學(xué)生版_第3頁
高考數(shù)學(xué)總復(fù)習(xí)專題系列——統(tǒng)計.板塊三.莖葉圖.學(xué)生版_第4頁
高考數(shù)學(xué)總復(fù)習(xí)專題系列——統(tǒng)計.板塊三.莖葉圖.學(xué)生版_第5頁
免費預(yù)覽已結(jié)束,剩余4頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、板塊三.莖葉圖mwie 知識內(nèi)容一.隨機(jī)抽樣1 .隨機(jī)抽樣:滿足每個個體被抽到的機(jī)會是均等的抽樣,共有三種經(jīng)常采用的隨機(jī)抽樣方法:簡單隨機(jī)抽樣:從元素個數(shù)為 N的總體中不放回地抽取容量為n的樣本,如果每一次抽取時總體中的各個個體有相同的可能性被抽到,這種抽樣方法叫做簡單隨機(jī)抽樣.抽出辦法:抽簽法:用紙片或小球分別標(biāo)號后抽簽的方法.隨機(jī)數(shù)表法:隨機(jī)數(shù)表是使用計算器或計算機(jī)的應(yīng)用程序生成隨機(jī)數(shù)的功能生成的一張數(shù)表.表中每一位置出現(xiàn)各個數(shù)字的可能性相同.隨機(jī)數(shù)表法是對樣本進(jìn)行編號后,按照一定的規(guī)律從隨機(jī)數(shù)表中讀數(shù),并取出相應(yīng)的樣本的 方法.簡單隨機(jī)抽樣是最簡單、最基本的抽樣方法.系統(tǒng)抽樣:將總體分成

2、均衡的若干部分,然后按照預(yù)先制定的規(guī)則,從每一部分抽取一個個體,得到所需要的樣本的抽樣方法.抽出辦法:從元素個數(shù)為 N的總體中抽取容量為 n的樣本,如果總體容量能被樣本容量整除,設(shè)k =N ,先對總體進(jìn)行編號,號碼從 1到N ,再從數(shù)字1到k中隨機(jī)抽取一個數(shù)s作為起始 n數(shù),然后順次抽取第s+k, s+2k,(|,s+(n -1)k個數(shù),這樣就得到容量為 n的樣本.如果總體容量不能被樣本容量整除,可隨機(jī)地從總體中剔除余數(shù),然后再按系統(tǒng)抽樣方法進(jìn)行抽樣.系統(tǒng)抽樣適用于大規(guī)模的抽樣調(diào)查,由于抽樣間隔相等,又被稱為等距抽樣.分層抽樣:當(dāng)總體有明顯差別的幾部分組成時,要反映總體情況,常采用分層抽樣,使

3、總 體中各個個體按某種特征分成若干個互不重疊的幾部分,每一部分叫做層,在各層中按層在 總體中所占比例進(jìn)行簡單隨機(jī)抽樣,這種抽樣方法叫做分層抽樣.分層抽樣的樣本具有較強(qiáng)的代表性,而且各層抽樣時,可靈活選用不同的抽樣方法,應(yīng) 用廣泛.2 .簡單隨機(jī)抽樣必須具備下列特點:簡單隨機(jī)抽樣要求被抽取的樣本的總體個數(shù)N是有限的.簡單隨機(jī)樣本數(shù)n小于等于樣本總體的個數(shù) N .簡單隨機(jī)樣本是從總體中逐個抽取的.簡單隨機(jī)抽樣是一種不放回的抽樣.簡單隨機(jī)抽樣的每個個體入樣的可能性均為-.N3 .系統(tǒng)抽樣時,當(dāng)總體個數(shù) N恰好是樣本容量n的整數(shù)倍時,取k=-;n若N不是整數(shù)時,先從總體中隨機(jī)地剔除幾個個體,使得總體中

4、剩余的個體數(shù)能被樣本容量nn整除.因為每個個體被剔除的機(jī)會相等,因而整個抽樣過程中每個個體被抽取的機(jī)會仍然相二.頻率直方圖列出樣本數(shù)據(jù)的頻率分布表和頻率分布直方圖的步驟:計算極差:找出數(shù)據(jù)的最大值與最小值,計算它們的差; 決定組距與組數(shù):取組距,用氤決定組數(shù);決定分點:決定起點,進(jìn)行分組;列頻率分布直方圖:對落入各小組的數(shù)據(jù)累計,算出各小數(shù)的頻數(shù),除以樣本容量,得到 各小組的頻率.頻率,、一繪制頻率分布直方圖:以數(shù)據(jù)的值為橫坐標(biāo),以的值為縱坐標(biāo)繪制直方圖, 知小長方形的面積=組距 X?空=頻率.組距頻率分布折線圖:將頻率分布直方圖各個長方形上邊的中點用線段連接起來,就得到頻率分布折線圖,一般把

5、折線圖畫成與橫軸相連,所以橫軸左右兩端點沒有實際意義.總體密度曲線:樣本容量不斷增大時,所分組數(shù)不斷增加,分組的組距不斷縮小,頻率分布直方圖可以用一條光滑曲線 y = f (x)來描繪,這條光滑曲線就叫做總體密度曲線.總體密度曲線精確地反映了一個總體在各個區(qū)域內(nèi)取值的規(guī)律.三.莖葉圖制作莖葉圖的步驟:將數(shù)據(jù)分為 莖”、葉”兩部分;將最大莖與最小莖之間的數(shù)字按大小順序排成一列,并畫上豎線作為分隔線;將各個數(shù)據(jù)的 葉”在分界線的一側(cè)對應(yīng)莖處同行列出.四.統(tǒng)計數(shù)據(jù)的數(shù)字特征用樣本平均數(shù)估計總體平均數(shù);用樣本標(biāo)準(zhǔn)差估計總體標(biāo)準(zhǔn)差.數(shù)據(jù)的離散程序可以用極差、方差或標(biāo)準(zhǔn)差來描述.極差又叫全距,是一組數(shù)據(jù)的

6、最大值和最小值之差,反映一組數(shù)據(jù)的變動幅度; 樣本方差描述了一組數(shù)據(jù)平均數(shù)波動的大小,樣本的標(biāo)準(zhǔn)差是方差的算術(shù)平方根.一般地,設(shè)樣本的元素為 Xi ,X2,|, Xn樣本的平均數(shù)為X ,定義樣本方差為s2 =(X1 X)2 (x X)2 HI (Xn 一為2 n樣本標(biāo)準(zhǔn)差 s = j(X-X)2±(X2-X)2±IH二(Xn-X)2簡化公式:s2 =(X12 +x; +|+x;) -nX2. n五.獨立性檢驗1 .兩個變量之間的關(guān)系;常見的有兩類:一類是確定性的函數(shù)關(guān)系;另一類是變量間存在關(guān)系,但又不具備函數(shù)關(guān)系 所要求的確定性,它們的關(guān)系是帶有一定隨機(jī)性的.當(dāng)一個變量取值

7、一定時,另一個變量的 取值帶有一定隨機(jī)性的兩個變量之間的關(guān)系叫做相關(guān)關(guān)系.2 .散點圖:將樣本中的 n個數(shù)據(jù)點(為,y)(i =1,2,|, n)描在平面直角坐標(biāo)系中,就得到了 散點圖.散點圖形象地反映了各個數(shù)據(jù)的密切程度,根據(jù)散點圖的分布趨勢可以直觀地判斷分析兩個 變量的關(guān)系.3 .如果當(dāng)一個變量的值變大時,另一個變量的值也在變大,則這種相關(guān)稱為正相關(guān);此時, 散點圖中的點在從左下角到右上角的區(qū)域.反之,一個變量的值變大時,另一個變量的值由大變小,這種相關(guān)稱為負(fù)相關(guān).此時,散點 圖中的點在從左上角到右下角的區(qū)域.散點圖可以判斷兩個變量之間有沒有相關(guān)關(guān)系.4 .統(tǒng)計假設(shè):如果事件A與B獨立,這

8、時應(yīng)該有 P(AB) =P(A)P(B),用字母H。表示此式,即Ho :P(AB) =P(A)P(B),稱之為統(tǒng)計假設(shè).5 .胃(讀作朱方”)統(tǒng)計量:統(tǒng)計學(xué)中有一個非常有用的統(tǒng)計量,它的表達(dá)式為z2 =0122二n四_,用它的大小可以用ni n2 .n in 2來決定是否拒絕原來的統(tǒng)計假設(shè) Ho ,如果好的值較大,就拒絕Ho ,即認(rèn)為A與B是有關(guān)的. 片統(tǒng)計量的兩個臨界值: 3.841、6.635;當(dāng) 片A3.841時,有95%的把握說事件 A與B有關(guān); 當(dāng)好下6.635時,有99%的把握說事件 A與B有關(guān);當(dāng) / < 3.841時,認(rèn)為事件 A與B是無 關(guān)的.獨立性檢驗的基本思想與反證

9、法類似,由結(jié)論不成立時推出有利于結(jié)論成立的小概率事件發(fā) 生,而小概率事件在一次試驗中通常是不會發(fā)生的,所以認(rèn)為結(jié)論在很大程度上是成立的.1 .獨立性檢驗的步驟:統(tǒng)計假設(shè):H。;列出2M2聯(lián)表;計算片統(tǒng)計量;查對臨界值表,作出判斷.2,幾個臨界值:P(片 > 2.706 )定0.10, P(72 > 3.841) 之0.05 , P(片 > 6.635)上0.01 .2 M2聯(lián)表的獨立性檢驗:如果對于某個群體有兩種狀態(tài),對于每種狀態(tài)又有兩個情況,這樣排成一張 2M2的表,如下:狀態(tài)B狀態(tài)B合計狀態(tài)A»1n12n1十狀態(tài)An21n22n2 +n書n卡n如果有調(diào)查得來的四

10、個數(shù)據(jù) nn , n12, n21,12,并希望根據(jù)這樣的4個數(shù)據(jù)來檢驗上述的兩種狀態(tài)A與B是否有關(guān),就稱之為 2父2聯(lián)表的獨立性檢驗.六.回歸分析1 .回歸分析:對于具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的方法叫做回歸分析,即回歸分析 就是尋找相關(guān)關(guān)系中這種非確定關(guān)系的某種確定性.回歸直線:如果散點圖中的各點都大致分布在一條直線附近,就稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.2 .最小二乘法:記回歸直線方程為:y? = a+bx,稱為變量Y對變量x的回歸直線方程,其中 a, b叫做回歸系 數(shù).?是為了區(qū)分Y的實際值y ,當(dāng)x取值x時,變量Y的相應(yīng)觀察值為y ,而直線上對應(yīng)于 為的

11、 縱坐標(biāo)是y? = a +bxi .設(shè)x,Y的一組觀察值為(為,y), i=1,2/ll,n,且回歸直線方程為y? = a+bx,當(dāng)x取值為時,Y的相應(yīng)觀察值為y-差yi y?(i =1,2,川,n)刻畫了實際觀察值 y與回歸直 線上相應(yīng)點的縱坐標(biāo)之間的偏離程度,稱這些值為離差.我們希望這n個離差構(gòu)成的總離差越小越好,這樣才能使所找的直線很貼近已知點. n記Q =£ (y -a -b%)2 ,回歸直線就是所有直線中Q取最小值的那條.i生這種使 離差平方和為最小”的方法,叫做最小二乘法.用最小二乘法求回歸系數(shù)a , b有如下的公式:n'、'何-nxy? = 1, a?=

12、ybX,其中a,b上方加 入”,表示是由觀察值按最小二乘法求得的回- 2 2、K - nx i 1 歸系數(shù).3 .線性回歸模型:將用于估計y值的線,f函數(shù)a+bx作為確定性函數(shù);y的實際值與估計值之間的誤差記為 名,稱之為隨機(jī)誤差;將 y=a+bx + s稱為線性回歸模型.產(chǎn)生隨機(jī)誤差的主要原因有:所用的確定性函數(shù)不恰當(dāng)即模型近似引起的誤差;忽略了某些因素的影響,通常這些影響都比較??; 由于測量工具等原因,存在觀測誤差.4 .線性回歸系數(shù)的最佳估計值:利用最小二乘法可以得到夕,的計算公式為 nn工(X -x)(yi -y) z Xiyi -nxy_ 1n _ 1 nb = i- n n

13、7;n1, ? =y bx ,其中 x=-£ x , y =-Z yi2-22n i in ij工(x -x) 工 x -n(x)-i 1i I由此得到的直線 ?=i?+bx就稱為回歸直線,此直線方程即為線性回歸方程.其中 ?,b分別 為a, b的估計值,今稱為回歸截距,b稱為回歸系數(shù),?稱為回歸值.5 .相關(guān)系數(shù): nn工(x -x)(yi -y)Z xiyi -nxyr : i1=ynnnn億(xi -x)2 W (yi -y)2d x2 -n(x)2)(Z y2 -n(y)2),i 1i 4:Y i 4i 46 .相關(guān)系數(shù)r的性質(zhì): |r性1;|r |越接近于1, x, y的線

14、性相關(guān)程度越強(qiáng);|r |越接近于0, x, y的線性相關(guān)程度越弱.可見,一條回歸直線有多大的預(yù)測功能,和變量間的相關(guān)系數(shù)密切相關(guān).7 .轉(zhuǎn)化思想:根據(jù)專業(yè)知識或散點圖,對某些特殊的非線性關(guān)系,選擇適當(dāng)?shù)淖兞看鷵Q,把非線性方程轉(zhuǎn) 化為線性回歸方程,從而確定未知參數(shù).8 . 一些備案回歸(regression) 一詞的來歷:回歸”這個詞英國統(tǒng)計學(xué)家 Francils Galton提出來的.1889年,他在研究祖先與后代的身高之間的關(guān)系時發(fā)現(xiàn),身材較高的父母,他們的孩子也較高, 但這些孩子的平均身高并沒有他們父母的平均身高高;身材較矮的父母,他們的孩子也較矮,但這些孩子的平均身高卻比他們父母的平均身

15、高高.Galton把這種后代的身高向中間值靠近的趨勢稱為回歸現(xiàn)象”.后來,人們把由一個變量的變化去推測另一個變量的變化的方法稱為回 歸分析.回歸系數(shù)的推導(dǎo)過程:Q =E (yi -a) -bK 2 =E y: -2aZ y +na2 -2bZ 匯 +2abZ x +b2E x2=na2 +2a(bZ xi -Z y) +b2Z x2 -2bZ xiyi +2 y2 ,2n把上式看成a的二次函數(shù),a2的系數(shù)n >0 , 因此當(dāng)a = -2(b' x yi)二yi -b、xi時取最小值.同理,把Q的展開式按b的降哥排列,看成 b的二次函數(shù),當(dāng)b =£ x y -aZ x時取

16、最小值.解得:bunxiyi -nxyi j乙(Xi x)( y y)2_2i -nx(x -X)其中y =卜yi n9.對相關(guān)系數(shù)提出統(tǒng)計假設(shè)X =1£ x是樣本平均數(shù) nr進(jìn)行相關(guān)性檢驗的步驟:H。:變量x, y不具有線性相關(guān)關(guān)系;如果以95%的把握作出推斷,那么可以根據(jù) 性檢驗的臨界值表中查出一個r的臨界值r0.05計算樣本相關(guān)系數(shù)r ;1 0.95 = 0.05與n 2(n是樣本容量)在相關(guān)(其中1 0.95=0.05稱為檢驗水平);作出統(tǒng)計推斷:若|)0.05,則否定He表明有95%的把握認(rèn)為變量y與x之間具有線性 相關(guān)關(guān)系;若|r性0.05 ,則沒有理由拒絕H。,即就目前

17、數(shù)據(jù)而言, 沒有充分理由認(rèn)為變量 y與 x之間具有線性相關(guān)關(guān)系.說明:對相關(guān)系數(shù)r進(jìn)行顯著性檢驗,一般取檢驗水平a =0.05,即可靠程度為95%.這里的r指的是線性相關(guān)系數(shù),r的絕對值很小,只是說明線性相關(guān)程度低,不一定不相關(guān),可能是非線性相關(guān)的某種關(guān)系.這里的r是對抽樣數(shù)據(jù)而言的.有時即使|r|=1,兩者也不析時,不能就數(shù)據(jù)論數(shù)據(jù),要結(jié)合實際情況進(jìn)行合理解釋.典例分析題型一莖葉圖【例1】(2010豐臺二模)甲、乙兩名運動員的 5次測試成績?nèi)缦聢D所示設(shè)& , S2分別表示甲、乙兩名運動員測試成績的標(biāo)準(zhǔn)差,定是線性相關(guān)的.故在統(tǒng)計分X , X2分別表示甲、乙兩名A. X =x2 , &

18、amp; <82B. X =x2 , & >82C.X > x2 , si >s2D. X = x2 ,運動員測試成績的平均數(shù),則有(si 二 s2【例2】(2010宣武二模)隨機(jī)抽取某中學(xué)甲,乙兩班各10名同學(xué),測量他們的身高(單位:cm),獲得身高數(shù)據(jù)的莖葉圖如圖 ,則下列關(guān)于甲,乙兩班這 10名同學(xué)身高的結(jié)論正確的是(A.B.)甲班同學(xué)身高的方差較大甲班同學(xué)身高的平均值較大C.甲班同學(xué)身高的中位數(shù)較大D.甲班同學(xué)身高在175以上的人數(shù)較多甲班乙班189 9 1016 15【例3】(2010天津高考)甲、乙兩人在 10天中每天加工零件的個數(shù)用莖葉圖表示如下圖

19、,中間一列的數(shù)字表示零件個數(shù)的十位數(shù),兩邊的數(shù)字表示零件個數(shù)的個位數(shù),則這 10天甲、乙兩人日加工零件的平均數(shù)分別為 和.甲9 80 1320115女19712 14 2 43 0 2 053 1545267857【例4】右圖是某賽季甲、乙兩名籃球運動員每場比賽得分的莖葉圖,368 2479 314則甲、乙兩人這幾場比賽得分的中位數(shù)之和是()A. 62B. 63C. 64 D. 65【例5】 在某五場籃球比賽中,甲、乙兩名運動員得分的莖葉圖如右.下列說法正確的是01231234021089A.在這五場比賽中,甲的平均得分比乙好,且甲比乙穩(wěn)定 B.在這五場比賽中,甲的平均得分比乙好,但乙比甲穩(wěn)定 C.在這五場比賽中,乙的平均得分比甲好,且乙比甲穩(wěn)定 D.在這五場比賽中,乙的平均得分比甲好,但甲比乙穩(wěn)定【例6】(2009年福建12)作品A88 9 992 3x214某校開展愛我海西、愛我家鄉(xiāng)”攝影比賽,9位評 委為參賽作品A給出的分?jǐn)?shù)如莖葉圖所示,記分員 在去掉一個最高分和一個最低分后, 算得平均分為 91,復(fù)核員在復(fù)核時,發(fā)現(xiàn)有一個數(shù)字(莖葉

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論