高中數(shù)學第二章統(tǒng)計2.2用樣本估計總體_第1頁
高中數(shù)學第二章統(tǒng)計2.2用樣本估計總體_第2頁
高中數(shù)學第二章統(tǒng)計2.2用樣本估計總體_第3頁
高中數(shù)學第二章統(tǒng)計2.2用樣本估計總體_第4頁
高中數(shù)學第二章統(tǒng)計2.2用樣本估計總體_第5頁
已閱讀5頁,還剩40頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2.2用樣本預(yù)計總體(2)1/45畫頻率分布直方圖步驟:

第一步:求極差:(數(shù)據(jù)組中最大值與最小值差距)

第二步:決定組距與組數(shù):(強調(diào)取整)

第三步:將數(shù)據(jù)分組

(給出組界限)

第四步:列頻率分布表.

(包含分組、頻數(shù)、頻率、頻率/組距)

第五步:畫頻率分布直方圖(在頻率分布表基礎(chǔ)上繪制,橫坐標為樣本數(shù)據(jù)尺寸,縱坐標為頻率/組距.)

組距:指每個小組兩個端點距離,組距組數(shù):將數(shù)據(jù)分組,當數(shù)據(jù)在100個以內(nèi)時,按數(shù)據(jù)多少常分5-12組。復(fù)習:繪制頻率分布直方圖有哪幾個步驟呢?

2/45在樣本頻率分布直方圖中,當樣本容量增加,作圖時所分組數(shù)增加,組距降低,對應(yīng)頻率折線圖會越來越靠近于一條光滑曲線,統(tǒng)計中稱這條光滑曲線為總體密度曲線.它能夠準確地反應(yīng)了總體在各個范圍內(nèi)取值百分比,它能給我們提供愈加精細信息.總體密度曲線:月均用水量/t頻率組距0ab3/45莖葉圖作法:(1)將每個數(shù)據(jù)分為莖(高位)和葉(低位)兩部分,如本例中,用莖表示十位上數(shù)字,用葉表示個位上數(shù)字;(2)將最小莖和最大莖之間數(shù)按大小次序排成一列,寫在左(右)側(cè);(3)將各個數(shù)據(jù)葉按大小次序?qū)懺谄淝o右(左)側(cè).甲 乙012345254511667949086438639831葉 莖葉4/45莖葉圖、頻率分布表與頻率分布直方圖比較(1)莖葉圖、頻率分布表與頻率分布直方圖都是用來描述樣本數(shù)據(jù)分布情況。(2)莖葉圖由全部樣本數(shù)據(jù)組成,沒有損失任何樣本信息;同時,莖葉圖中數(shù)據(jù)能夠隨時統(tǒng)計,隨時添加,方便統(tǒng)計與表示(這對于教練員發(fā)覺運動員現(xiàn)場狀態(tài)尤其有用).但當樣本數(shù)據(jù)較多時,枝葉就會很長,莖葉圖就顯得不太方便;(3)頻率分布表與頻率分布直方圖則損失了樣本一些信息,必須在完成抽樣后才能制作。5/45某校高一(1)班同學在老師布置下,用單擺進行測試,以檢驗重力加速度.全班同學兩人一組,在相同條件下進行測試,得到以下試驗數(shù)據(jù)(單位:m/s2):9.629.59.789.9410.019.669.889.6810.329.769.459.999.819.569.789.729.939.949.659.799.429.689.709.849.90怎樣用這些數(shù)據(jù)對重力加速度進行預(yù)計?問題引入:6/45知識新授:一、眾數(shù)、中位數(shù)、平均數(shù)概念普通地,n個數(shù)據(jù)按大小次序排列,處于最中間位置一個數(shù)據(jù)(或最中間兩個數(shù)據(jù)平均數(shù))叫做這組數(shù)中位數(shù)(median).一組數(shù)據(jù)中出現(xiàn)次數(shù)最多那個數(shù)據(jù)叫做這組數(shù)眾數(shù)(mode).

算術(shù)平均數(shù)是指資料中各觀察值總和除以觀察值個數(shù)所得商,簡稱平均數(shù)或均數(shù).

用這些特征數(shù)據(jù)對總體進行預(yù)計優(yōu)缺點是什么?7/45平均數(shù)、中位數(shù)、眾數(shù)都是描述數(shù)據(jù)“集中趨勢”“特征數(shù)”,它們各自特點以下:用平均數(shù)作為一組數(shù)據(jù)代表,比較可靠和穩(wěn)定,它與這組數(shù)據(jù)中每一個數(shù)都相關(guān)系.對這些數(shù)據(jù)所包含信息反應(yīng)最為充分,因而應(yīng)用最為廣泛,尤其是在進行統(tǒng)計推斷時有主要作用,但計算較繁瑣,而且易受極端數(shù)據(jù)影響.用眾數(shù)作為一組數(shù)據(jù)代表,可靠性較差,但眾數(shù)不受極端數(shù)據(jù)影響,而且求法簡便,當一組數(shù)據(jù)中個別數(shù)據(jù)變動較大時,適宜選擇眾數(shù)來表示這組數(shù)據(jù)“集中趨勢”.用中位數(shù)作為一組數(shù)據(jù)代表,可靠性也較差,但中位數(shù)也不受極端數(shù)據(jù)影響,也可選擇中位數(shù)來表示這組數(shù)據(jù)“集中趨勢”.8/45我們慣用算術(shù)平均數(shù)(其中ai(i=1,2,…,n)為n個試驗數(shù)據(jù))作為重力加速度近似值,它依據(jù)是什么呢?任何一個樣本數(shù)據(jù)改變都會引發(fā)平均數(shù)改變.這是中位數(shù)、眾數(shù)都不具備性質(zhì),也正是這個原因,與眾數(shù)、中位數(shù)比較起來,平均數(shù)能夠反應(yīng)出更多關(guān)于樣本數(shù)據(jù)全體信息.9/45

練習:在一次中學生田徑運動會上,參加男子跳高17名運動員成績以下表所表示:成績(單位:米)1.501.601.651.701.751.801.851.90人數(shù)23234111分別求這些運動員成績眾數(shù),中位數(shù)與平均數(shù)10/45解:在17個數(shù)據(jù)中,1.75出現(xiàn)了4次,出現(xiàn)次數(shù)最多,即這組數(shù)據(jù)眾數(shù)是1.75.上面表里17個數(shù)據(jù)可看成是按從小到大次序排列,其中第9個數(shù)據(jù)1.70是最中間一個數(shù)據(jù),即這組數(shù)據(jù)中位數(shù)是1.70;

這組數(shù)據(jù)平均數(shù)是

答:17名運動員成績眾數(shù)、中位數(shù)、平均數(shù)依次是1.75(米)、1.70(米)、1.69(米).用這些特征數(shù)據(jù)對總體進行預(yù)計優(yōu)缺點是什么?11/45二、眾數(shù)、中位數(shù)、平均數(shù)與頻率分布直方圖關(guān)系

1、眾數(shù)在樣本數(shù)據(jù)頻率分布直方圖中,就是最高矩形中點橫坐標。比如,在上一節(jié)調(diào)查100位居民月均用水量問題中,從這些樣本數(shù)據(jù)頻率分布直方圖能夠看出,月均用水量眾數(shù)是2.25t.如圖所表示:12/453.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2100位居民月均用水量(單位:t)13/45頻率分布直方圖以下:月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.52.2514/45

2、在樣本中,有50%個體小于或等于中位數(shù),也有50%個體大于或等于中位數(shù).所以,在頻率分布直方圖中,中位數(shù)左邊和右邊直方圖面積應(yīng)該相等,由此能夠預(yù)計中位數(shù)值。下列圖中虛線代表居民月均用水量中位數(shù)預(yù)計值,此數(shù)據(jù)值為2.03t.15/45頻率分布直方圖以下:月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.52.0316/45說明:2.03這個中位數(shù)預(yù)計值,與樣本中位數(shù)值2.0不一樣,這是因為樣本數(shù)據(jù)頻率分布直方圖,只是直觀地表明分布形狀,不過從直方圖本身得不出原始數(shù)據(jù)內(nèi)容,所以由頻率分布直方圖得到中位數(shù)預(yù)計值往往與樣本實際中位數(shù)值不一致.17/45

3、平均數(shù)是頻率分布直方圖“重心”.是直方圖平衡點.n個樣本數(shù)據(jù)平均數(shù)公式:X=下列圖顯示了居民月均用水量平均數(shù):x=1.97318/45頻率分布直方圖以下:月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.51.97319/45三.

三種數(shù)字特征優(yōu)缺點

1、眾數(shù)表達了樣本數(shù)據(jù)最大集中點,但它對其它數(shù)據(jù)信息忽略使得無法客觀地反應(yīng)總體特征.如上例中眾數(shù)是2.25t,它告訴我們,月均用水量為2.25t居民數(shù)比月均用水量為其它數(shù)值居民數(shù)多,但它并沒有告訴我們多多少.20/45

2、中位數(shù)是樣本數(shù)據(jù)所占頻率等分線,它不受少數(shù)幾個極端值影響,這在一些情況下是優(yōu)點,但它對極端值不敏感有時也會成為缺點。如上例中假設(shè)有某一用戶月均用水量為10t,那么它所占頻率為0.01,幾乎不影響中位數(shù),但顯然這一極端值是不能忽略。21/45

3、因為平均數(shù)與每一個樣本數(shù)據(jù)相關(guān),所以任何一個樣本數(shù)據(jù)改變都會引發(fā)平均數(shù)改變,這是眾數(shù)、中位數(shù)都不含有性質(zhì)。也正因如此,與眾數(shù)、中位數(shù)比較起來,平均數(shù)能夠反應(yīng)出更多關(guān)于樣本數(shù)據(jù)全體信息,但平均數(shù)受數(shù)據(jù)中極端值影響較大,使平均數(shù)在預(yù)計時可靠性降低。22/45四、眾數(shù)、中位數(shù)、平均數(shù)簡單應(yīng)用例1某工廠人員及工資組成以下:人員經(jīng)理管理人員高級技工工人學徒累計周工資2200250220200100人數(shù)16510123累計2200150011001006900(1)指出這個問題中周工資眾數(shù)、中位數(shù)、平均數(shù)(2)這個問題中,工資平均數(shù)能客觀地反應(yīng)該廠工資水平嗎?為何?23/45(加權(quán)平均數(shù))分析:眾數(shù)為200,中位數(shù)為220,平均數(shù)為300。因平均數(shù)為300,由表格中所列出數(shù)據(jù)可見,只有經(jīng)理周工資在平均數(shù)以上,其余人都在平均數(shù)以下,故用平均數(shù)不能客觀真實地反應(yīng)該工廠工資水平。24/45問題:有兩位射擊運動員在一次射擊測試中各射靶十次,每次命中環(huán)數(shù)以下:甲78795491074乙9578768677假如你是教練,你應(yīng)該怎樣對這次射擊情況作出評價?假如這是一次選拔性考評,你應(yīng)該怎樣作出選擇?

兩人射擊平均成績是一樣.那么兩個人水平就沒有什么差異嗎?25/4545678910環(huán)數(shù)頻率0.10.20.3(甲)456789100.10.20.30.4環(huán)數(shù)頻率(乙)發(fā)覺什么?為此,我們還需要從另外一個角度去考查這2組數(shù)據(jù)!26/45直觀上看,還是有差異.如:甲成績比較分散,乙成績相對集中(如圖示).所以,我們還需要從另外角度來考查這兩組數(shù)據(jù).比如:在作統(tǒng)計圖表時提到過極差.甲環(huán)數(shù)極差=10-4=6乙環(huán)數(shù)極差=9-5=4.它們在一定程度上表明了樣本數(shù)據(jù)分散程度,與平均數(shù)一起,能夠給我們許多關(guān)于樣本數(shù)據(jù)信息.顯然,極差對極端值非常敏感,注意到這一點,我們能夠得到一個“去掉一個最高分,去掉一個最低分”統(tǒng)計策略.27/45四、標準差考查樣本數(shù)據(jù)分散程度大小,最慣用統(tǒng)計量是標準差.標準差是樣本平均數(shù)一個平均距離,普通用s表示.所謂“平均距離”,其含義可作以下了解:28/45方差、標準差是樣本數(shù)據(jù)到平均數(shù)一個平均距離。它用來描述樣本數(shù)據(jù)分散程度。在實際應(yīng)用中,標準差常被了解為穩(wěn)定性。1、方差(標準差平方)公式為:假設(shè)樣本數(shù)據(jù)是平均數(shù)是2、標準差公式為:在刻畫樣本數(shù)據(jù)分散程度上,二者是一致!29/45標準差方差、標準差是樣本數(shù)據(jù)到平均數(shù)一個平均距離。它用來描述樣本數(shù)據(jù)離散程度。在實際應(yīng)用中,標準差常被了解為穩(wěn)定性。規(guī)律:標準差越大,則a越大,數(shù)據(jù)離散程度越大;反之,數(shù)據(jù)離散程度越小。30/45例2.已知有一個樣本數(shù)據(jù)為1,2,3,4,5,求平均數(shù),方差,標準差.31/45例3甲乙兩人同時生產(chǎn)內(nèi)徑為25.40mm一個零件.為了對兩人生產(chǎn)質(zhì)量進行評選,從他們生產(chǎn)零件中各抽出20件,量得其內(nèi)徑尺寸以下(單位:mm)甲25.46,25.32,25.45,25.39,25.3625.34,25.42,25.45,25.38,25.4225.39,25.43,25.39,25.40,25.4425.40,25.42,25.35,25.41,25.39乙25.40,25.43,25.44,25.48,25.4825.47,25.49,25.49,25.36,25.3425.33,25.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論