g3.109912.3抽樣方法、總體分布的估計doc_第1頁
g3.109912.3抽樣方法、總體分布的估計doc_第2頁
g3.109912.3抽樣方法、總體分布的估計doc_第3頁
g3.109912.3抽樣方法、總體分布的估計doc_第4頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、12.3抽樣方法、總體分布的估計一、知識梳理(一)抽樣1. 簡單隨機(jī)抽樣: 設(shè)一個總體的個體數(shù)為 N如果通過逐個抽取的方法從中抽取一個樣本,且每次抽取時各個個體被抽到的概率相等,就稱這樣的抽樣為簡單隨機(jī)抽樣用簡單隨機(jī)抽樣從含有N 個個體的總體中抽取一個容量為n的樣本時,每次抽取一個個體時任一個體被抽到的概率為1 ;在整個抽樣過程N(yùn)中各個個體被抽到的概率為n ; 簡單隨機(jī)抽樣的特點(diǎn)是,逐個抽取,且各N個個體被抽到的概率相等;簡單隨機(jī)抽樣方法, 體現(xiàn)了抽樣的客觀性與公平性,是其他更復(fù)雜抽樣方法的基礎(chǔ) (4). 簡單隨機(jī)抽樣的特點(diǎn): 它是不放回抽樣;它是逐個地進(jìn)行抽?。凰且环N等概率抽樣簡單抽樣常用

2、方法:(1)抽簽法:先將總體中的所有個體 (共有 N 個)編號(號碼可從 1 到 N),并把號碼寫在形狀、大小相同的號簽上(號簽可用小球、卡片、紙條等制作) ,然后將這些號簽放在同一個箱子里, 進(jìn)行均勻攪拌, 抽簽時每次從中抽一個號簽,連續(xù)抽取 n 次,就得到一個容量為 n 的樣本適用范圍:總體的個體數(shù)不多時優(yōu)點(diǎn):抽簽法簡便易行,當(dāng)總體的個體數(shù)不太多時適宜采用抽簽法(2)隨機(jī)數(shù)表法 : 隨機(jī)數(shù)表抽樣 “三步曲”:第一步, 將總體中的個體編號;第二步,選定開始的數(shù)字;第三步,獲取樣本號碼2.系統(tǒng)抽樣 : 當(dāng)總體中的個體數(shù)較多時,可將總體分成均衡的幾個部分,然后按預(yù)先定出的規(guī)則, 從每一部分抽取一

3、個個體, 得到需要的樣本, 這種抽樣叫做系統(tǒng)抽樣 系統(tǒng)抽樣的步驟: 采用隨機(jī)的方式將總體中的個體編號 為簡便起見,有時可直接采用個體所帶有的號碼, 如考生的準(zhǔn)考證號、 街道上各戶的門牌號,等等為將整個的編號分段 (即分成幾個部分),要確定分段的間隔k 當(dāng)Nn( N為總體中的個體的個數(shù), n 為樣本容量)是整數(shù)時, k= N ; 當(dāng) N 不是整數(shù)時,nn通過從總體中剔除一些個體使剩下的總體中個體的個數(shù)N 能被 n 整除,這時k= N . 在第一段用簡單隨機(jī)抽樣確定起始的個體編號l按照事先確定的規(guī)n則抽取樣本(通常是將 l 加上間隔 k,得到第 2 個編號 l +k, 第 3 個編號 l +2k,

4、這樣繼續(xù)下去,直到獲取整個樣本)系統(tǒng)抽樣適用于總體中的個體數(shù)較多的情況,它與簡單隨機(jī)抽樣的聯(lián)系在于:將總體均分后的每一部分進(jìn)行抽樣時,采用的是簡單隨機(jī)抽樣;與簡單隨機(jī)抽樣一樣,系統(tǒng)抽樣是等概率抽樣,它是客觀的、公平的總體中的個體數(shù)恰好能被樣本容量整除時,可用它們的比值作為系統(tǒng)抽樣的間隔;當(dāng)總體中的個體數(shù)不能被樣本容量整除時, 可用簡單隨機(jī)抽樣先從總體中剔除少量個體,使剩下的個體數(shù)能被樣本容量整除在進(jìn)行系統(tǒng)抽樣3.分層抽樣 : 當(dāng)已知總體由差異明顯的幾部分組成時,為了使樣本更充分地反映總體的情況,常將總體分成幾部分,然后按照各部分所占的比例進(jìn)行抽樣,這種抽樣叫做分層抽樣,所分成的部分叫做層常用的

5、抽樣方法及它們之間的聯(lián)系和區(qū)別:類別共同點(diǎn)各自特點(diǎn)相互聯(lián)系適用范圍簡單隨機(jī)從總體中逐個抽取總體中的個數(shù)比較抽樣少抽樣過程中將總體均勻分成幾在起始部分抽樣個部分,按照事先確總體中的個數(shù)比較系統(tǒng)抽樣每個個體被時采用簡單隨機(jī)定的規(guī)則在各部分多抽取的概率抽樣抽取是相同的各層抽樣時采用將總體分成幾層,分總體由差異明顯的分層抽樣簡單抽樣或者相層進(jìn)行抽取幾部分組成同抽樣不放回抽樣和放回抽樣: 在抽樣中,如果每次抽出個體后不再將它放回總體,稱這樣的抽樣為 不放回抽樣 ;如果每次抽出個體后再將它放回總體,稱這樣的抽樣為放回抽樣 隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣都是不放回抽樣(二)總體分布1.總體:在數(shù)理統(tǒng)計中,通常

6、把被研究的對象的全體叫做總體.2.頻率分布:用樣本估計總體,是研究統(tǒng)計問題的基本思想方法,樣本中所有數(shù)據(jù)(或數(shù)據(jù)組)的頻數(shù)和樣本容量的比,就是該數(shù)據(jù)的頻率.所有數(shù)據(jù)(或數(shù)據(jù)組)的頻率的分布變化規(guī)律叫做樣本的頻率分布 .可以用樣本 頻率表 、樣本頻率分布 條形圖 或頻率分布 直方圖來表示 .3.總體分布:從總體中抽取一個個體,就是一次隨機(jī)試驗,從總體中抽取一個容量為n的樣本, 就是進(jìn)行了 n 次試驗, 試驗連同所出現(xiàn)的結(jié)果叫隨機(jī)事件, 所有這些事件的概率分布規(guī)律稱為總體分布 .4. 總體密度曲線 : 樣本容量越大, 所分組數(shù)越多, 各組的頻率就越接近于總體在相應(yīng)各組取值的概率 設(shè)想樣本容量無限增

7、大, 分組的組距無限縮小, 那么頻率分布直方圖就會無限接近于一條光滑曲線 , 這條曲線叫做 總體密度曲線 頻率 /組距總體密度曲線單位Oab它反映了總體在各個范圍內(nèi)取值的概率根據(jù)這條曲線,可求出總體在區(qū)間 (a,b內(nèi)取值的概率等于總體密度曲線,直線x a,x b 及 x 軸所圍圖形的面)=積二、基礎(chǔ)訓(xùn)練1.一個總體中共有 10個個體,用簡單隨機(jī)抽樣的方法從中抽取一容量為3 的樣本,則某特定個體入樣的概率是C3B.3C. 3D.1A.C103109810102.( 2004 年江蘇, 6)某校為了了解學(xué)生的課外閱讀情況,隨機(jī)調(diào)查了50 名學(xué)生,得到他們在某一天各自課外閱讀所用時間的數(shù)據(jù),結(jié)果用下

8、面的條形圖表示.根據(jù)條形圖可得這50 名學(xué)生這一天平均每人的課外閱讀時間為B人數(shù) (人)20151050 0.5 1.01.5 2.0時間 (小時 )A.0.6 hB.0.9 hC.1.0 hD.1.5 h3.一個年級有12 個班,每個班有50 名同學(xué),隨機(jī)編號為 1 50 號,為了了解他們在課外的興趣愛好,要求每班的33 號學(xué)生留下來參加閱卷調(diào)查,這里運(yùn)用的抽樣方法是DA. 分層抽樣法B. 抽簽法C.隨機(jī)數(shù)表法D. 系統(tǒng)抽樣法4.為調(diào)查參加運(yùn)動會的1000 名運(yùn)動員的年齡情況,從中抽查了100名運(yùn)動員的年齡,就這個問題來說,下列說法正確的是A.1000 名運(yùn)動員是總體B. 每個運(yùn)動員是個體C

9、.抽取的 100 名運(yùn)動員是樣本D. 樣本容量是 100解析:這個問題我們研究的是運(yùn)動員的年齡情況.因此應(yīng)選 D.答案: D5.一個容量為n 的樣本,分成若干組,已知某數(shù)的頻數(shù)和頻率分別為40、 0.125,則 n的值為A.640B.320C.240D.160解析: 40 =0.125, n=320.故選 B.n答案: B6.某單位有老年人27 人,中年人54 人,青年人81 人,為了調(diào)查他們的健康狀況,需從他們中抽取一個容量為36 的樣本,在簡單隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣這三種方法中較合適的抽樣方法是_.解析:要研究的總體里各部分情況差異較大,因此用分層抽樣.答案:分層抽樣5.某班學(xué)生在一

10、次數(shù)學(xué)考試中成績分布如下表:分?jǐn)?shù)段 0,80) 80, 90)90,100)人數(shù)256分?jǐn)?shù)段100 ,110) 110,120 ) 120, 130)人數(shù)8126分?jǐn)?shù)段 130, 140) 140, 150)人數(shù)42那么分?jǐn)?shù)在 100,110)中的頻率和分?jǐn)?shù)不滿110 分的累積頻率分別是 _、_(精確到0.01) .解析:由頻率計算方法知:總?cè)藬?shù)=45.分?jǐn)?shù)在 100,110)中的頻率為8=0.178 0.18.45分?jǐn)?shù)不滿 110 分的累積頻率為25 68=21 0.47.4545答案: 0.180.47三、例題剖析【例 1】 ( 2004 年湖南, 5)某公司在甲、乙、丙、丁四個地區(qū)分別有

11、150 個、 120 個、180 個、 150 個銷售點(diǎn) .公司為了調(diào)查產(chǎn)品銷售的情況,需從這600 個銷售點(diǎn)中抽取一個容量為 100 的樣本,記這項調(diào)查為;在丙地區(qū)中有20 個特大型銷售點(diǎn),要從中抽取7 個調(diào)查其銷售收入和售后服務(wù)情況,記這項調(diào)查為.則完成、這兩項調(diào)查宜采用的抽樣方法依次是A. 分層抽樣法,系統(tǒng)抽樣法B. 分層抽樣法,簡單隨機(jī)抽樣法C.系統(tǒng)抽樣法,分層抽樣法D. 簡單隨機(jī)抽樣法,分層抽樣法剖析:此題為抽樣方法的選取問題.當(dāng)總體中個體較多時宜采用系統(tǒng)抽樣;當(dāng)總體中的個體差異較大時,宜采用分層抽樣;當(dāng)總體中個體較少時,宜采用隨機(jī)抽樣.依據(jù)題意,第項調(diào)查應(yīng)采用分層抽樣法、第項調(diào)查應(yīng)

12、采用簡單隨機(jī)抽樣法.故選 B.答案: B評述:采用什么樣的抽樣方法要依據(jù)研究的總體中的個體情況來定.【例 2】 ( 2004 年福建, 15)一個總體中有100 個個體,隨機(jī)編號為0, 1, 2,99,依編號順序平均分成10 個小組,組號依次為1, 2, 3, 10.現(xiàn)用系統(tǒng)抽樣方法抽取一個容量為 10 的樣本,規(guī)定如果在第1 組隨機(jī)抽取的號碼為m,那么在第 k 小組中抽取的號碼個位數(shù)字與m+k 的個位數(shù)字相同 .若 m=6 ,則在第 7 組中抽取的號碼是 _.剖析:此問題總體中個體的個數(shù)較多,因此采用系統(tǒng)抽樣.按題目中要求的規(guī)則抽取即可 . m=6, k=7 ,m+k=13 ,在第7 小組中

13、抽取的號碼是 63.答案: 63評述:當(dāng)總體中個體個數(shù)較多而差異又不大時可采用系統(tǒng)抽樣.采用系統(tǒng)抽樣在每小組內(nèi)抽取時應(yīng)按規(guī)則進(jìn)行 .【例 3】 把容量為100 的某個樣本數(shù)據(jù)分為10 組,并填寫頻率分布表,若前七組的累積頻率為 0.79,而剩下三組的頻數(shù)成公比大于2 的整數(shù)等比數(shù)列, 則剩下三組中頻數(shù)最高的一組的頻數(shù)為 _.剖析:已知前七組的累積頻率為 0.79,而要研究后三組的問題, 因此應(yīng)先求出后三組的頻率之和為 1 0.79=0.21 ,進(jìn)而求出后三組的共有頻數(shù),或者先求前七組共有頻數(shù)后,再計算后三組的共有頻數(shù).由已知知前七組的累積頻數(shù)為0.79 × 100=79 ,故后三組共

14、有的頻數(shù)為21,依題意a (1q3 )21) =21. a1=1, q=4.后三組頻數(shù)最高的一組的頻數(shù)為16.1q=21, a1( 1+q+q答案: 16評述:此題剖析只按第二種思路給出了解答,你能按第一種思路來解嗎?【例 4】 對某電子元件進(jìn)行壽命追蹤調(diào)查,情況如下:壽命( h)100 200200 300300400400 500500 600個 數(shù)2030804030( 1)列出頻率分布表;( 2)畫出頻率分布直方圖和累積頻率分布圖;( 3)估計電子元件壽命在100 400 h 以內(nèi)的概率;( 4)估計電子元件壽命在400 h 以上的概率 .剖析:通過本題可掌握總體分布估計的各種方法和步

15、驟.解:( 1)頻率分布表如下:壽命( h)頻 數(shù)頻 率累積頻率100200200.100.10200300300.150.25300400800.400.65400500400.200.85500600300.151合 計2001( 2)頻率分布直方圖如下:頻率組距100200300400 5 00600壽命 ( h)累積頻率1. 000. 800. 600. 400. 20100200 300 400 500 600 壽命 ( h)( 3)由累積頻率分布圖可以看出,壽命在 100 400 h 內(nèi)的電子元件出現(xiàn)的頻率為0.65,所以我們估計電子元件壽命在100 400 h 內(nèi)的概率為 0.6

16、5.( 4)由頻率分布表可知,壽命在400 h 以上的電子元件出現(xiàn)的頻率為0.20+0.15=0.35 ,故我們估計電子元件壽命在400 h 以上的概率為 0.35.評述:畫頻率分布條形圖、直方圖時要注意縱、橫坐標(biāo)軸的意義.【例 5】 某批零件共 160 個,其中,一級品 48 個,二級品64 個,三級品 32 個,等外品 16 個 .從中抽取一個容量為 20 的樣本 .請說明分別用簡單隨機(jī)抽樣、系統(tǒng)抽樣和分層抽樣法抽取時總體中的每個個體被取到的概率均相同.【例 6】一個容量為100 的樣本,數(shù)據(jù)的分組和各組的一些相關(guān)信息如下:分 組頻數(shù)頻 率累積頻率 12, 15)6 15, 18)0.08

17、 18, 21)0.30 21, 24)21 24, 27)0.69 27, 30)1630,330.10 33, 36)1.00合 計1001.00( 1)完成上表;( 2)畫出頻率分布直方圖和累積頻率分布圖;( 3)根據(jù)累積頻率分布圖,總體中小于22 的樣本數(shù)據(jù)大約占多大的百分比?四、同步練習(xí)g3.1099抽樣方法、總體分布的估計1某公司甲、乙、丙、丁四個地區(qū)分別有150 個、 120 個、 180 個、 150 個銷售點(diǎn)公司為了調(diào)查產(chǎn)品銷售的情況,需從這 600 個銷售點(diǎn)中抽取一個容量為100 的樣本, 記這項調(diào)查為;在丙地區(qū)中有20 個特大型銷售點(diǎn),要從中抽取7 個調(diào)查其收入和售后服務(wù)

18、等情況,記這項調(diào)查為 則完成、 這兩項調(diào)查宜采用的抽樣方法依次是( B)( A) 分層抽樣法,系統(tǒng)抽樣法( B) 分層抽樣法,簡單隨機(jī)抽樣法(C ) 系統(tǒng)抽樣法,分層抽樣法( D ) 簡單隨機(jī)抽樣法,分層抽樣法2已知樣本方差由 s21102,求得,則 x1 x2x1050(xi 5)10 i 13設(shè)有 n 個樣本 x1 , x2 , xn ,其標(biāo)準(zhǔn)差為 sx ,另有 n 個樣本 y1 , y2 , yn ,且 yk3xk5(k1,2, n) ,其標(biāo)準(zhǔn)差為 sy ,則下列關(guān)系正確的是(B )( A) sy 3sx 5( B) sy3sx(C ) s3s(D ) sy3sx5yx4某校為了了解學(xué)生

19、的課外閱讀情況,隨機(jī)調(diào)查了50人數(shù) (人)名學(xué)生, 得到他們在某一天各自課外閱讀所用時間的數(shù)據(jù),結(jié)果用右側(cè)的條形圖表示. 根據(jù)條形圖可20得這 50 名學(xué)生這一天平均每人的課外閱讀時間為15(B)(A) 0.6 小時( B)(C) 1.0 小時( D)100.9 小時51.5 小時5 x 是 x1, x2, x100 的平均數(shù), a 是 x1, x2, x40 的平00.51.01.52.0時間 (小時 )均數(shù), b 是 x41 , x42 , x100的平均數(shù), 則 x , a , b40a60b之間的關(guān)系為 x1006某校有老師 200 人,男學(xué)生1200 人,女學(xué)生 1000 人 .現(xiàn)用分層抽樣的方法從所有師生中抽取一個容量為 n 的樣本;已知從女學(xué)生中抽取的人數(shù)為80 人,則 n1127一個總體中有100 個個體,隨機(jī)編號0, 1,2, 99,依編號順序平均分成10 個小組,組號依次為1,2, 3, 10.現(xiàn)用系統(tǒng)抽樣方法抽取一個容量為10 的樣本,規(guī)定如果在第 1 組隨機(jī)抽取的號碼為m ,那么在第 k 組中抽取的號碼個位數(shù)字與mk 的個位數(shù)字相同,若 m 6 ,則在第 7 組中抽取的號碼是638在樣本的頻率分布直方圖中,共有11個小長方形,若中間一個小長方形的面積等于其他 10個小長方形的面積之和的1 ,且樣本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論