樣本及抽樣分布課件_第1頁
樣本及抽樣分布課件_第2頁
樣本及抽樣分布課件_第3頁
樣本及抽樣分布課件_第4頁
樣本及抽樣分布課件_第5頁
已閱讀5頁,還剩123頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

什么是統(tǒng)計(jì)學(xué)?統(tǒng)計(jì)學(xué)是一門關(guān)于數(shù)據(jù)資料的收集、整理、分析和推斷的科學(xué)。但人們常常將統(tǒng)計(jì)這一概念誤解為大量數(shù)據(jù)資料的收集以及對(duì)這些數(shù)據(jù)作一些簡單的運(yùn)算(如求和、求平均值、求百分比等)或用圖表、表格等形式把它們表示出來;其實(shí)這些工作僅是統(tǒng)計(jì)學(xué)工作的非主要部分。統(tǒng)計(jì)學(xué)還包括怎樣設(shè)計(jì)試驗(yàn)、采集數(shù)據(jù)以及怎樣對(duì)獲得的數(shù)據(jù)進(jìn)行分析推斷等其它許多工作。隨著研究隨機(jī)現(xiàn)象規(guī)律性的科學(xué)——概率論的發(fā)展,應(yīng)用概率論的結(jié)果更深入地分析研究統(tǒng)計(jì)資料,通過對(duì)某些現(xiàn)象的頻率的觀察來發(fā)現(xiàn)該現(xiàn)象的內(nèi)在規(guī)律性,并作出一定精確程度的判斷和預(yù)測;將這些研究的某些結(jié)果加以歸納整理,逐漸形成一定的數(shù)學(xué)概型,這些組成了數(shù)理統(tǒng)計(jì)的內(nèi)容。數(shù)理統(tǒng)計(jì)的方法及考慮的問題不同于一般的資料統(tǒng)計(jì),它更側(cè)重于應(yīng)用隨機(jī)現(xiàn)象本身的規(guī)律性來考慮資料的收集整理和分析,從而找出相應(yīng)的隨機(jī)變量的分布律或它的數(shù)字特征。由于大量的隨機(jī)試驗(yàn)?zāi)艹尸F(xiàn)出它的規(guī)律性,因而從理論上講,只要對(duì)隨機(jī)現(xiàn)象進(jìn)行足夠多次觀察,被研究的隨機(jī)現(xiàn)象的規(guī)律性一定能清楚地呈現(xiàn)出來,但是實(shí)際上所允許的觀察永遠(yuǎn)只能是有限的,有時(shí)甚至是少量的。因此我們所關(guān)心的問題是怎樣有效地利用有限的資料,便能去掉那些由于資料不足所引起的隨機(jī)干擾,而把那些實(shí)質(zhì)性的東西找出來。一個(gè)好的統(tǒng)計(jì)方法就在于能有效地利用所獲得的資料,盡可能作出精確而可靠的結(jié)論。在數(shù)理統(tǒng)計(jì)里,不是對(duì)所研究的全部對(duì)象進(jìn)行觀察,而是抽取其中的部分進(jìn)行觀察、獲得數(shù)據(jù)(即采樣),并通過這些數(shù)據(jù)來對(duì)所研究的全體進(jìn)行推斷。由于推斷是基于采樣數(shù)據(jù),而采樣數(shù)據(jù)又不能包含研究對(duì)象的全部信息,因此由此所獲得的結(jié)論必然會(huì)包含不定性,概率是這種不定性的度量。造成不定性的原因可分為兩類:(1)由于采樣數(shù)據(jù)的隨機(jī)性所引起的不定性;(2)由于我們對(duì)系統(tǒng)真實(shí)狀態(tài)的“無知”造成的不定性。數(shù)理統(tǒng)計(jì)工作者的任務(wù)就是要分辨這兩種不定性。下面舉一例來說明。某元件廠生產(chǎn)了一批三極管,共一百萬只,每十只裝成一盒,共得十萬盒。現(xiàn)有某儀器廠需向該元件廠購買此三極管一百盒,準(zhǔn)備安裝在某種儀表上。每臺(tái)儀表需用此三極管十只,恰好是一臺(tái)儀表需一盒三極管,一百盒可供裝一百臺(tái),但是該儀表對(duì)三極管有一定的質(zhì)量要求,要求十只中至少有八只是—級(jí)品,其余的可以是二級(jí)品,否則儀表不能穩(wěn)定工作。此時(shí)儀表廠對(duì)這批三極管就面臨兩種不定性需要分辨:(1)元件廠生產(chǎn)的十萬盒三極管,對(duì)儀器廠來說是滿意的(即一盒中至少有八只是一級(jí)品)盒子所占比例p是多少?(2)由于有十萬盒三極管,現(xiàn)在僅購買其中的一百盒,因而就面臨著另一種不定性。即假使已知此十萬盒中,滿意的盒子所占的比例為p,又怎樣能確定買來的一百盒中,滿意的占多少比例呢?例如p=0.99,即十萬盒中大約有九萬九千盒是滿意的,這個(gè)比例對(duì)儀器廠來說應(yīng)該是很好了,但也有可能發(fā)生這樣的意外,即儀器廠所購買的一百盒全部落在不滿意的大約一千盒之中。第一種不定性是不知道p,是我們對(duì)系統(tǒng)真實(shí)狀態(tài)的“無知”;而后一種不定性是由于所謂“隨機(jī)性”造成的。為了改善這不定性,儀器廠可要求元件廠對(duì)這批三極管的質(zhì)量進(jìn)行測試,也就是要求抽取部分三極管進(jìn)行測試,通過這部分中一級(jí)晶所占的比例(頻率)來對(duì)p的真實(shí)值進(jìn)行推斷,當(dāng)然我們不能完全精確地決定p,但是我們可以希望獲得一個(gè)(在某種意義下)比較好的判斷,這就涉及到怎樣設(shè)計(jì)試驗(yàn),決定觀察的數(shù)目.和怎樣利用試驗(yàn)觀察的結(jié)果作出一個(gè)好的“推斷”等,這些都是數(shù)理統(tǒng)計(jì)所要研究的問題。至于在已知p的條件下,第二種不定性的程度已在概率論基礎(chǔ)部分作過討論。數(shù)理統(tǒng)計(jì)研究的內(nèi)容隨著科學(xué)技術(shù)和生產(chǎn)的不斷發(fā)展而逐步擴(kuò)大。但概括地說可以分為兩大類:(1)試驗(yàn)的設(shè)計(jì)和研究,即研究如何更合理更有效地獲得觀察資料的方法;(2)統(tǒng)計(jì)推斷,即研究如何利用一定的資料對(duì)所關(guān)心的問題作出盡可能精確、可靠的結(jié)論。本課程只討論統(tǒng)計(jì)推斷。什么是統(tǒng)計(jì)學(xué)?統(tǒng)計(jì)學(xué)是一門關(guān)于數(shù)據(jù)資料的收集、整理、分析1概率論的基本概念數(shù)理統(tǒng)計(jì)的基本概念抽樣分布返回退出本章小結(jié)習(xí)題概率論的基本概念數(shù)理統(tǒng)計(jì)的基本概念返回退出本章小結(jié)2數(shù)理統(tǒng)計(jì)的基本概念總體和樣本統(tǒng)計(jì)量順序統(tǒng)計(jì)量和經(jīng)驗(yàn)分布函數(shù)返回繼續(xù)數(shù)理統(tǒng)計(jì)的基本概念總體和樣本返回繼續(xù)3我們今后所討論的統(tǒng)計(jì)問題主要屬于下面這種類型:從一個(gè)集合中選取一部分元素,對(duì)這部分元素的某些數(shù)量指標(biāo)進(jìn)行測量,根據(jù)測量獲得的這些數(shù)據(jù)來推斷這集合中全部元素的這些數(shù)量指標(biāo)的分布情況。在統(tǒng)計(jì)學(xué)中,我們把所研究的全部元素組成的集合稱為母體,或總體。而把組成母體的每個(gè)元素稱為個(gè)體,例如在研究某批燈泡的平均壽命時(shí),該批燈泡的全體就組成了母體,而其中每個(gè)燈泡就是個(gè)體。但是在統(tǒng)計(jì)里,由于我們關(guān)心的不是每個(gè)個(gè)體的種種具體特性,而僅僅是它的某一項(xiàng)或某幾項(xiàng)數(shù)量指標(biāo)X和該數(shù)量指標(biāo)X在總體中的分布情況。在上述例子中X是表示燈泡的壽命,就此數(shù)量指標(biāo)X而言,每個(gè)個(gè)體所總體、個(gè)體、樣本、樣本容量、樣本值我們今后所討論的統(tǒng)計(jì)問題主要屬于下面這種類型4取的值是不同的。在試驗(yàn)中,抽取了若干個(gè)個(gè)體就觀察到了x的這樣或那樣的數(shù)值,因而這個(gè)數(shù)量指標(biāo)X是一個(gè)隨機(jī)變量,而X的分布就完全描寫了總體中我們所關(guān)心的那個(gè)數(shù)量指標(biāo)的分布狀況。由于我們關(guān)心的正是這個(gè)數(shù)量指標(biāo),因此我們以后就把總體和數(shù)量指標(biāo)X可能取值的全體組成的集合等同起來,所謂總體的分布也就是指數(shù)量指標(biāo)x的分布。為了對(duì)總體的分布律進(jìn)行各種研究,就必須對(duì)總體進(jìn)行抽樣觀察,一般說來,我們還不止進(jìn)行一次抽樣觀察,而是進(jìn)行幾次觀察。通過觀察就得到總體指標(biāo)X的一組數(shù)值(x1,x2,…,xn),其中每個(gè)xi是一次抽樣觀察的結(jié)果。即某一個(gè)被觀察總體、個(gè)體、樣本、樣本容量、樣本值取的值是不同的。在試驗(yàn)中,抽取了若干個(gè)個(gè)體就觀察到了x的這樣5的個(gè)體的X指標(biāo)值,(x1,x2,…,xn)稱為容量為n的樣本的觀察值。由于我們是利用樣本觀察來對(duì)總體的分布進(jìn)行推斷,因而從總體中抽取樣本進(jìn)行觀察時(shí)必須是隨機(jī)的。所以對(duì)于隨機(jī)抽樣來說,對(duì)其某一次觀察結(jié)果而論,是完全確定的一組值,但它又是隨每次抽樣觀察而改變的,由于我們要依據(jù)這一觀察結(jié)果進(jìn)行分析推斷,并研究比較各種推斷方法的好壞,因而一般考慮問題時(shí),就不能把看為確定的數(shù)值,而應(yīng)該看作為隨機(jī)向量X=(X1,X2,…,Xn),稱它為容量是n的樣本,因而對(duì)樣本也有分布可言??傮w、個(gè)體、樣本、樣本容量、樣本值的個(gè)體的X指標(biāo)值,(x1,x2,…,xn)稱為容量為n的6我們抽取樣本的目的是為了對(duì)總體的分布律進(jìn)行各種分析推斷,因而要求抽取的樣本能很好地反映總體的特性,這就必須對(duì)隨機(jī)抽樣的方法提出一定的要求。通常提出下面兩點(diǎn):①代表性:要求樣本的每個(gè)分量Xi與所觀察的總體X具有相同的分布F(x);②獨(dú)立性:X1,X2,…,Xn為相互獨(dú)立的隨機(jī)變量,也就是說,每個(gè)觀察結(jié)果既不影響其他觀察結(jié)果,也不受其它觀察結(jié)果的影響。滿足上述兩點(diǎn)性質(zhì)的樣本稱為簡單隨機(jī)子樣。在今后如不作特殊聲明,所說的樣本將理解為簡單隨機(jī)樣本,對(duì)于簡單隨機(jī)樣本X=(X1,X2,…,Xn),其分布可以由總體X的分布函數(shù)F(x)簡單隨機(jī)樣本我們抽取樣本的目的是為了對(duì)總體的分布律進(jìn)行各7(或概率密度f(x))完全決定,X的分布函數(shù)為簡單隨機(jī)樣本(或概率密度f(x))完全決定,X的分布函數(shù)為簡單隨機(jī)樣本8在數(shù)理統(tǒng)計(jì)中,研究對(duì)象的全體稱為總體;組成總體的每個(gè)元素稱為個(gè)體。從總體中抽取的一部分個(gè)體,稱為總體的一個(gè)樣本;樣本中個(gè)體的個(gè)數(shù)稱為樣本的容量。從分布函數(shù)為F(x)的隨機(jī)變量X中隨機(jī)地抽取的相互獨(dú)立的n個(gè)隨機(jī)變量,具有與總體相同的分布,則X1,X2,…,Xn稱為從總體X得到的容量為n的隨機(jī)樣本,簡稱樣本。一次具體的抽取記錄x1,x2,…,xn是隨機(jī)變量X1,X2,…,Xn的一個(gè)觀察值。總體與樣本在數(shù)理統(tǒng)計(jì)中,研究對(duì)象的全體稱為總體;組成總體的每個(gè)元素9例1A廠生產(chǎn)的某種電器的使用壽命服從指數(shù)分布,參數(shù)為未知,為此抽查了n件電器,測量其實(shí)際壽命。是確定本問題的總體,樣本及樣本的分布。例1A廠生產(chǎn)的某種電器的使用壽命服從指數(shù)分布,參數(shù)為未10樣本是總體的代表和反映,但在我們抽取樣本之后,并不直接利用樣本進(jìn)行推斷,而需要對(duì)樣本進(jìn)行一番“加工”和“提煉”,把樣本所包含的關(guān)于我們所關(guān)心的事物的信息集中起來,這便是針對(duì)不同的問題構(gòu)造出樣本的某種函數(shù),這種函數(shù)在統(tǒng)計(jì)學(xué)中稱為統(tǒng)計(jì)量。引進(jìn)統(tǒng)計(jì)量的目的是為了將雜亂無序的樣本值歸結(jié)為一個(gè)便于進(jìn)行統(tǒng)計(jì)推斷和研究分析的形式,集中樣本所含信息,使之更易揭示問題實(shí)質(zhì),從而解決問題。統(tǒng)計(jì)量中應(yīng)該不含有未知參數(shù),如果統(tǒng)計(jì)量中仍含有未知參數(shù),就無法依靠樣本觀測值求出未知參數(shù)的估計(jì)值,因而失去利用統(tǒng)計(jì)量估計(jì)未知參數(shù)的意義,這是違背我們引進(jìn)統(tǒng)計(jì)量的初衷的。統(tǒng)計(jì)量概念的引入樣本是總體的代表和反映,但在我們抽取樣本之后11來自總體X的樣本X1,X2,…,Xn的函數(shù)g(X1,X2,…,Xn),若是連續(xù)的且不含任何未知參數(shù),則稱為一個(gè)統(tǒng)計(jì)量。統(tǒng)計(jì)量來自總體X的樣本X1,X2,…,Xn的函數(shù)g(X1,12第六章樣本及抽樣分布課件13常用的統(tǒng)計(jì)量常用的統(tǒng)計(jì)量14常用的統(tǒng)計(jì)量常用的統(tǒng)計(jì)量15常用統(tǒng)計(jì)量的性質(zhì)常用統(tǒng)計(jì)量的性質(zhì)16常用統(tǒng)計(jì)量的性質(zhì)常用統(tǒng)計(jì)量的性質(zhì)17定理1的證明定理1的證明18定理2的證明定理2的證明19定理2的證明定理2的證明20定理2的證明定理2的證明21定理3的證明定理3的證明22例2設(shè)有一容量n=8的樣本觀察值為(8,6,7,5,7,8,9,6),求樣本均值及樣本方差的觀察值。例2設(shè)有一容量n=8的樣本觀察值為(8,6,7,5,7,23例3已知某種紗的強(qiáng)力服從N(1.56,0.222)(單位:千克)今抽取容量為n=50的樣本,求樣本均值小于1.45千克的概率。例3已知某種紗的強(qiáng)力服從N(1.56,0.222)(單位24設(shè)x1,x2,…,xn為總體X的一組觀察值,將它們按有小到大的順序排列,得到x1*≤x2*≤…xn*稱它為順序統(tǒng)計(jì)量。則稱它為經(jīng)驗(yàn)分布。順序統(tǒng)計(jì)量和經(jīng)驗(yàn)分布設(shè)x1,x2,…,xn為總體X的一組觀察值,將它們按25順序統(tǒng)計(jì)量和經(jīng)驗(yàn)分布順序統(tǒng)計(jì)量和經(jīng)驗(yàn)分布26抽樣分布正態(tài)總體樣本的線性函數(shù)的分布X2-分布t-分布F-分布正態(tài)母體子樣均值和方差的分布返回繼續(xù)抽樣分布正態(tài)總體樣本的線性函數(shù)的分布返回繼續(xù)27統(tǒng)計(jì)量是我們對(duì)母體的分布律或數(shù)字特征進(jìn)行推斷的基礎(chǔ),因此求統(tǒng)計(jì)量的分布是數(shù)理統(tǒng)計(jì)的基本問題之一。我們所感到興趣的是下面兩類問題.第一類問題是:對(duì)于任意一個(gè)自然數(shù)n,要找出給定的統(tǒng)計(jì)量Un=f(X1,X2,…,Xn)的分布,這分布稱為這統(tǒng)計(jì)量的精確分布。求統(tǒng)計(jì)量的精確分布對(duì)于數(shù)理統(tǒng)計(jì)中的所謂小樣問題(即子樣容量比較小時(shí)的統(tǒng)計(jì)問題)的研究是非常有用的。第二類問題是:不對(duì)任何個(gè)別的n求出統(tǒng)計(jì)量Un的分布,而只求出當(dāng)n∞時(shí),統(tǒng)計(jì)量Un的極限分布,這極限分布對(duì)于數(shù)理統(tǒng)計(jì)中的所謂大樣抽樣分布問題(即子樣容量較大時(shí)的統(tǒng)計(jì)問題)的研究很有用處。一般說來,要確定一個(gè)統(tǒng)計(jì)量的精確分布是非常復(fù)雜的,可是對(duì)于一些重要的特殊情形,如正態(tài)母體,這個(gè)問題有較簡單的解法。在今后各章中將會(huì)看到,正態(tài)母體的研究處于特別顯著的地位,這一方面是由于其統(tǒng)計(jì)量的精確分布的數(shù)學(xué)分析比較容易;另一重要原因是:在許多領(lǐng)域的統(tǒng)計(jì)研究中所遇到的母體,正態(tài)分布是它的一個(gè)很好的近似。當(dāng)然,中心極限定理也保證了這一狀況。統(tǒng)計(jì)量是我們對(duì)母體的分布律或數(shù)字特征進(jìn)行推斷28正態(tài)總體樣本的線性函數(shù)的分布正態(tài)總體樣本的線性函數(shù)的分布29正態(tài)總體樣本的線性函數(shù)的分布正態(tài)總體樣本的線性函數(shù)的分布30X2—分布X2—分布31定理1的證明定理1的證明32定理1的證明定理1的證明33定理1的證明定理1的證明34定理1的證明及密度函數(shù)圖定理1的證明及密度函數(shù)圖35X2—分布X2—分布36第六章樣本及抽樣分布課件37第六章樣本及抽樣分布課件38第六章樣本及抽樣分布課件39t—分布t—分布40定理1的證明定理1的證明41定理1的證明定理1的證明42t—分布的密度函數(shù)圖t—分布的密度函數(shù)圖43t—分布與正態(tài)分布t—分布與正態(tài)分布44t—分布t—分布45第六章樣本及抽樣分布課件46第六章樣本及抽樣分布課件47F—分布F—分布48定理1的證明定理1的證明49定理1的證明定理1的證明50F—分布F—分布51F—分布F—分布52第六章樣本及抽樣分布課件53第六章樣本及抽樣分布課件54第六章樣本及抽樣分布課件55正態(tài)總體的樣本均值與樣本方差的分布正態(tài)總體的樣本均值與樣本方差的分布56定理1的證明定理1的證明57定理1的證明定理1的證明58定理1的證明定理1的證明59正態(tài)總體的樣本均值與樣本方差的分布正態(tài)總體的樣本均值與樣本方差的分布60正態(tài)總體的樣本均值與樣本方差的分布正態(tài)總體的樣本均值與樣本方差的分布61正態(tài)總體的樣本均值與樣本方差的分布正態(tài)總體的樣本均值與樣本方差的分布62P171本章小結(jié)P171本章小結(jié)63習(xí)題返回P174習(xí)題返回P17464什么是統(tǒng)計(jì)學(xué)?統(tǒng)計(jì)學(xué)是一門關(guān)于數(shù)據(jù)資料的收集、整理、分析和推斷的科學(xué)。但人們常常將統(tǒng)計(jì)這一概念誤解為大量數(shù)據(jù)資料的收集以及對(duì)這些數(shù)據(jù)作一些簡單的運(yùn)算(如求和、求平均值、求百分比等)或用圖表、表格等形式把它們表示出來;其實(shí)這些工作僅是統(tǒng)計(jì)學(xué)工作的非主要部分。統(tǒng)計(jì)學(xué)還包括怎樣設(shè)計(jì)試驗(yàn)、采集數(shù)據(jù)以及怎樣對(duì)獲得的數(shù)據(jù)進(jìn)行分析推斷等其它許多工作。隨著研究隨機(jī)現(xiàn)象規(guī)律性的科學(xué)——概率論的發(fā)展,應(yīng)用概率論的結(jié)果更深入地分析研究統(tǒng)計(jì)資料,通過對(duì)某些現(xiàn)象的頻率的觀察來發(fā)現(xiàn)該現(xiàn)象的內(nèi)在規(guī)律性,并作出一定精確程度的判斷和預(yù)測;將這些研究的某些結(jié)果加以歸納整理,逐漸形成一定的數(shù)學(xué)概型,這些組成了數(shù)理統(tǒng)計(jì)的內(nèi)容。數(shù)理統(tǒng)計(jì)的方法及考慮的問題不同于一般的資料統(tǒng)計(jì),它更側(cè)重于應(yīng)用隨機(jī)現(xiàn)象本身的規(guī)律性來考慮資料的收集整理和分析,從而找出相應(yīng)的隨機(jī)變量的分布律或它的數(shù)字特征。由于大量的隨機(jī)試驗(yàn)?zāi)艹尸F(xiàn)出它的規(guī)律性,因而從理論上講,只要對(duì)隨機(jī)現(xiàn)象進(jìn)行足夠多次觀察,被研究的隨機(jī)現(xiàn)象的規(guī)律性一定能清楚地呈現(xiàn)出來,但是實(shí)際上所允許的觀察永遠(yuǎn)只能是有限的,有時(shí)甚至是少量的。因此我們所關(guān)心的問題是怎樣有效地利用有限的資料,便能去掉那些由于資料不足所引起的隨機(jī)干擾,而把那些實(shí)質(zhì)性的東西找出來。一個(gè)好的統(tǒng)計(jì)方法就在于能有效地利用所獲得的資料,盡可能作出精確而可靠的結(jié)論。在數(shù)理統(tǒng)計(jì)里,不是對(duì)所研究的全部對(duì)象進(jìn)行觀察,而是抽取其中的部分進(jìn)行觀察、獲得數(shù)據(jù)(即采樣),并通過這些數(shù)據(jù)來對(duì)所研究的全體進(jìn)行推斷。由于推斷是基于采樣數(shù)據(jù),而采樣數(shù)據(jù)又不能包含研究對(duì)象的全部信息,因此由此所獲得的結(jié)論必然會(huì)包含不定性,概率是這種不定性的度量。造成不定性的原因可分為兩類:(1)由于采樣數(shù)據(jù)的隨機(jī)性所引起的不定性;(2)由于我們對(duì)系統(tǒng)真實(shí)狀態(tài)的“無知”造成的不定性。數(shù)理統(tǒng)計(jì)工作者的任務(wù)就是要分辨這兩種不定性。下面舉一例來說明。某元件廠生產(chǎn)了一批三極管,共一百萬只,每十只裝成一盒,共得十萬盒?,F(xiàn)有某儀器廠需向該元件廠購買此三極管一百盒,準(zhǔn)備安裝在某種儀表上。每臺(tái)儀表需用此三極管十只,恰好是一臺(tái)儀表需一盒三極管,一百盒可供裝一百臺(tái),但是該儀表對(duì)三極管有一定的質(zhì)量要求,要求十只中至少有八只是—級(jí)品,其余的可以是二級(jí)品,否則儀表不能穩(wěn)定工作。此時(shí)儀表廠對(duì)這批三極管就面臨兩種不定性需要分辨:(1)元件廠生產(chǎn)的十萬盒三極管,對(duì)儀器廠來說是滿意的(即一盒中至少有八只是一級(jí)品)盒子所占比例p是多少?(2)由于有十萬盒三極管,現(xiàn)在僅購買其中的一百盒,因而就面臨著另一種不定性。即假使已知此十萬盒中,滿意的盒子所占的比例為p,又怎樣能確定買來的一百盒中,滿意的占多少比例呢?例如p=0.99,即十萬盒中大約有九萬九千盒是滿意的,這個(gè)比例對(duì)儀器廠來說應(yīng)該是很好了,但也有可能發(fā)生這樣的意外,即儀器廠所購買的一百盒全部落在不滿意的大約一千盒之中。第一種不定性是不知道p,是我們對(duì)系統(tǒng)真實(shí)狀態(tài)的“無知”;而后一種不定性是由于所謂“隨機(jī)性”造成的。為了改善這不定性,儀器廠可要求元件廠對(duì)這批三極管的質(zhì)量進(jìn)行測試,也就是要求抽取部分三極管進(jìn)行測試,通過這部分中一級(jí)晶所占的比例(頻率)來對(duì)p的真實(shí)值進(jìn)行推斷,當(dāng)然我們不能完全精確地決定p,但是我們可以希望獲得一個(gè)(在某種意義下)比較好的判斷,這就涉及到怎樣設(shè)計(jì)試驗(yàn),決定觀察的數(shù)目.和怎樣利用試驗(yàn)觀察的結(jié)果作出一個(gè)好的“推斷”等,這些都是數(shù)理統(tǒng)計(jì)所要研究的問題。至于在已知p的條件下,第二種不定性的程度已在概率論基礎(chǔ)部分作過討論。數(shù)理統(tǒng)計(jì)研究的內(nèi)容隨著科學(xué)技術(shù)和生產(chǎn)的不斷發(fā)展而逐步擴(kuò)大。但概括地說可以分為兩大類:(1)試驗(yàn)的設(shè)計(jì)和研究,即研究如何更合理更有效地獲得觀察資料的方法;(2)統(tǒng)計(jì)推斷,即研究如何利用一定的資料對(duì)所關(guān)心的問題作出盡可能精確、可靠的結(jié)論。本課程只討論統(tǒng)計(jì)推斷。什么是統(tǒng)計(jì)學(xué)?統(tǒng)計(jì)學(xué)是一門關(guān)于數(shù)據(jù)資料的收集、整理、分析65概率論的基本概念數(shù)理統(tǒng)計(jì)的基本概念抽樣分布返回退出本章小結(jié)習(xí)題概率論的基本概念數(shù)理統(tǒng)計(jì)的基本概念返回退出本章小結(jié)66數(shù)理統(tǒng)計(jì)的基本概念總體和樣本統(tǒng)計(jì)量順序統(tǒng)計(jì)量和經(jīng)驗(yàn)分布函數(shù)返回繼續(xù)數(shù)理統(tǒng)計(jì)的基本概念總體和樣本返回繼續(xù)67我們今后所討論的統(tǒng)計(jì)問題主要屬于下面這種類型:從一個(gè)集合中選取一部分元素,對(duì)這部分元素的某些數(shù)量指標(biāo)進(jìn)行測量,根據(jù)測量獲得的這些數(shù)據(jù)來推斷這集合中全部元素的這些數(shù)量指標(biāo)的分布情況。在統(tǒng)計(jì)學(xué)中,我們把所研究的全部元素組成的集合稱為母體,或總體。而把組成母體的每個(gè)元素稱為個(gè)體,例如在研究某批燈泡的平均壽命時(shí),該批燈泡的全體就組成了母體,而其中每個(gè)燈泡就是個(gè)體。但是在統(tǒng)計(jì)里,由于我們關(guān)心的不是每個(gè)個(gè)體的種種具體特性,而僅僅是它的某一項(xiàng)或某幾項(xiàng)數(shù)量指標(biāo)X和該數(shù)量指標(biāo)X在總體中的分布情況。在上述例子中X是表示燈泡的壽命,就此數(shù)量指標(biāo)X而言,每個(gè)個(gè)體所總體、個(gè)體、樣本、樣本容量、樣本值我們今后所討論的統(tǒng)計(jì)問題主要屬于下面這種類型68取的值是不同的。在試驗(yàn)中,抽取了若干個(gè)個(gè)體就觀察到了x的這樣或那樣的數(shù)值,因而這個(gè)數(shù)量指標(biāo)X是一個(gè)隨機(jī)變量,而X的分布就完全描寫了總體中我們所關(guān)心的那個(gè)數(shù)量指標(biāo)的分布狀況。由于我們關(guān)心的正是這個(gè)數(shù)量指標(biāo),因此我們以后就把總體和數(shù)量指標(biāo)X可能取值的全體組成的集合等同起來,所謂總體的分布也就是指數(shù)量指標(biāo)x的分布。為了對(duì)總體的分布律進(jìn)行各種研究,就必須對(duì)總體進(jìn)行抽樣觀察,一般說來,我們還不止進(jìn)行一次抽樣觀察,而是進(jìn)行幾次觀察。通過觀察就得到總體指標(biāo)X的一組數(shù)值(x1,x2,…,xn),其中每個(gè)xi是一次抽樣觀察的結(jié)果。即某一個(gè)被觀察總體、個(gè)體、樣本、樣本容量、樣本值取的值是不同的。在試驗(yàn)中,抽取了若干個(gè)個(gè)體就觀察到了x的這樣69的個(gè)體的X指標(biāo)值,(x1,x2,…,xn)稱為容量為n的樣本的觀察值。由于我們是利用樣本觀察來對(duì)總體的分布進(jìn)行推斷,因而從總體中抽取樣本進(jìn)行觀察時(shí)必須是隨機(jī)的。所以對(duì)于隨機(jī)抽樣來說,對(duì)其某一次觀察結(jié)果而論,是完全確定的一組值,但它又是隨每次抽樣觀察而改變的,由于我們要依據(jù)這一觀察結(jié)果進(jìn)行分析推斷,并研究比較各種推斷方法的好壞,因而一般考慮問題時(shí),就不能把看為確定的數(shù)值,而應(yīng)該看作為隨機(jī)向量X=(X1,X2,…,Xn),稱它為容量是n的樣本,因而對(duì)樣本也有分布可言??傮w、個(gè)體、樣本、樣本容量、樣本值的個(gè)體的X指標(biāo)值,(x1,x2,…,xn)稱為容量為n的70我們抽取樣本的目的是為了對(duì)總體的分布律進(jìn)行各種分析推斷,因而要求抽取的樣本能很好地反映總體的特性,這就必須對(duì)隨機(jī)抽樣的方法提出一定的要求。通常提出下面兩點(diǎn):①代表性:要求樣本的每個(gè)分量Xi與所觀察的總體X具有相同的分布F(x);②獨(dú)立性:X1,X2,…,Xn為相互獨(dú)立的隨機(jī)變量,也就是說,每個(gè)觀察結(jié)果既不影響其他觀察結(jié)果,也不受其它觀察結(jié)果的影響。滿足上述兩點(diǎn)性質(zhì)的樣本稱為簡單隨機(jī)子樣。在今后如不作特殊聲明,所說的樣本將理解為簡單隨機(jī)樣本,對(duì)于簡單隨機(jī)樣本X=(X1,X2,…,Xn),其分布可以由總體X的分布函數(shù)F(x)簡單隨機(jī)樣本我們抽取樣本的目的是為了對(duì)總體的分布律進(jìn)行各71(或概率密度f(x))完全決定,X的分布函數(shù)為簡單隨機(jī)樣本(或概率密度f(x))完全決定,X的分布函數(shù)為簡單隨機(jī)樣本72在數(shù)理統(tǒng)計(jì)中,研究對(duì)象的全體稱為總體;組成總體的每個(gè)元素稱為個(gè)體。從總體中抽取的一部分個(gè)體,稱為總體的一個(gè)樣本;樣本中個(gè)體的個(gè)數(shù)稱為樣本的容量。從分布函數(shù)為F(x)的隨機(jī)變量X中隨機(jī)地抽取的相互獨(dú)立的n個(gè)隨機(jī)變量,具有與總體相同的分布,則X1,X2,…,Xn稱為從總體X得到的容量為n的隨機(jī)樣本,簡稱樣本。一次具體的抽取記錄x1,x2,…,xn是隨機(jī)變量X1,X2,…,Xn的一個(gè)觀察值??傮w與樣本在數(shù)理統(tǒng)計(jì)中,研究對(duì)象的全體稱為總體;組成總體的每個(gè)元素73例1A廠生產(chǎn)的某種電器的使用壽命服從指數(shù)分布,參數(shù)為未知,為此抽查了n件電器,測量其實(shí)際壽命。是確定本問題的總體,樣本及樣本的分布。例1A廠生產(chǎn)的某種電器的使用壽命服從指數(shù)分布,參數(shù)為未74樣本是總體的代表和反映,但在我們抽取樣本之后,并不直接利用樣本進(jìn)行推斷,而需要對(duì)樣本進(jìn)行一番“加工”和“提煉”,把樣本所包含的關(guān)于我們所關(guān)心的事物的信息集中起來,這便是針對(duì)不同的問題構(gòu)造出樣本的某種函數(shù),這種函數(shù)在統(tǒng)計(jì)學(xué)中稱為統(tǒng)計(jì)量。引進(jìn)統(tǒng)計(jì)量的目的是為了將雜亂無序的樣本值歸結(jié)為一個(gè)便于進(jìn)行統(tǒng)計(jì)推斷和研究分析的形式,集中樣本所含信息,使之更易揭示問題實(shí)質(zhì),從而解決問題。統(tǒng)計(jì)量中應(yīng)該不含有未知參數(shù),如果統(tǒng)計(jì)量中仍含有未知參數(shù),就無法依靠樣本觀測值求出未知參數(shù)的估計(jì)值,因而失去利用統(tǒng)計(jì)量估計(jì)未知參數(shù)的意義,這是違背我們引進(jìn)統(tǒng)計(jì)量的初衷的。統(tǒng)計(jì)量概念的引入樣本是總體的代表和反映,但在我們抽取樣本之后75來自總體X的樣本X1,X2,…,Xn的函數(shù)g(X1,X2,…,Xn),若是連續(xù)的且不含任何未知參數(shù),則稱為一個(gè)統(tǒng)計(jì)量。統(tǒng)計(jì)量來自總體X的樣本X1,X2,…,Xn的函數(shù)g(X1,76第六章樣本及抽樣分布課件77常用的統(tǒng)計(jì)量常用的統(tǒng)計(jì)量78常用的統(tǒng)計(jì)量常用的統(tǒng)計(jì)量79常用統(tǒng)計(jì)量的性質(zhì)常用統(tǒng)計(jì)量的性質(zhì)80常用統(tǒng)計(jì)量的性質(zhì)常用統(tǒng)計(jì)量的性質(zhì)81定理1的證明定理1的證明82定理2的證明定理2的證明83定理2的證明定理2的證明84定理2的證明定理2的證明85定理3的證明定理3的證明86例2設(shè)有一容量n=8的樣本觀察值為(8,6,7,5,7,8,9,6),求樣本均值及樣本方差的觀察值。例2設(shè)有一容量n=8的樣本觀察值為(8,6,7,5,7,87例3已知某種紗的強(qiáng)力服從N(1.56,0.222)(單位:千克)今抽取容量為n=50的樣本,求樣本均值小于1.45千克的概率。例3已知某種紗的強(qiáng)力服從N(1.56,0.222)(單位88設(shè)x1,x2,…,xn為總體X的一組觀察值,將它們按有小到大的順序排列,得到x1*≤x2*≤…xn*稱它為順序統(tǒng)計(jì)量。則稱它為經(jīng)驗(yàn)分布。順序統(tǒng)計(jì)量和經(jīng)驗(yàn)分布設(shè)x1,x2,…,xn為總體X的一組觀察值,將它們按89順序統(tǒng)計(jì)量和經(jīng)驗(yàn)分布順序統(tǒng)計(jì)量和經(jīng)驗(yàn)分布90抽樣分布正態(tài)總體樣本的線性函數(shù)的分布X2-分布t-分布F-分布正態(tài)母體子樣均值和方差的分布返回繼續(xù)抽樣分布正態(tài)總體樣本的線性函數(shù)的分布返回繼續(xù)91統(tǒng)計(jì)量是我們對(duì)母體的分布律或數(shù)字特征進(jìn)行推斷的基礎(chǔ),因此求統(tǒng)計(jì)量的分布是數(shù)理統(tǒng)計(jì)的基本問題之一。我們所感到興趣的是下面兩類問題.第一類問題是:對(duì)于任意一個(gè)自然數(shù)n,要找出給定的統(tǒng)計(jì)量Un=f(X1,X2,…,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論