統(tǒng)計學講義稿_第1頁
統(tǒng)計學講義稿_第2頁
統(tǒng)計學講義稿_第3頁
統(tǒng)計學講義稿_第4頁
統(tǒng)計學講義稿_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第五章 統(tǒng)計量及其分布在概率論的學習中,我們已經(jīng)知道,隨機變量及其概率分布全面描述了隨機現(xiàn)象的統(tǒng)計規(guī)律性,但在實際問題的研究中概率分布往往是未知的。我們要討論統(tǒng)計量的分布,找到總體參數(shù)與統(tǒng)計量的分布之間的聯(lián)系,進而通過樣本去推斷總體的數(shù)字特征。第一節(jié) 總體與樣本1.總體統(tǒng)計學把所要研究的事物或現(xiàn)象的全體稱為總體,而把構(gòu)成總體的每個元素(成員)稱為個體。要研究10,000名在校大學生,10,000名大學生就構(gòu)成總體,每位大學生就是個體。實際問題的研究中,我們關(guān)心的往往不是大學生(個體)的一切方面,而是它的某個數(shù)量標志,比如大學生的身高,這時所有的身高就構(gòu)成總體,總體表現(xiàn)為一個數(shù)據(jù)集,其中有的數(shù)值

2、大有的數(shù)值小,有的出現(xiàn)機會多,有的出現(xiàn)機會少,記身高為X,它是一個隨機變量,記其分布函數(shù)為F(x) ??梢园裍的所有可能取值看做總體,并稱這一總體為具有分布函數(shù)F(x)的總體。總體也可以是多維的,如研究大學生的身高對體重的影響,身高和體重這兩個數(shù)量標志就構(gòu)成二維隨機向量(X1,X2),其取值的全體就構(gòu)成總體,即二維總體,記二維隨機向量(X1,X2)的聯(lián)合分布函數(shù)為F(x1, x2),稱這一總體為具有分布函數(shù)F(x1, x2)的總體。2.樣本統(tǒng)計學對總體的研究是以樣本為工具的。為了掌握總體的分布規(guī)律,從總體中隨機抽取n個個體,其標志值(比如身高數(shù)值)記為(x1,x2,xn),則(x1,x2,xn

3、)稱為總體的一個樣本,樣本包含的個體的數(shù)目n稱為樣本容量。由于樣本是從總體中隨機抽取的,抽取前無法預知它的數(shù)值,每個Xi(1,2,n)都是一個隨機變量,樣本(X1,X2,Xn)則是一個n維隨機向量。樣本在抽取后就有確定的觀測值,表現(xiàn)為n個具體的數(shù)據(jù)(x1,x2,xn)。3. 簡單隨機樣本抽取樣本是手段,推斷總體才是目的。為使樣本更好的反映總體的信息,對樣本抽取有兩個基本要求。一是樣本具有隨機性,總體中每個個體都有同等可能性進入樣本,即每個Xi與總體X具有相同的分布F(x)。二是樣本滿足獨立性,即X1,X2,Xn相互獨立,每一Xi的取值不影響另一Xi的取值。如果從總體中抽取樣本(),其每個分量(

4、)都與總體具有相同的概率分布,且相互獨立,則這樣的抽樣方法稱為簡單隨機抽樣,而如此得到的樣本,稱為簡單隨機樣本。如果總體具有分布函數(shù)或概率密度,顯然來自總體的簡單隨機樣本()具有聯(lián)合概率分布或聯(lián)合概率密度。4.總體分布函數(shù)與樣本分布函數(shù)樣本是總體的代表,簡單隨機樣本能較好的代表總體,其代表性到底如何呢?設(shè)x1,x2,xn是取自分布函數(shù)為F(x)的總體的樣本,將樣本觀測值按升序排列,記為x(1),x(2),x(n),定義如下函數(shù) 則Fn(x)是一非減右連續(xù)函數(shù),且滿足 Fn(-)=0 Fn(+)=1由此可見,F(xiàn)n(x)是一個分布函數(shù),稱為樣本分布函數(shù)(經(jīng)驗分布函數(shù))。對于每一固定的x,F(xiàn)n(x)

5、是事件X x發(fā)生的頻率,當n固定時,不同的樣本觀測值x1,x2,xn將有不同的Fn(x),F(xiàn)n(x)是一隨機變量。格里紋科定理:設(shè)x1,x2,xn是取自總體分布函數(shù)(理論分布函數(shù))為F(x)的樣本,F(xiàn)n(x)是樣本分布函數(shù),有定理表明,當n充分大時,樣本分布函數(shù)是總體分布函數(shù)的一個良好的近似,這就是為什么我們用樣本推斷總體的理由。第二節(jié) 統(tǒng)計量及其分布 1.統(tǒng)計量設(shè)()為來自總體的一個樣本,則稱不包含任何未知參數(shù)的實值函數(shù)為一個統(tǒng)計量。例如,是從正態(tài)總體中抽出的樣本,其中,是未知參數(shù),則,都是統(tǒng)計量,因為它們不含有未知參數(shù)。而 , 則不是統(tǒng)計量。必須注意,統(tǒng)計量中不能含有未知參數(shù),但允許含有已

6、知參數(shù)。例如:設(shè)總體X N(,2),從中抽取一個樣本(X1,X2,Xn),那么,當 ,2 已知時,是一個統(tǒng)計量,而當,2 中有一個未知時,就不是統(tǒng)計量了。雖然統(tǒng)計量的構(gòu)造不依賴于未知參數(shù),但統(tǒng)計量的分布一般是依賴未知參數(shù)的。統(tǒng)計量是一個隨機變量,統(tǒng)計量的分布稱為抽樣分布。2.常用統(tǒng)計量設(shè)()是從總體中抽取的樣本,稱統(tǒng)計量為樣本均值,稱統(tǒng)計量為樣本方差;而稱為樣本標準差;稱統(tǒng)計量為樣本階原點矩;稱統(tǒng)計量為樣本階中心矩。顯然 3.樣本均值的數(shù)學期望與方差設(shè)是來自具有均值及方差的總體的簡單隨機樣本()的均值,則,證明 由此可知,不論總體的分布如何,從中抽樣,其樣本均值的數(shù)學期望與總體的期望相等,而方

7、差則是總體方差的倍。當樣本()是由有限總體的無放回抽樣所得的樣本時,由于它的個分量()不能假定為相互獨立,因此定理中的第2個公式不再成立,而需要乘上一個修正因子,即有以下定理。設(shè)()是取自容量為且有均值及方差的有限總體的無放回樣本,則,證明從略。由于當時,修正因子的數(shù)值接近1,故修正因子一般在總體有限而樣本容量大于總體的5%的情況下使用。第三節(jié) 抽樣分布1.三大抽樣分布(1)若隨機變量,則其密度函數(shù)為。在數(shù)理統(tǒng)計中,經(jīng)常假定總體所服從的分布是正態(tài)分布,其主要的原因自然是這個正態(tài)分布的常見性。另一方面,正態(tài)總體的情形比較容易處理,而總體服從其它分布的統(tǒng)計量的精確分布往往是非常復雜的。(2)若是相

8、互獨立的隨機變量,且均服從于標準正態(tài)分布,則服從分布。分布的密度函數(shù)為其中是它的參數(shù),稱為自由度。隨機變量是服從自由度為的分布,以后簡記為,下圖是分布的密度函數(shù)曲線。(3)若,且與相互獨立,則隨機變量服從自由度為的分布,且記為。分布的密度函數(shù)為。下圖是分布的密度函數(shù)曲線。(4)若與是相互獨立的隨機變量,分別服從自由度為m和n的分布。則隨機變量服從自由度為的分布,簡記為,分布的密度函數(shù)為下圖是分布的密度函數(shù)曲線。如果,由定義易知對給定的,應有 即 從而得 又因為 比較兩式可得 如。分布,分布和分布的密度函數(shù)中都出現(xiàn)了函數(shù),它是數(shù)學分析中的一種特殊函數(shù),形式為。上式中的積分很難直接計算,同樣這三種

9、分布的分布函數(shù)也是很難直接求解,因為采用制表的方法給出它的數(shù)值,在實際應用中可查表求的隨機變量落在各區(qū)間中的概率。這里特別提請注意的是分布的對稱性,它的密度函數(shù)曲線是關(guān)于直線對稱的,因此一般只給出的數(shù)值,這一點與這個態(tài)分布的情形相似。2.來自正態(tài)總體的統(tǒng)計量的分布本節(jié)介紹取自正態(tài)總體的一些統(tǒng)計量的精確分布,這些分布在后面的統(tǒng)計推斷中常常要用到。定理1 設(shè)()是來自正態(tài)總體的一個樣本,則(1)樣本均值 (2)統(tǒng)計量 證明 前已證得 又由概率論的知識知,服從正態(tài)分布的隨機變量的線性函數(shù)仍服從正態(tài)分布,故所以 定理2 設(shè)()是來自正態(tài)總體的一個樣本,則樣本均值與樣本方差相互獨立,并且有證明從略。定理

10、3 設(shè)()是來自正態(tài)總體的一個樣本,則統(tǒng)計量證明 由定理1 知 由定理2 知 且與相互獨立。因為相互獨立的隨機變量的線性函數(shù)依然相互獨立,故與相互獨立。再由三大抽樣分布知定理4 設(shè)()和分別是來自正態(tài)總體和的兩個樣本,它們相互獨立,則統(tǒng)計量其中 ,證明 易知 所以 從而得 由給定的條件及定理知,并且他們相互獨立,再由分布的可加性知于是,由定義知顯然,當時應有定理5 設(shè)()和分別是來自正態(tài)總體和的兩個樣本,它們相互獨立,則統(tǒng)計量證明 由定理知,因兩個樣本相互獨立,所以與也相互獨立,從而由定義可知顯然,當時應有3.來自非正態(tài)總體的樣本均值的近似分布當樣本來自非正態(tài)總體時,其樣本均值的抽樣分布又是怎

11、樣的呢?為了回答這一問題,先來回顧概率論中的獨立同分布中心極限定理。設(shè)隨機變量相互獨立,服從同一分布,且具有有限的期望和方差,則隨機變量的分布函數(shù)對任意,滿足當很大時,近似地有而由可知,當很大時,近似地有這就是說,若容量為的簡單隨機樣本取自有限均值及方差的總體,無論這個總體服從何種分布,當很大時,其樣本均值均近似服從正態(tài)分布,這一結(jié)論有廣泛的適用性。因為就實際情況而論,一般變量的變化范圍都是有限的,故其均值和方差必定是有限的。中心極限定理的條件,應用時容易被滿足。一般情況下,當樣本容量時,的抽樣分布均能很好地接近正態(tài)分布。但總體方差往往未知,這時如何求的近似分布呢?考慮統(tǒng)計量當很大時(一般即可

12、),近似于正態(tài)分布,所以近似于分布,又當很大時,分布近似于,故當很大時,近似地有從而近似地有 4.比率的抽樣分布如果一個隨機變量試驗只有兩種結(jié)果與,則這樣的試驗稱為貝努利試驗,若記隨機變量則所服從的分布為貝努利分布或分布,其分布律為,式中參數(shù)為出現(xiàn)事件(即狀態(tài)1)的概率,為出現(xiàn)事件(即狀態(tài)0)的概率。當所考察的總體只有兩種狀態(tài)時,則總體服從貝努利分布。如產(chǎn)品檢驗時,任取1件產(chǎn)品,可以是合格品也可以是不合格品。若記則服從貝努利分布,而參數(shù)便是這批產(chǎn)品的不合格品率。若從總體中抽取一個容量為的樣本(),則每個也只能取1或0兩個值中的一個,從而的和實際表示狀態(tài)1在樣本中出現(xiàn)的次數(shù),進而樣本平均值則表示狀態(tài)1在容量為的樣本中出現(xiàn)的比率;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論