數(shù)理統(tǒng)計(jì)課件:樣本和樣本分布_第1頁(yè)
數(shù)理統(tǒng)計(jì)課件:樣本和樣本分布_第2頁(yè)
數(shù)理統(tǒng)計(jì)課件:樣本和樣本分布_第3頁(yè)
數(shù)理統(tǒng)計(jì)課件:樣本和樣本分布_第4頁(yè)
數(shù)理統(tǒng)計(jì)課件:樣本和樣本分布_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

樣本和樣本分布1.3.1樣本1樣本空間為推斷總體分布及各種特征,按一定規(guī)則從總體中抽取一定數(shù)量的個(gè)體進(jìn)行觀測(cè),以獲得有關(guān)總體的信息,這一過(guò)程稱(chēng)為“抽樣”.抽取的部分個(gè)體稱(chēng)為樣本.定義1.3.1(樣本空間)設(shè)X1,X2,…,Xn是從總體中抽取的樣本,其樣本空間定義如下:樣本X1,X2,…,Xn可能取值的全體的集合,稱(chēng)為樣本空間,記為χ

.例1.3.1(1)假定一批產(chǎn)品有10000件,其中有合格品也有廢品.為

估計(jì)廢品率,往往從中抽取一部分,抽取100件進(jìn)行

檢查,該問(wèn)題中樣本空間是什么?解:樣本空間

(2)打靶試驗(yàn),每次打三發(fā),考察中靶的環(huán)數(shù).

如樣本X=(5,1,9)表示三次打靶分別中5環(huán),1環(huán)和9環(huán),該問(wèn)題中樣本空間是什么?解:樣本空間樣本的兩重性是指,樣本既可看成隨機(jī)變量,又可看成具體的數(shù).抽樣前抽樣后它被看成是隨機(jī)變量它是具體的數(shù)值2樣本的兩重性

(1)樣本是隨機(jī)變量抽到哪5輛是隨機(jī)的容量為n的樣本可以看作n維隨機(jī)向量(X1,X2,…,Xn).(2)一旦觀測(cè)到一組樣本得到的是n個(gè)具體的數(shù)(x1,x2,…,xn),稱(chēng)為容量為n的樣本的觀察值.但若在相同條件下再打三發(fā),由于種種不可控制的隨機(jī)因素的影響,中靶的環(huán)數(shù)不大可能和上一次完全一樣,這就是樣本的隨機(jī)性.如果無(wú)窮打下去,每次打三發(fā),出現(xiàn)的結(jié)果可視為隨機(jī)向量(X1,X2,X3)的具體觀察值.例1.3.1(2)打靶問(wèn)題中,樣本X=(X1,X2,X3),其中0≤Xi≤10(i=1,2,3)為整數(shù),它們是數(shù)字向量.

如我們從某班大學(xué)生中欲抽取10人測(cè)量身高,用X1,X2,…,X10表示10個(gè)人的身高.進(jìn)行試驗(yàn)后,得到10個(gè)數(shù),x1,x2,…,x10,它們是樣本取到的值.我們只能觀察到隨機(jī)變量取的值而見(jiàn)不到隨機(jī)變量.注:總體、樣本、樣本值的關(guān)系最常用的一種抽樣方法叫作“簡(jiǎn)單隨機(jī)抽樣”,要求抽取的樣本滿(mǎn)足下面兩點(diǎn)要求總體中每個(gè)個(gè)體被抽到是等可能的,即:X1,X2,…,Xn中每個(gè)個(gè)體與所考察的總體X有相同的分布.代表性抽樣的目的是為了對(duì)總體分布中某些未知的量進(jìn)行統(tǒng)計(jì)推斷,為了使抽取的樣本能很好地反映總體的信息,必須考慮抽樣方法.樣本中每個(gè)個(gè)體取什么值,不影響其他個(gè)體的取值,即:抽取的個(gè)體X1,X2,…,Xn是相互獨(dú)立的隨機(jī)變量.獨(dú)立性3簡(jiǎn)單隨機(jī)樣本設(shè)有一總體X,具有分布F,X1,X2,…,Xn

是從總體X中抽取的容量為n的樣本.若(1)X1,X2,…,Xn相互獨(dú)立;(2)X1,X2,…,Xn與總體X有相同的分布,即同有分布F.則稱(chēng)X1,X2,…,Xn是從總體X

中抽取的容量為n的簡(jiǎn)單隨機(jī)樣本,簡(jiǎn)稱(chēng)樣本.定義1.3.2(簡(jiǎn)單隨機(jī)樣本)若總體X的分布函數(shù)為F(x)(或密度函數(shù)f(x)),也稱(chēng)X1,X2,…,Xn是來(lái)自總體分布函數(shù)F(x)(或密度函數(shù)f(x))的樣本,記為

X1,X2,…,Xni.i.d.

X1~F(x)或

X1~f(x)n稱(chēng)為樣本容量.樣本X1,X2,…,Xn也可看作n維隨機(jī)向量(X1,X2,…,Xn).簡(jiǎn)單隨機(jī)樣本是應(yīng)用中最常見(jiàn)的情形,今后,當(dāng)說(shuō)到“X1,X2,…,Xn

是取自某總體的樣本”時(shí),若不特別說(shuō)明,就指簡(jiǎn)單隨機(jī)樣本.X1,X2,…,Xn的觀察值x1,x2,…,xn,稱(chēng)為樣本值,又稱(chēng)為X的n個(gè)的獨(dú)立的觀察值.若x1,x2,…,xn與y1,y2,…,yn都是相應(yīng)于樣本X1X1,X2,…,Xn的樣本值,一般來(lái)說(shuō),它們是不同的.總體(理論分布)樣本樣本值?統(tǒng)計(jì)是從手中已有的資料--樣本值,去推斷總體的情況---總體分布F(x)的性質(zhì).樣本是聯(lián)系二者的橋梁1.3.2樣本分布樣本是隨機(jī)變量,有概率分布,這個(gè)概率分布稱(chēng)為樣本分布.樣本分布可由總體分布完全確定.樣本分布是樣本受隨機(jī)性影響最完整的描述.設(shè)總體X的分布函數(shù)為F(x)=P{X≤x},X1,X2,…,Xn是來(lái)自總體X的樣本,由于X1,X2,…,Xn相互獨(dú)立且與總體X有相同的分布則樣本X1,X2,…,Xn的聯(lián)合分布函數(shù)為設(shè)總體X是離散型隨機(jī)變量,其分布列為pi=P{X=xi}

,

i=1,2,…X1,X2,…,Xn是來(lái)自總體X的樣本,則樣本X1,X2,…,Xn的聯(lián)合分布列為設(shè)總體X是連續(xù)型隨機(jī)變量,其密度函數(shù)為f(x),X1,X2,…,Xn是來(lái)自總體X的樣本則樣本X1,X2,…,Xn的聯(lián)合密度函數(shù)為設(shè)二維總體(X,Y)的分布函數(shù)為是來(lái)自總體(X,Y)的樣本,設(shè)總體(X,Y)是二維連續(xù)型隨機(jī)變量,其密度函數(shù)為f(x,y),則樣本(X1,Y1)

,(X2,Y2)

,…,(Xn

,Yn)的聯(lián)合密度函數(shù)為則樣本(X1,Y1)

,(X2,Y2)

,…,(Xn

,Yn)

的聯(lián)合分布函數(shù)為解:由于總體其密度函數(shù)為例1.3.2設(shè)X1,X2,…,Xn是來(lái)自正態(tài)總體的樣本,求樣本X1,X2,…,Xn的聯(lián)合密度函數(shù).因此,樣本X1,X2,…,Xn的聯(lián)合密度函數(shù)為例1.3.3設(shè)X1,X2,…,Xn是來(lái)自?xún)牲c(diǎn)分布總體B(1,p),0<p

<

1,的樣本,求樣本X1,X2,…,Xn的聯(lián)合分布列.解:由于總體X~B(1,p),其分布列為其中x=0或x=1.解:樣本

X1,X2,…,Xn

的聯(lián)合分布列為其中k為觀察值x1,x2,…,xn

中1的個(gè)數(shù),k=0,1,…,n.例1.3.4為估計(jì)一物件的重量μ,用一架天平將該物體重復(fù)測(cè)量n次,結(jié)果記為X1,X2,…,Xn.求X1,X2,…,Xn的分布.針對(duì)該問(wèn)題需要進(jìn)行一些假定假定1各次測(cè)量相互獨(dú)立假定2各次測(cè)量在相同條件下進(jìn)行:X1,X2,…,Xn同分布為確定X1,X2,…,Xn的分布,在以上假定下求出X1的分布即可.X1,X2,…,Xn是相互獨(dú)立的隨機(jī)變量考慮測(cè)量誤差的特性:這種誤差一般由大量的、彼此獨(dú)立起作用的隨機(jī)因素疊加而成,而每一個(gè)所起作用都很小.由概率論的中心極限定理可知這種誤差近似服從正態(tài)分布.再假定天平?jīng)]有系統(tǒng)誤差,則可進(jìn)一步假定此誤差服從均值為0,方差為σ2的正態(tài)分布.從而X1

(可以視為X1

=μ+ε,物重與誤差之和)的概率分布為正態(tài)分布N(μ,

σ2).因此,樣本X1,X2,…,Xn的聯(lián)合密度函數(shù)為1.3.3分布族一參數(shù)和參數(shù)空間例1.3.2總體分布和樣本分布中的μ和σ2,例1.3.3總體分布和樣本分布中的p

都是確定分布的未知常數(shù),這些常數(shù)的不同取值對(duì)應(yīng)不同的總體分布和樣本分布,只要確定了這些常數(shù)的值,相應(yīng)的總體分布和樣本分布也都確定了.稱(chēng)出現(xiàn)在總體分布或樣本分布中的未知常數(shù)為參數(shù).在一些問(wèn)題中,參數(shù)雖然未知,但根據(jù)參數(shù)的性質(zhì)可以給出參數(shù)的取值范圍.例1.3.2中,參數(shù)空間為定義1.3.3(參數(shù)空間)參數(shù)所有可能取值全體構(gòu)成的集合稱(chēng)為參數(shù)空間,記為Θ.例1.3.3中,參數(shù)空間為二總體分布族和樣本分布族由于不同的參數(shù)值一般對(duì)應(yīng)于不同的總體分布,因此參數(shù)空間中所有可能的參數(shù)值對(duì)應(yīng)于一族總體分布,稱(chēng)該分布族為總體分布族.由于不同的參數(shù)值一般對(duì)應(yīng)于不同的樣本分布,因此參數(shù)空間中所有可能的參數(shù)值對(duì)應(yīng)于一族樣本分布,稱(chēng)該分布族為樣本分布族.例1.3.2中,若μ和σ2都為未知參數(shù),則總體分布族為樣本分布族為參數(shù)μ和σ2的每個(gè)可能值對(duì)應(yīng)于一個(gè)具體的分布..例1.3.3中,若p為未知參數(shù),則總體分布族為樣本分布族為參數(shù)p的每個(gè)可能值對(duì)應(yīng)于一個(gè)具體的分布..設(shè)X1,X2,...,Xn是來(lái)自指數(shù)分布總體E(λ)的樣本,其中λ>0未知?jiǎng)t樣本分布族為參數(shù)

的每個(gè)可能值對(duì)應(yīng)于一個(gè)具體的分布..隨機(jī)現(xiàn)象用隨機(jī)變量刻畫(huà),數(shù)理統(tǒng)計(jì)學(xué)的第一前提條件是:隨機(jī)變量的概率分布未知,因此樣本分布族至少包含兩個(gè)分布.設(shè)總體密度函數(shù)(或分布列)為f(x,

),其中

為未知參數(shù),參數(shù)空間為Θ,總體分布族可以表示為樣本分布族可以表示為兩點(diǎn)分布族二項(xiàng)分布族泊松分布族均勻分布族指數(shù)分布族正態(tài)分布族常見(jiàn)的總體分布族:三統(tǒng)計(jì)模型和統(tǒng)計(jì)推斷樣本分布族及參數(shù)空間給出了所考慮的統(tǒng)計(jì)問(wèn)題的總的范圍.樣本分布族反映了對(duì)所研究統(tǒng)計(jì)問(wèn)題的了解程度及對(duì)抽樣方式的規(guī)定,稱(chēng)樣本分布族為統(tǒng)計(jì)模型.分布族越小,做出的結(jié)論可能更精確和更可靠.模型只取決于樣本的分布,常把分布的名稱(chēng)稱(chēng)為模型的名稱(chēng).例如,正態(tài)分布模型(正態(tài)模型),兩點(diǎn)分布模型

從總體中抽取一定大小的樣本去推斷總體概率分布的方法稱(chēng)為統(tǒng)計(jì)推斷.數(shù)理統(tǒng)計(jì)是著手于樣本,著眼于總體,任務(wù)是利用樣本推斷總體.當(dāng)總體分布形式已知,但是含有若干未知參數(shù)時(shí),只需要對(duì)總體中的這些未知參數(shù)進(jìn)行推斷,這類(lèi)問(wèn)題稱(chēng)為參數(shù)統(tǒng)計(jì)推斷問(wèn)題.若總體的分布形式完全未知,或者只有一些一般性的限制.例如,假定總體分布是離散型或連續(xù)型,對(duì)稱(chēng)分布或偏態(tài)分布等,需要對(duì)總體分布形式進(jìn)行推斷,這類(lèi)問(wèn)題稱(chēng)為非參數(shù)統(tǒng)計(jì)推斷問(wèn)題.例1.3.5某車(chē)間生產(chǎn)的鋼管直徑X服從正態(tài)分布N(100,0.52),現(xiàn)從一批鋼管中隨機(jī)抽取10根,測(cè)得其內(nèi)直徑(單位:mm)的平均值為100.15,假定方差不變,問(wèn)該批生產(chǎn)的鋼管是否符合要求?如何根據(jù)抽樣的結(jié)果判斷鋼管的平均直徑是否為參數(shù)統(tǒng)計(jì)推斷μ=100關(guān)心問(wèn)題

如何根據(jù)抽樣提供的信息,判斷是否成立X~P(λ)非參數(shù)統(tǒng)計(jì)推斷關(guān)心問(wèn)題統(tǒng)計(jì)模型的確定依賴(lài)于抽取樣本的方式,以及基于現(xiàn)有結(jié)論的假定(如例1.3.4).

很多性質(zhì)不一樣的問(wèn)題可以歸入到同一模型下.如:

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論