《分布類型的檢驗》PPT課件_第1頁
《分布類型的檢驗》PPT課件_第2頁
《分布類型的檢驗》PPT課件_第3頁
《分布類型的檢驗》PPT課件_第4頁
《分布類型的檢驗》PPT課件_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三部分常用假設(shè)檢驗方法,第10章分布類型的檢驗,10.1假設(shè)檢驗的基本思想10.2正態(tài)分布檢驗10.3二項分布檢驗10.4游程檢驗10.5本章小結(jié),第11章連續(xù)變量的統(tǒng)計推斷(一)t檢驗,11.1t檢驗基礎(chǔ)11.2樣本均數(shù)與總體均數(shù)的比較11.3成組設(shè)計兩樣本均數(shù)的比較11.4配對設(shè)計樣本均數(shù)的比較11.5本章小結(jié),10.1假設(shè)檢驗的基本思想,10.1.1問題的提出10.1.2假設(shè)檢驗的基本思想10.1.3假設(shè)檢驗的兩類錯誤10.1.4假設(shè)檢驗中的其他問題,10.1.1問題的提出,在總體的分布函數(shù)完全未知或只知其形式,但不知其參數(shù)的情況下,為了推斷總體的某些性質(zhì),提出某些關(guān)于總體的假設(shè)。例如,提出總體服正態(tài)分布的假設(shè);對正態(tài)總體提出均值等于a0的假設(shè)等等。假設(shè)檢驗就是根據(jù)樣本對所提出的假設(shè)作出判斷:是接受,還是拒絕。,10.1.1問題的提出,假設(shè)檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計推斷方法。,10.1.2假設(shè)檢驗的基本思想,如何利用樣本值對一個具體的假設(shè)進行檢驗?通常借助于直觀分析和理論分析相結(jié)合的做法,其基本原理就是人們在實際問題中經(jīng)常采用的所謂小概率反證法思想。小概率思想是指小概率事件(P5;這意味著,至少樣本均值應(yīng)該大于5;,10.1.2假設(shè)檢驗的基本思想,至于是否顯著,依檢驗結(jié)果而定。檢驗結(jié)果顯著(significant)意味著有理由拒絕零假設(shè)。因此,假設(shè)檢驗也被稱為顯著性檢驗(significanttest)。,10.1.2假設(shè)檢驗的基本思想,有了兩個假設(shè),就要根據(jù)數(shù)據(jù)來對它們進行判斷。數(shù)據(jù)的代表是作為其函數(shù)的統(tǒng)計量;它在檢驗中被稱為檢驗統(tǒng)計量(teststatistic)。根據(jù)零假設(shè)(不是備選假設(shè)?。?,可得到該檢驗統(tǒng)計量的分布;再看這個統(tǒng)計量的數(shù)據(jù)實現(xiàn)值(realization)屬不屬于小概率事件。,10.1.2假設(shè)檢驗的基本思想,也就是說把數(shù)據(jù)代入檢驗統(tǒng)計量,看其值是否落入零假設(shè)下的小概率范疇;如果的確是小概率事件,那么就有可能拒絕零假設(shè),或者說“該檢驗顯著?!狈駝t說“沒有足夠證據(jù)拒絕零假設(shè)”,或者“該檢驗不顯著。”,10.1.2假設(shè)檢驗的基本思想,在零假設(shè)下,檢驗統(tǒng)計量取其實現(xiàn)值及(沿著備選假設(shè)的方向)更加極端值的概率稱為p-值(p-value)。如果得到很小的p-值,就意味著在零假設(shè)下小概率事件發(fā)生了。如果小概率事件發(fā)生,是相信零假設(shè),還是相信數(shù)據(jù)呢?當(dāng)然多半是相信數(shù)據(jù),拒絕零假設(shè)。,10.1.2假設(shè)檢驗的基本思想,但小概率并不能說明不會發(fā)生,僅僅發(fā)生的概率很小罷了。拒絕正確零假設(shè)的錯誤常被稱為第一類錯誤(typeIerror)。在備選假設(shè)正確時反而說零假設(shè)正確的錯誤,稱為第二類錯誤(typeIIerror)。,10.1.2假設(shè)檢驗的基本思想,零假設(shè)和備選假設(shè)哪一個正確,是確定性的,沒有概率可言。而可能犯錯誤的是人。涉及假設(shè)檢驗的犯錯誤的概率就是犯第一類錯誤的概率和犯第二類錯誤的概率。負責(zé)任的態(tài)度是無論做出什么決策,都應(yīng)該給出該決策可能犯錯誤的概率。,10.1.2假設(shè)檢驗的基本思想,到底p-值是多小時才能夠拒絕零假設(shè)呢?也就是說,需要有什么是小概率的標準。這要看具體應(yīng)用的需要。但在一般的統(tǒng)計書和軟件中,使用最多的標準是在零假設(shè)下(或零假設(shè)正確時)根據(jù)樣本所得的數(shù)據(jù)來拒絕零假設(shè)的概率應(yīng)小于0.05,當(dāng)然也可能是0.01,0.005,0.001等等。,10.1.2假設(shè)檢驗的基本思想,這種事先規(guī)定的概率稱為顯著性水平(significantlevel),用字母alpha來表示。alpha并不一定越小越好,因為這很可能導(dǎo)致不容易拒絕零假設(shè),使得犯第二類錯誤的概率增大。,10.1.2假設(shè)檢驗的基本思想,當(dāng)p-值小于或等于alpha時,就拒絕零假設(shè)。所以,alpha是所允許的犯第一類錯誤概率的最大值。當(dāng)p-值小于或等于alpha時,拒絕原假設(shè)H0,就說這個檢驗是顯著的。無論統(tǒng)計學(xué)家用多大的alpha作為顯著性水平都不能脫離實際問題的背景。統(tǒng)計顯著不一定等價于實際顯著。反過來也一樣。,10.1.2假設(shè)檢驗的基本思想,實際上,多數(shù)計算機軟件僅僅給出p-值,這有很多方便之處。比如alpha=0.05,而假定所得到的p-值等于0.001。這時如果采用p-值作為新的顯著性水平,即新的alpha=0.001,于是就可以說,在顯著性水平為0.001時,拒絕零假設(shè)。,10.1.2假設(shè)檢驗的基本思想,這樣,拒絕零假設(shè)時犯錯誤的概率實際只是千分之一而不是舊的alpha所表明的百分之五。在這個意義上,p-值又稱為觀測的顯著性水平(observedsignificantlevel)。在統(tǒng)計軟件輸出p-值的位置,有的用“p-value”,有的用significant的縮寫“Sig”就是這個道理。,10.1.2假設(shè)檢驗的基本思想,歸納起來,假設(shè)檢驗的一般步驟為:1.寫出零假設(shè)和備選假設(shè);2.確定檢驗統(tǒng)計量;3.確定顯著性水平;4.根據(jù)數(shù)據(jù)計算檢驗統(tǒng)計量的實現(xiàn)值;5.根據(jù)這個實現(xiàn)值計算p-值;,10.1.2假設(shè)檢驗的基本思想,6.進行判斷:如果p-值小于或等于alpha,就拒絕零假設(shè),這時犯(第一類)錯誤的概率最多為alpha;如果p-值大于alpha,就不拒絕零假設(shè),因為證據(jù)不足。,10.1.4假設(shè)檢驗中的其他問題,(1)做假設(shè)檢驗之前,應(yīng)注意資料本身是否有可比性。(2)當(dāng)差別有統(tǒng)計學(xué)意義時應(yīng)注意這樣的差別在實際應(yīng)用中有無意義。(3)根據(jù)資料類型和特點選用正確的假設(shè)檢驗方法。(4)根據(jù)專業(yè)及經(jīng)驗確定是選用單側(cè)檢驗還是雙側(cè)檢驗。,10.1.4假設(shè)檢驗中的其他問題,(5)當(dāng)檢驗結(jié)果為拒絕無效假設(shè)時,應(yīng)注意有發(fā)生I類錯誤的可能性,即錯誤地拒絕了本身成立的H0,發(fā)生這種錯誤的可能性預(yù)先是知道的,即檢驗水準那么大;當(dāng)檢驗結(jié)果為不拒絕無效假設(shè)時,應(yīng)注意有發(fā)生II類錯誤的可能性,即仍有可能錯誤地接受了本身就不成立的H0,發(fā)生這種錯誤的可能性預(yù)先是不知道的,但與樣本含量和I類錯誤的大小有關(guān)系。,10.1.4假設(shè)檢驗中的其他問題,(6)判斷結(jié)論時不能絕對化,應(yīng)注意無論接受或拒絕檢驗假設(shè),都有判斷錯誤的可能性。(7)報告結(jié)論時是應(yīng)注意說明所用的統(tǒng)計量,檢驗的單雙側(cè)及P值的確切范圍。,10.2正態(tài)分布檢驗,10.2.1K-S檢驗的原理10.2.2分析實例,10.2.1K-S檢驗的原理,單樣本的Kolmogorov-Smirnov檢驗(K-S檢驗,柯爾莫哥諾夫-斯米爾諾夫檢驗)是用來檢驗一個數(shù)據(jù)的觀測累積分布是否是已知的理論分布。設(shè)總體XF(x),F(xiàn)(x)是未知的,F(xiàn)0(x)是一個給定的分布函數(shù),欲檢驗H0:F(x)=F0(x),10.2.1K-S檢驗的原理,由于當(dāng)n較大時,理論上有經(jīng)驗分布函數(shù)Fn(x)是F(x)的良好近似。構(gòu)造KolmogorovSmirnov統(tǒng)計量,來反映F(x)和F0(x)之間的差異,若D較小,表明二者間沒有顯著差異,否則有顯著差異。,10.2.1K-S檢驗的原理,KolmogorovSmirnov證明了統(tǒng)計量D的極限分布為Q()分布,計算出,記為Z值,并根據(jù)極限分布計算出相應(yīng)的顯著性概率,若Sig.小于給點的顯著性水平alpha,則拒絕H0,否則,接受H0.,10.2.2分析實例,例12.1請判斷SPSS自帶數(shù)據(jù)集anxity.sav中score的分布是否服從正態(tài)分布。操作如下:AnalyzeNonparametictest1-sampleK-STestvariablelist框:選入scoreTestdistribution復(fù)選框組:選中normal復(fù)選框單擊OK鈕系統(tǒng)給出的統(tǒng)計分析結(jié)果,具體如下:,數(shù)據(jù)文件,操作過程,由于p=Sig.=0.6520.05,故接受原假設(shè),認為score服從正態(tài)分布。,注意,K-S檢驗可以檢驗正態(tài)分布,均勻分布,泊松分布,指數(shù)分布。,10.3二項分布檢驗,10.3.1二項分布檢驗的原理10.3.2分析實例,10.3.1二項分布檢驗的原理,當(dāng)一個變量只取0,1值時,稱為二分值變量。當(dāng)一個問題只有兩種可能結(jié)果時,稱為二分值問題。二分值問題的一種結(jié)果稱為“成功”,另一種稱為“失敗”。二項分布檢驗(BinomialTest)就是對二分值問題的成功概率進行檢驗。,10.3.1二項分布檢驗的原理,設(shè)S+表示對二分值問題進行n次試驗中成功的次數(shù)。例如用同樣的方法擲一枚硬幣100次,出現(xiàn)正面44次,出現(xiàn)反面56次,問該硬幣是否均勻?該例中S+=44,S-=56,檢驗假設(shè)為:H0:p=p0=0.5當(dāng)H0為真時,S+服從參數(shù)為P0的二項分布。,10.3.1二項分布檢驗的原理,計算S+的值,并根據(jù)二項分布計算相應(yīng)的顯著性概率Sig.,若Sig.小于給定的顯著性水平alpha,則拒絕H0,否則接受拒絕H0。因為是基于二項分布的概率進行判斷,所以此種檢驗法稱為二項分布檢驗法。當(dāng)試驗總次數(shù)n較大時,S+近似服從正態(tài)分布。所以往往根據(jù)正態(tài)分布計算Sig.的近似值。,10.3.2分析實例,例10.6根據(jù)以往經(jīng)驗,新生兒染色體異常率一般為1%,現(xiàn)某醫(yī)院觀察了當(dāng)?shù)毓?00名新生兒,只發(fā)現(xiàn)一例染色體異常。數(shù)據(jù)見binominal.sav,該地新生兒染色體異常率是否低于一般?,10.3.2分析實例,原假設(shè):H0:p=0.01,異常率并無不同備擇假設(shè):H1:pBinomialTestVariable:染色體異常率illTestProportion:0.01,10.3.2分析實例,Sig=.090(按正態(tài)分布近似計算)0.05,不能拒絕原假設(shè),尚不能認為異常率低于一般。,10.4游程檢驗,10.4.1游程檢驗的原理10.4.2分析實例,10.4.1游程檢驗的原理,游程檢驗(Runstest)與二項分布檢驗都是對二分值問題進行檢驗,但它不是對“成功”概率進行檢驗,而是檢驗多個二分值問題之間是否相互獨立?原假設(shè)H0:多個二分值問題之間獨立游程檢驗是基于游程數(shù)的多少來檢驗,那么什么是游程呢?,10.4.1游程檢驗的原理,游程就是0,1序列中0或者1的連續(xù)段,即0或1的每個連續(xù)段稱為一個游程。設(shè)天氣預(yù)報記錄20天是否下雨的情況,得到以下序列(1表示下雨,0表示不下雨)00110111000100100010,研究者想知道某一天下雨或不下雨對以后天氣是否下雨有無影響?易知該記錄總游程數(shù)U=11。,10.4.1游程檢驗的原理,如果原假設(shè)H0成立,則0,1序列交替均勻,從而總游程數(shù)U較大,否則U較小。所以,我們可以通過總游程數(shù)U的大小來判斷H0是否成立。選擇U為檢驗統(tǒng)計量,當(dāng)樣本數(shù)n較大時,U近似服從正態(tài)分布。根據(jù)相應(yīng)分布計算p值,然后做出判斷。,10.4.2分析實例,設(shè)天氣預(yù)報記錄20天是否下雨的情況,得到以下序列(1表示下雨,0表示不下雨)00110111000100100010,研究者想知道某一天下雨或不下雨對以后天氣是否下雨有無影響?建立數(shù)據(jù)文件見右圖所示,10.4.2分析實例,AnalyzeNonparametricTestsRunsTestVariable:下雨否CutPoint:Custom:1注意:有時在一些數(shù)據(jù)表中所檢驗的變量不是二分值變量,如教材例10.7,此時需要給定一個分割點(CutPoint),把它轉(zhuǎn)化為二分值變量。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論