中國醫(yī)科大學研究生醫(yī)學統(tǒng)計學 第三講 總體均數(shù)的估計與假設檢驗2_課件_第1頁
中國醫(yī)科大學研究生醫(yī)學統(tǒng)計學 第三講 總體均數(shù)的估計與假設檢驗2_課件_第2頁
中國醫(yī)科大學研究生醫(yī)學統(tǒng)計學 第三講 總體均數(shù)的估計與假設檢驗2_課件_第3頁
中國醫(yī)科大學研究生醫(yī)學統(tǒng)計學 第三講 總體均數(shù)的估計與假設檢驗2_課件_第4頁
中國醫(yī)科大學研究生醫(yī)學統(tǒng)計學 第三講 總體均數(shù)的估計與假設檢驗2_課件_第5頁
已閱讀5頁,還剩80頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第三講第三講 總體均數(shù)的估計與假設檢驗總體均數(shù)的估計與假設檢驗(第三章)(第三章)第一節(jié)第一節(jié) 均數(shù)的抽樣誤差均數(shù)的抽樣誤差 與標準誤與標準誤 統(tǒng)計推斷(statistical inference): 樣本 總體 (1)參數(shù)估計 (2)假設檢驗推斷 統(tǒng)計推斷:由樣本信息推斷總體特征統(tǒng)計推斷:由樣本信息推斷總體特征;即:以樣本統(tǒng)計量推斷總體參數(shù)。;即:以樣本統(tǒng)計量推斷總體參數(shù)。 抽樣誤差:由個體變異產(chǎn)生的、隨機抽樣誤差:由個體變異產(chǎn)生的、隨機抽樣造成的樣本統(tǒng)計量與總體參數(shù)的抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差別。差別。 造成抽樣誤差的原因:造成抽樣誤差的原因:1)抽樣)抽樣 2)個體差異個體差異

2、性質(zhì): (1)原分布正態(tài) 新分布正態(tài) 原分布偏態(tài) 新分布近似正態(tài) (2)原分布 N (,2 ) 新分布新分布 N( , ) 足夠大nxn2x x足夠大n原分布原分布 2 )總體101 n102 n10100 n1167.41x 2165.56x 100165.69x 10100 nX=X=12100.167.69100 xxx2()1.691xxxSn68. 110/3 . 510/ 新分新分布布 2)x均數(shù)的標準誤: (1)意義: (2)應用: nSnSSxX 標準差:(1)意義: (2)應用:1)(2 nxxSSx第二節(jié)第二節(jié) t 分布分布一、一、t 分布的概念分布的概念 2若若樣樣本本均

3、均數(shù)數(shù)X服服從從總總體體均均數(shù)數(shù)為為、總總體體標標準準差差為為X的的正正態(tài)態(tài)分分布布2( , )XN ,則則通通過過同同樣樣方方式式的的 u 變變換換(XX)也也可可將將其其轉(zhuǎn)轉(zhuǎn)換換為為標標準準正正態(tài)態(tài)分分布布 N(0, 12),即即 u 分分布布。 3實際工作中,由于實際工作中,由于 未知,未知,用用 代替,則代替,則 不再服不再服從標準正態(tài)分布,而服從從標準正態(tài)分布,而服從t 分布。分布。 XS()/XXSX, 1XXXtnSSn),(2 Nx xu) 1 , 0( Nu),(2nNx xxu ) 1 , 0 ()(Nxx nxxx/u未知nSxt/二、二、t 分布的圖形與特征分布的圖形與

4、特征 t 分分 布布 是是 一一 簇簇 曲曲 線線 。 當當 自自 由由 度度不不 同同 時時 , 曲曲 線線的的 形形 狀狀 不不 同同 。 當當 時時 , t 分分 布布 趨趨 近近 于于 標標 準準 正正態(tài)態(tài) 分分 布布 , 但但 當當 自自 由由 度度較較 小小 時時 , 與與 標標 準準 正正 態(tài)態(tài) 分分 布布 差差異異 較較 大大 。 其其 圖圖 形形 如如 下下 : t-5.0-4.0-3.0-2.0-1.00.01.02.03.04.05.0(標準正態(tài)曲線)=5=1f(t)圖3-3 不同自由度下的t 分布圖 單峰分布,以單峰分布,以 0 為中心,左右對稱;為中心,左右對稱; 自

5、由度自由度越小,則越小,則 t 值越分散,值越分散,t 分布的峰部分布的峰部越矮而尾部翹得越高;越矮而尾部翹得越高; 當當逼近逼近 , XS逼近逼近X, t 分布逼近分布逼近 u分布, 故標分布, 故標準正態(tài)分布是準正態(tài)分布是 t 分布的特例。分布的特例。 t 分布分布特征:特征: -tt0第三節(jié)第三節(jié) 總體均數(shù)的估計總體均數(shù)的估計一、參數(shù)估計一、參數(shù)估計 用樣本統(tǒng)計量推斷總體參數(shù)。用樣本統(tǒng)計量推斷總體參數(shù)。 總體均數(shù)估計:用樣本均數(shù)(和標準差)總體均數(shù)估計:用樣本均數(shù)(和標準差)推斷總體均數(shù)。推斷總體均數(shù)。 1點估計點估計(point estimation):就是用就是用相應樣本統(tǒng)計量直接作

6、為其總體參數(shù)的相應樣本統(tǒng)計量直接作為其總體參數(shù)的估計值。估計值。如用如用X估計估計、S 估計估計等。等。其其方法雖簡單,但未考慮抽樣誤差的大小。方法雖簡單,但未考慮抽樣誤差的大小。 2. 區(qū)間估計區(qū)間估計 按預先給定的概率按預先給定的概率(1 )所確定的包含所確定的包含未知總體參數(shù)的一個范圍。未知總體參數(shù)的一個范圍。 總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計:按預先給定的:按預先給定的概率概率(1 )所確定的包含未知總體均數(shù)的一所確定的包含未知總體均數(shù)的一個范圍。個范圍。1. 單一總體均數(shù)的可信區(qū)間單一總體均數(shù)的可信區(qū)間1)()(2/)(2/tSXtPXXXStXSt)(2/)(2/XStXXXS

7、tXX)(2/)(2/XStXStXX)(2/)(2/XStXStXX)(2/)(2/XXStXStX)(2/)(2/(2) 60n 時時:按按 u 分分布布。 已已知知: /2/2XXuu 即即 22XXXuXu 22(,)XXXuXu 未未知知但但 n 較較大大: /2/2XXuuS 即即 22XXXuSXuS 22(,)XXXuSXuS 常用u值表 參考范圍(%)三、可信區(qū)間的確切涵義三、可信區(qū)間的確切涵義 1. 95%的可信區(qū)間的理解:的可信區(qū)間的理解: (1)從正態(tài)總體中隨機抽?。恼龖B(tài)總體中隨機抽取100個樣本,可算得個樣本,可算得100個樣本個樣本均數(shù)和標準差,也可算得均數(shù)和標準

8、差,也可算得100個均數(shù)的可信區(qū)間,平均約個均數(shù)的可信區(qū)間,平均約有有95個可信區(qū)間包含了總體均數(shù)個可信區(qū)間包含了總體均數(shù) 。 (2)但在實際工作中,只能根據(jù)一次試驗結果估計可信區(qū))但在實際工作中,只能根據(jù)一次試驗結果估計可信區(qū)間,我們就認為該區(qū)間包含了總體均數(shù)間,我們就認為該區(qū)間包含了總體均數(shù) 。 (1)準確度準確度:用可信度(:用可信度(1 )表示:表示:即區(qū)間包即區(qū)間包含總體均數(shù)含總體均數(shù) 的理論概率大小的理論概率大小 。 當然它愈接近當然它愈接近1愈好,如愈好,如99%的可信區(qū)間比的可信區(qū)間比95%的的可信區(qū)間要好可信區(qū)間要好 。 (2)精確度精確度:即區(qū)間的寬度:即區(qū)間的寬度 區(qū)間愈

9、窄愈好,如區(qū)間愈窄愈好,如95%的可信區(qū)間比的可信區(qū)間比99%的可信的可信區(qū)間要好區(qū)間要好 。 當當n確定時,上述兩者互相矛盾。確定時,上述兩者互相矛盾。 提高準確度(可信度),則精確度降低提高準確度(可信度),則精確度降低 只提高可信度(可信區(qū)間會變寬),勢必降低可只提高可信度(可信區(qū)間會變寬),勢必降低可信區(qū)間的實際應用價值,故不能籠統(tǒng)認為信區(qū)間的實際應用價值,故不能籠統(tǒng)認為99%可可信區(qū)間比信區(qū)間比95%可信區(qū)間要好??尚艆^(qū)間要好。 相反,在實際應用中,相反,在實際應用中,95%可信區(qū)間更為常用??尚艆^(qū)間更為常用。 在可信度確定的情況下,增加樣本含量可減小區(qū)在可信度確定的情況下,增加樣本

10、含量可減小區(qū)間寬度間寬度 (減?。p小 ) ,提高精確度,提高精確度。XSt和)(2/四、總體均數(shù)可信區(qū)間與參考值范圍的區(qū)別四、總體均數(shù)可信區(qū)間與參考值范圍的區(qū)別 區(qū)別點 總體均數(shù)可信區(qū)間 參考值范圍 含 義 按預先給定的概率,確定的未知參數(shù) 的可能范圍。實際上一次抽樣算得的可信區(qū)間要么包含了總體均數(shù),要么不包含。但可以說:當=0.05 時,95%CI 估計正確的概率為 0.95,估計錯誤的概率小于或等于 0.05,即有 95%的可能性包含了總體均數(shù)。 “正常人”的解剖,生理,生化某項指標的波動范圍。 總體均數(shù)的可能范圍 個體值的波動范圍 計算 公式 未知: ,XXtS * 已知或未知但 n6

11、0:XXu或XXu S* 正態(tài)分布:Xu S * 偏態(tài)分布:PXP100X 用途 總體均數(shù)的區(qū)間估計 絕大多數(shù)(如 95%)觀察對象某項指標的分布范圍 第四節(jié)第四節(jié) 假設檢驗的基本原理和步驟假設檢驗的基本原理和步驟 假設檢驗過去稱顯著性檢驗。它是利用小假設檢驗過去稱顯著性檢驗。它是利用小概率反證法思想,從問題的對立面概率反證法思想,從問題的對立面(H0)出發(fā)出發(fā)間接判斷要解決的問題間接判斷要解決的問題(H1)是否成立。然后是否成立。然后在在H0成立的條件下計算檢驗統(tǒng)計量,最后成立的條件下計算檢驗統(tǒng)計量,最后獲得獲得P值來判斷。值來判斷。單側(cè)檢驗和雙側(cè)檢驗單側(cè)檢驗和雙側(cè)檢驗(根據(jù)(根據(jù) 研究目的

12、和專業(yè)知識選擇)研究目的和專業(yè)知識選擇) 雙側(cè)檢驗雙側(cè)檢驗:如要比較:如要比較A、B兩個藥兩個藥物的療效,無效假設為兩藥療效物的療效,無效假設為兩藥療效相同相同(H0:A=B),備擇假設是兩,備擇假設是兩藥療效不同藥療效不同(H1:AB),可能是,可能是A藥優(yōu)于藥優(yōu)于B藥,也可能藥,也可能B藥優(yōu)于藥優(yōu)于A藥,這就是雙側(cè)檢驗。藥,這就是雙側(cè)檢驗。 單側(cè)檢驗:若實際情況是A藥的療效不劣(差)于B藥,則備擇假設為A藥優(yōu)于B藥(H1:AB),此時,備擇假設成立時只有一種可能(另一種可能已事先被排除了),這就是單側(cè)檢驗。 備注:單側(cè)檢驗和雙側(cè)檢驗中計算單側(cè)檢驗和雙側(cè)檢驗中計算統(tǒng)計量統(tǒng)計量t的過程是一樣的

13、,但確定概的過程是一樣的,但確定概率時的率時的臨界值臨界值是不同的是不同的。 (3) 檢驗水準檢驗水準 ,過去稱顯著性水準,是預先,過去稱顯著性水準,是預先規(guī)定的概率值,它確定了小概率事件的標規(guī)定的概率值,它確定了小概率事件的標準。在實際工作中常取準。在實際工作中常取 = ??筛鶕?jù)不同研可根據(jù)不同研究目的給予不同設置。究目的給予不同設置。2. 計算檢驗統(tǒng)計量計算檢驗統(tǒng)計量 根據(jù)變量和資料類型、設計方案、統(tǒng)計推根據(jù)變量和資料類型、設計方案、統(tǒng)計推斷的目的、是否滿足特定條件等(如斷的目的、是否滿足特定條件等(如數(shù)據(jù)數(shù)據(jù)的分布類型的分布類型)選擇相應的檢驗統(tǒng)計量。)選擇相應的檢驗統(tǒng)計量。 3. 確定

14、確定P值值 P的含義是指從的含義是指從H0規(guī)定的總體隨機抽樣,抽規(guī)定的總體隨機抽樣,抽得等于及大于得等于及大于(或或/和等于及小于和等于及小于)現(xiàn)有樣本現(xiàn)有樣本獲得的檢驗統(tǒng)計量獲得的檢驗統(tǒng)計量(如如t、u等等)值的概率。值的概率。P 若若 ,則結論為按照檢驗水,則結論為按照檢驗水準,不拒絕準,不拒絕H0,差異無統(tǒng)計學意義,差異無統(tǒng)計學意義(統(tǒng)計結論)。(統(tǒng)計結論)。 例3-5 g/L 0?014036n 130.83 /xg L25.74 /sg L 對一個樣本均數(shù)與一個已知的或假設的總體均數(shù)0作比較,它們之間差別可能有兩種原因造成: 由于抽樣誤差所致, 由工作環(huán)境的原因,兩個總體均數(shù)間有本質(zhì)

15、差異。 第五節(jié)第五節(jié) t 檢驗檢驗 t 檢驗和檢驗和u 檢驗的應用條件檢驗的應用條件: 1. t 檢驗應用條件檢驗應用條件: 樣本含量樣本含量n較小時較小時(如如n60) (1)正態(tài)分布正態(tài)分布 (2)方差齊性方差齊性 2. u 檢驗應用條件檢驗應用條件: 樣本含量樣本含量n較大,或較大,或n雖小但總體標準差已知雖小但總體標準差已知 (1)正態(tài)分布正態(tài)分布 (2)方差齊性方差齊性單樣本檢驗 已知:未知但n較大未知但n較小nXu 0 nSXu0 nSXt0一、單樣本一、單樣本 t 檢驗檢驗 即樣本均數(shù) (代表未知總體均數(shù) )與已知總體均數(shù) 0(一般為理論值、標準值或經(jīng)過大量觀察所得穩(wěn)定值等)的比

16、較。其檢驗統(tǒng)計量按下式計算:X0, 1XXXXtnSSnSn 例例3-5 某醫(yī)生測量了某醫(yī)生測量了36名從事鉛作業(yè)男性工人的名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為血紅蛋白含量,算得其均數(shù)為130.83g/L,標準差,標準差為為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值不同于正常成年男性平均值140g/L? (1)建立檢驗假設,確定檢驗水準建立檢驗假設,確定檢驗水準 H0: = 0 =140g/L,即鉛作業(yè)男性工人平均血紅,即鉛作業(yè)男性工人平均血紅 蛋白含量與正常成年男性平均值相等蛋白含量與正常成年男性平均值相等 H1: 0

17、=140g/L,即鉛作業(yè)男性工人平均血紅,即鉛作業(yè)男性工人平均血紅 蛋白含量與正常成年男性平均值不等蛋白含量與正常成年男性平均值不等 (2)計算檢驗統(tǒng)計量計算檢驗統(tǒng)計量 本例 n=36,X=130.83g/L,S=25.74g/L, 0140g/L。按公式(3-15) 130.83 1402.138, 36 13525.7436t (3)確定確定P值,作出推斷結論值,作出推斷結論 以=35、2.1382.138t 查附表 2 的 t 界值表,因0.05/2,35t 2.138 0.02/2,35t,故雙尾概率 0.02P0.05。按 = 0.05 水準,拒絕 H0,接受 H1,有統(tǒng)計學意義。結

18、合本題可認為從事鉛作業(yè)的男性工人平均血紅蛋白含量低于正常成年男性。 二、配對二、配對t 檢驗檢驗 配對配對t 檢驗適用于配對設計的計量資料。檢驗適用于配對設計的計量資料。 配對設計類型配對設計類型:兩同質(zhì)受試對象分別接:兩同質(zhì)受試對象分別接受兩種不同的處理;同一受試對象分別受兩種不同的處理;同一受試對象分別接受兩種不同處理;同一受試對象接受兩種不同處理;同一受試對象(一種一種)處理前后。處理前后。檢驗統(tǒng)計量計算公式檢驗統(tǒng)計量計算公式0 , 1dddddddtnSSnSn 式中,式中,d 為每對數(shù)據(jù)的差值,為每對數(shù)據(jù)的差值,d為差值的樣本均數(shù),為差值的樣本均數(shù),dS為差值的標準差,為差值的標準差

19、,dS為差值樣本均數(shù)的標準誤,為差值樣本均數(shù)的標準誤,n 為為對子數(shù)。對子數(shù)。 例例3-6 為比較兩種方法對乳酸飲料中脂肪為比較兩種方法對乳酸飲料中脂肪含量測定結果是否不同,某人隨機抽取了含量測定結果是否不同,某人隨機抽取了10份乳酸飲料制品,分別用脂肪酸水解法份乳酸飲料制品,分別用脂肪酸水解法和哥特里和哥特里-羅紫法測定其結果如表羅紫法測定其結果如表3-3第第(1)(3)欄。問兩法測定結果是否不同?欄。問兩法測定結果是否不同?表表3-5兩種方法對乳酸飲料中脂肪含量的測定結果兩種方法對乳酸飲料中脂肪含量的測定結果編 號 (1) 哥特里羅紫法 (2) 脂肪酸水解法 (3) 差值 d (4)=(2

20、)(3) 1 0.840 0.580 0.260 2 0.591 0.509 0.082 3 0.674 0.500 0.174 4 0.632 0.316 0.316 5 0.687 0.337 0.350 6 0.978 0.517 0.461 7 0.750 0.454 0.296 8 0.730 0.512 0.218 9 1.200 0.997 0.203 10 0.870 0.506 0.364 2.724 (1)建立檢驗假設,確定檢驗水準建立檢驗假設,確定檢驗水準 H0: d0,即兩種方法的測定結果相同,即兩種方法的測定結果相同 H1: d0,即兩種方法的測定結果不同,即兩種方法

21、的測定結果不同 (2)計算檢驗統(tǒng)計量計算檢驗統(tǒng)計量(3)確定確定P值,作出推斷結論值,作出推斷結論 查附表查附表2的的t界值表得界值表得P0.50。按=0.05 水準,不拒絕 H0,無統(tǒng)計學意義。還不能認為阿卡波糖膠囊與拜唐蘋膠囊對空腹血糖的降糖效果不同。 若兩總體方差不等若兩總體方差不等 若變量變換后總體方差齊性若變量變換后總體方差齊性可采用可采用t 檢驗檢驗(如兩樣本幾何均數(shù)的如兩樣本幾何均數(shù)的t 檢驗,就是將原檢驗,就是將原始數(shù)據(jù)取對數(shù)后進行始數(shù)據(jù)取對數(shù)后進行t 檢驗檢驗); 若變量變換后總體方差仍然不齊若變量變換后總體方差仍然不齊 可采用可采用t檢驗或檢驗或Wilcoxon秩和檢驗。秩

22、和檢驗。第六節(jié)第六節(jié) 假設檢驗注意事項假設檢驗注意事項一、兩類錯誤 和檢驗功效(一)型錯誤(typeerror) 1定義:型錯誤是指拒絕了實際上成立的H0,即“棄真”的錯誤。(用表示)。 2確定:研究者可根據(jù)不同研究目 的 來 確 定 水 平 。 如 規(guī) 定=0.05,當拒絕H0時,理論上100次檢驗中平均有5次發(fā)生此類錯誤。表示檢驗有意義的水準,故亦稱檢驗水準。 (二)型錯誤(type error) 1定義:型錯誤是指接受了實際上不成立的H0,即“存?zhèn)巍钡腻e誤。(用表示)。 2確定:只有與特定的H1結合起來才有意義,但的大小很難確切估計。 僅知n 確定時, 且 的唯一辦法是 n小結:小結:

23、I 型錯誤:型錯誤:“實際無差別,但下了有差別的結論實際無差別,但下了有差別的結論”,假陽性錯誤假陽性錯誤。犯這種錯誤的概率是。犯這種錯誤的概率是 (其值等其值等于檢驗水準于檢驗水準) II型錯誤型錯誤:“實際有差別,但下了不拒絕實際有差別,但下了不拒絕H0的結的結論論”,假陰性錯誤假陰性錯誤。犯這種錯誤的概率是。犯這種錯誤的概率是 (其值其值未知未知) 。 但但 n 一定時,一定時, 增大,增大, 則減少則減少 。 1- :檢驗效能檢驗效能(power):當當兩總體確有差別,兩總體確有差別,按按檢驗水準檢驗水準 所能發(fā)現(xiàn)這種差別的能力。所能發(fā)現(xiàn)這種差別的能力。二、假設檢驗應注意的問題二、假設檢驗應注意的問題 要有嚴密的研究設計要有嚴密的研究設計 不同的資料應選用不同檢驗方法不同的資料應選用不同檢驗方法 正確理解正確理解“顯著性顯著性”一詞的含義一詞的含義 結論不能絕對化結論不能絕對化 統(tǒng)計統(tǒng)計“顯著性顯著性”與醫(yī)學與醫(yī)學/ /臨床臨床/ /生物學生物學“顯著性顯著性” 可信區(qū)間與假設檢驗各有不同作用,要結合使用可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論