衛(wèi)生統(tǒng)計(jì)學(xué)講義紹興醫(yī)學(xué)繼續(xù)教育_第1頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)講義紹興醫(yī)學(xué)繼續(xù)教育_第2頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)講義紹興醫(yī)學(xué)繼續(xù)教育_第3頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)講義紹興醫(yī)學(xué)繼續(xù)教育_第4頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)講義紹興醫(yī)學(xué)繼續(xù)教育_第5頁(yè)
已閱讀5頁(yè),還剩94頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一單元概述.定義統(tǒng)計(jì)學(xué)(Statistics):是研究數(shù)據(jù)的收集、整理、分析的一門科學(xué)。衛(wèi)生統(tǒng)計(jì)學(xué)(healthstatistics):是研究居民健康狀況以及干生服務(wù)領(lǐng)域中數(shù)據(jù)的設(shè)計(jì)、的隼、壑理與分析推斷的一門學(xué)科。.統(tǒng)計(jì)工作的步驟(1)統(tǒng)計(jì)設(shè)計(jì)根據(jù)研究的目的,從統(tǒng)計(jì)學(xué)的角度對(duì)各步提前做出的周密的計(jì)劃和安排。主要分為:實(shí)驗(yàn)設(shè)計(jì)和調(diào)杳設(shè)計(jì)。(2)收集資料根據(jù)研究目的、實(shí)驗(yàn)設(shè)計(jì)的要求,收集準(zhǔn)確的、完整的、充滿信息的原始資料。收集資料的方式:直接觀察、采訪、填表、通信、實(shí)驗(yàn)室等形式。統(tǒng)計(jì)資料主要來(lái)自:衛(wèi)生統(tǒng)計(jì)報(bào)表;經(jīng)常性工作記錄;專題調(diào)查或?qū)嶒?yàn)研究。(3)整理資料就是將收集來(lái)的資料有目的,有計(jì)劃地進(jìn)行科學(xué)加工,有些資料有問(wèn)題要去掉或重新審核,有些資料要?dú)w成組,以便分析。(4)分析資料就是將經(jīng)過(guò)統(tǒng)計(jì)整理的結(jié)果,作一系列統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷,闡明事物的規(guī)律性。.資料的類型數(shù)值變量與分類變量。變量的具體表現(xiàn)形式:數(shù)值變量:計(jì)量資料(定量資料)對(duì)每個(gè)觀察單位用定量方法測(cè)定某項(xiàng)指標(biāo)的數(shù)值大小所得的資料。特點(diǎn):有計(jì)量單位,如患者的身高(cm)、體重(kg)、血壓(mmHg)、脈搏(次/分)、紅細(xì)胞計(jì)數(shù)(1012L)。分類變量(定性資料或分類資料):其觀察值是定性的,表現(xiàn)為互不相容的類別或?qū)傩?。分為兩種情況:(1)計(jì)數(shù)資料按性質(zhì)或類別進(jìn)行分組,然后再清點(diǎn)各組數(shù)目所得的資料。包括:二項(xiàng)分類和多項(xiàng)分類。特點(diǎn):無(wú)固有計(jì)量單位,如膚色(黑、白)、性別(男、女)、血型A、B、AB、0)、職業(yè)(工、農(nóng)、兵)。(2)等級(jí)資料將觀察單位按某項(xiàng)指標(biāo)的等級(jí)順序分組,再清點(diǎn)各組觀察單位的個(gè)數(shù)所得的資料。特點(diǎn):半定性或半定量的觀察結(jié)果。有序多分類(ordinalcategorydata)。①癌癥分期:早、中、晚。②藥物療效:治愈、好轉(zhuǎn)、無(wú)效、死亡。③尿蛋白:-,土,+,++,+++及以上。

表1 某病患者部分體■征及化驗(yàn)結(jié)果病例性別年齡肝腫大白細(xì)胞總中性粒細(xì)胞尿蛋日住院天治療□情而^xw7l所占比例(%)數(shù)氏)結(jié)果(1)⑵⑶⑷⑸⑹⑺⑻1男18+8.780+25治愈2男21+4.97838治愈3男23+9.488±42無(wú)效4男2010.382+29無(wú)效5支20+10.786+++51無(wú)效6支22+14.486+++51死亡7男1920.586++28死亡8男21+5.980+30好轉(zhuǎn)9男21+5.980+30好轉(zhuǎn)三類資料間關(guān)系例:測(cè)量了140人20?40歲成年人的血壓。例;測(cè)量了140人20?40歲成年人的血壓等級(jí)資料<?低血壓8-等級(jí)資料<?低血壓8-正常血壓12?輕度高血壓15?中度高血壓17?重度高血壓計(jì)量資料計(jì)數(shù)資料以12kPa為界分為正常與異常兩組,統(tǒng)計(jì)每組例數(shù).幾組基本概念(1)總體與樣本總體:根據(jù)研究的目的所劃定范圍內(nèi)的同質(zhì)的個(gè)體構(gòu)成的全體,所有同質(zhì)觀察單位某種觀察值(即變量值)的集合。樣本:總體中隨機(jī)抽取的一部分觀察單位的觀測(cè)值的集合。樣本要具有:代表性、隨機(jī)性和可靠性。(2)誤差泛指觀測(cè)值與真實(shí)值之差,以及樣本指標(biāo)與總體指標(biāo)之差。系統(tǒng)誤差:由于某種原因,可使觀測(cè)結(jié)果造成傾向性的偏大或偏小。隨機(jī)測(cè)量誤差:沒(méi)有固定的傾向,可使觀測(cè)結(jié)果有大有小。抽樣誤差:由于抽樣造成的樣本指標(biāo)與總體指標(biāo)之間的差別。(3)參數(shù)和統(tǒng)計(jì)量參數(shù):總體的數(shù)值特征稱為參數(shù),用希臘字母表示。統(tǒng)計(jì)量:根據(jù)樣本算得的某些數(shù)值特征稱為統(tǒng)計(jì)量,用英文字母表示。(4)概率與頻率表2某試臉者拋擲硬幣的試璇概率是度量隨機(jī)事件A發(fā)生可能性大小的一個(gè)數(shù)量,記為P(A)。頻率若在n次同樣的隨機(jī)試驗(yàn),事件A發(fā)生了k次,則比值k/n稱為頻率??梢宰C明:若當(dāng)試驗(yàn)次數(shù)n充分大以后,頻率k/n穩(wěn)定地在某一確定值P的附近擺動(dòng)。TOC\o"1-5"\h\z可用事件A的頻率作為所求概率的近似值: 0.30P(A)7f(A)=k/n。 7 0.35頻率與概率的關(guān)系: 26 0.52拋擲硬幣的試驗(yàn),試驗(yàn)結(jié)果如表2。 0.52歷史上許多名家做過(guò)拋擲硬幣的試驗(yàn),拋擲硬幣試驗(yàn)結(jié)果如表3。表34大拋擲硬幣試驗(yàn)結(jié)果試驗(yàn)者拋擲次數(shù)(n)出現(xiàn)止面次數(shù)也)頻率(k/n)DeMorgan204810610.518Buffon4,04020480.5069Pearson12,00060190.5016Pearson24,000120120.5005第二單元定量資料的統(tǒng)計(jì)描述、頻數(shù)分布表與直方圖1.頻數(shù)分布表例1、現(xiàn)有145例糞鏈球菌食物中毒病人,其潛伏期分布如表4所示。表4婁鏈球菌食物中毒潛伏期潛伏期(小時(shí))頻數(shù)(f)累計(jì)頻數(shù)1818日?456312?40103比?3013324?613930?013936-414342?2145

表5某地144名正常成年男子紅細(xì)胞數(shù)頻數(shù)表組段頻數(shù)£4.2?24.4?44.6?74.B?165.0?205.2?255.4?245.6-225.8-166.0?26.2?56.4?日.612.直方圖3.頻數(shù)分布類型(1)對(duì)稱分布:指集中位置在中間,左右兩側(cè)的頻數(shù)基本對(duì)稱。(2)偏態(tài)分布:又稱不對(duì)稱型分布,指頻數(shù)分布不對(duì)稱,集中位置偏向一側(cè)。若集中位置偏向數(shù)值較小的一側(cè),稱為正偏態(tài):若集中位置偏向數(shù)值較大的一側(cè),稱為負(fù)偏態(tài)。二、集中位置的描述(平均數(shù)average)1.定義

反映計(jì)量資料的集中趨勢(shì)(位置)或反映計(jì)量資料的數(shù)量水平的指標(biāo)。2.常用平均數(shù)的計(jì)算(1)算術(shù)均數(shù)應(yīng)用條件:描述單峰對(duì)稱分布資料,特別是正態(tài)分布或近似正態(tài)分布資料的集中位置。計(jì)算:直接法:即將所有觀察值X1,X,……Xn直接相加,再除以觀察值的個(gè)數(shù)n,計(jì)算公式為:加權(quán)法:受/團(tuán)+加權(quán)法:受/團(tuán)+4凡+…+九x=當(dāng)二口£Z+--+A例1、9例氯丙烯中毒的患者腓總神經(jīng)的傳導(dǎo)速度(米/秒)記錄如下:55.941.244.150.741.945.250.742.843.7(2)幾何均數(shù)應(yīng)用條件:原始觀察值呈偏態(tài)分布,但經(jīng)過(guò)對(duì)數(shù)變換后呈正態(tài)分布或近似正態(tài)分布的資料,如血清抗體滴度等。計(jì)算:G=#J=1g-1(2絲,直接法: 犬加權(quán)法:加權(quán)法:例2、5個(gè)人的血清滴度為:1:21:41:81:161:32求:平均滴度G

G=^2x4x8xl6x32=8或lgG=lg2+lg4+lg8+lgl6+lg32=omG=lg-10.903=8故平均滴度為1:8。(3)中位數(shù)應(yīng)用條件:適用于各種分布的資料,實(shí)際工作中常用來(lái)描述不對(duì)稱分布的資料、兩端無(wú)確切值或分布不明確的資料的集中位置。意義:中位數(shù)是將一組觀察值按大小順序排列后位次居中的數(shù)值。計(jì)算:直接計(jì)算法:例:1.00.9例:1.00.90.91.00.91.04.52.22.22.22.24.53.43.46.9例:1.00.9例:1.00.90.91.00.91.04.52.22.22.22.24.53.43.46.96.96.94.5中位數(shù)為2.24.56.9中位數(shù)為(2.2+3.4)/2=2.8計(jì)算公式為:當(dāng)n為奇數(shù)時(shí).M=X (n+1)/2當(dāng)n為偶數(shù)時(shí),MutX.4Xv式中:X式中:X(n+1)/2、%/2、匯/2+1為有序數(shù)列中相應(yīng)位次上的觀察值。中位數(shù)的頻數(shù)表計(jì)算法:河=4+:5石0%-二⑴其中:J為中位數(shù)所在組段下限;i為中位數(shù)所在組段的組距;以為中位數(shù)所在組段的頻數(shù);二五為中位數(shù)所在組段前所有組段的累計(jì)頻數(shù)。例3、現(xiàn)有145例糞鏈球菌食物中毒病人,其潛伏期分布如表6所示。表6糞建球菌食物中毒潛伏期潛伏期(小時(shí))頻數(shù)(f)累計(jì)頻數(shù)1818g?456312?4010318-3013324?613930?0139的?414342?2145中位:145X50%=72.5中位數(shù):M=12+6(145X50%—63)/40=13.4中位數(shù)的推廣:百分位數(shù)。其中:Lx為Px所在組段下限;i為該組段的組距;fx為該組段的頻數(shù);-尤為所在組段前所有組段的累計(jì)頻數(shù)。例4、測(cè)得某地200名正常人發(fā)汞值(〃g/g),其資料見(jiàn)表7,試計(jì)算以、P75表7某地28名正常人發(fā)汞值g/g)組段(5(1)頻數(shù)f⑵頻率(%)(3)累計(jì)頻數(shù)⑷累計(jì)頻率(%)(5)0.3?2010.02010.00.T?5025.07035.01.1?4623.011658.01.5?3015.014673.0L9?2512.517185.52.3?168.018793.52.T?63.019396.53.1?42.019798.53.5?21.019999.53.9—4.310.5200100.0合計(jì)200100.0%=0.7+—(200x25%-20)=0.9心且/g)^5=1.9+—(200x75%-146)=1.96C/^g/g)25習(xí)題:.衛(wèi)生統(tǒng)計(jì)工作步驟可分為:A.統(tǒng)計(jì)研究調(diào)查、設(shè)計(jì)、收集資料、分析資料B.統(tǒng)計(jì)研究調(diào)查、統(tǒng)計(jì)描述、統(tǒng)計(jì)推斷C.統(tǒng)計(jì)研究設(shè)計(jì)、收集資料、整理資料、分析資料D.統(tǒng)計(jì)研究收集、整理資料、統(tǒng)計(jì)描述、統(tǒng)計(jì)推斷E.統(tǒng)計(jì)研究設(shè)計(jì)、統(tǒng)計(jì)描述、統(tǒng)計(jì)推斷、統(tǒng)計(jì)圖表『正確答案』C.為了搞好統(tǒng)計(jì)工作,達(dá)到預(yù)期目標(biāo),最重要的是:A.原始資料要多B.原始資料要真實(shí)可靠C.整理資料要詳細(xì)D.分析資料要先進(jìn)E.統(tǒng)計(jì)計(jì)算精度要高『正確答案』.統(tǒng)計(jì)資料的類型包括:A.頻數(shù)分布資料和等級(jí)分類資料B.多項(xiàng)分類資料和二項(xiàng)分類資料C.正態(tài)分布資料和頻數(shù)分布資料D.數(shù)值變量資料和等級(jí)資料E.數(shù)值變量資料和分類變量資料『正確答案』E.抽樣誤差是指:A.樣本指標(biāo)與總體指標(biāo)之間由于抽樣產(chǎn)生的差別B.由于抽樣產(chǎn)生的各觀察值之間的差別C.通過(guò)統(tǒng)一的標(biāo)準(zhǔn)可以減少D.參數(shù)與統(tǒng)計(jì)量之間由于過(guò)失而產(chǎn)生的差別E.以上均不對(duì)『正確答案』A.計(jì)量資料,計(jì)數(shù)資料和等級(jí)資料三者的關(guān)系是:A.計(jì)數(shù)資料兼有計(jì)量資料和等級(jí)資料的一些性質(zhì)B.等級(jí)資料又稱為半計(jì)數(shù)資料C.計(jì)量資料有計(jì)數(shù)資料和等級(jí)資料的一些性質(zhì)D.等級(jí)資料兼有計(jì)數(shù)資料和計(jì)量資料的一些性質(zhì)E.以上均不對(duì)『正確答案』.用兩種不同成份的培養(yǎng)基(分別為701批與702批)分別培養(yǎng)鼠疫桿菌,重復(fù)試驗(yàn)單元數(shù)為5個(gè),將48小時(shí)內(nèi)各試驗(yàn)單元上生長(zhǎng)的活菌數(shù)記錄如下:701批:4884 90 123171702批:90116 124 22584那么該資料的類型為:A.計(jì)數(shù)資料B.計(jì)量資料C.等級(jí)資料D.名義性資料E.以上均不是『正確答案』.某醫(yī)院用某種新療法治療某病患者41人,治療結(jié)果如下:治療結(jié)果:治愈顯效好轉(zhuǎn)惡化死亡治療人數(shù):8 23 6 3 1該資料的類型為:A.計(jì)數(shù)資料.計(jì)量資料C.等級(jí)資料D.名義資料E.以上均不是『正確答案』C三、變異程度(離散程度的描述)現(xiàn)有甲、乙、丙三組數(shù)據(jù)甲組60708090100乙組7075808590丙組607580851001、極差(Range)K^最大值^最小值R武100—60=40R乙=90—70=20R丙=100—60=402、方差:描述對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料變異程度的指標(biāo)??傮w方差用b2表示,樣本方差用S2表示。3、標(biāo)準(zhǔn)差(StandardofDeviation)直接法一一計(jì)算公式:加權(quán)法計(jì)算公式:4、,四分位數(shù)間距:反映了一組觀察值按從小到大的順序排列后,中間一半觀察值的波動(dòng)范圍。QU—QL=P75-P25適用于非正態(tài)分布?。“俜治粩?shù):指將觀察值從小到大排列后,處于第x百分位上的數(shù)值,用符號(hào)Px表示。5、變異系數(shù)(CoefficientofVariance)變異系數(shù)也稱離散系數(shù),用CV表示。其計(jì)算公式為:cy=£xioo%四、正態(tài)分布及其應(yīng)用1、正態(tài)分布的概念和特性圖2.2頻數(shù)分布逐漸接近正態(tài)分布示意圖如果將觀察人數(shù)逐漸增多,組距也不斷縮小,圖中直條將逐漸變窄,整個(gè)圖形將逐漸接近于一條光滑的曲線,即接近于近似正態(tài)分布曲線。正態(tài)分布的密度函數(shù):/W=-k/32bM:總體均數(shù),o總體標(biāo)準(zhǔn)差。正態(tài)分布的特性(1)正態(tài)分布曲線略呈鐘形;(2)正態(tài)分布以均數(shù)p為中心,左右對(duì)稱;(3)正態(tài)分布有兩個(gè)參數(shù),即均數(shù)p和標(biāo)準(zhǔn)差o。(4)正態(tài)分布曲線下的面積分布有一定的規(guī)律。

正態(tài)分布曲線下的面積分布規(guī)律:標(biāo)準(zhǔn)正態(tài)分布:均數(shù)為0,標(biāo)準(zhǔn)差為1的正態(tài)分布,稱為標(biāo)準(zhǔn)正態(tài)分布,即X?N(0,1)。任何正態(tài)分布X?N(p,o2)經(jīng)過(guò)Z變換,均服從標(biāo)準(zhǔn)正態(tài)分布。Z變換又稱為標(biāo)準(zhǔn)化變換,其公式如下:對(duì)于任意X?N(p,o2),當(dāng)p,o取值不同時(shí),正態(tài)曲線下任意兩點(diǎn)(XjX2)范圍內(nèi)的曲線下面積會(huì)不限但其標(biāo)準(zhǔn)正態(tài)分布曲線下(Z「ZJ范圍內(nèi)的曲線下面積則是相等的,,其中叮 仃。因此,可以編制標(biāo)準(zhǔn)正態(tài)曲線下面積分布表,即標(biāo)準(zhǔn)正態(tài)分布表,對(duì)于正態(tài)分布X?N(p,o2),均可借助此表估計(jì)正態(tài)分布曲線下任意兩點(diǎn)(X,X)范圍內(nèi)的面積。1 2

2.正態(tài)分布的應(yīng)用估計(jì)醫(yī)學(xué)正常值范圍:醫(yī)學(xué)參考值范圍是指絕大多數(shù)正常人的人體形態(tài)、功能和代謝產(chǎn)物等各種生理及生化指標(biāo)的波動(dòng)范圍。這里的“絕大多數(shù)”可以是90%、95%或99%,最常用的是95%。(1)近似正態(tài)法對(duì)于正態(tài)分布嗖似正態(tài)分布的資料,只要樣本含量足夠大(N〉100)時(shí),可用:作為雙側(cè)95%的正常值范圍。單側(cè)時(shí)界值為1.645。g/irnlCC"工4/古代國(guó)里'工3能,X+2.5SS)a雙側(cè)99%正常值范圍:140名成年男子的紅細(xì)胞數(shù),其和分別為:均數(shù)4.78(X1012/L)標(biāo)準(zhǔn)差0.37(X1012/L)因此,其95%正常值范圍可定為:(4.78—1.96X0.37,4.78+1.96X0.37)X1012/L即(4.06,5.51)X1012/L。(2)百分位數(shù)法應(yīng)用條件:偏態(tài)分布資料。95計(jì)算公式:雙側(cè)界值:P單側(cè)上界:P單側(cè)下界:P95例題:1.各觀察值均加(或減)同一數(shù)后A.均數(shù)不變,標(biāo)準(zhǔn)差改變B.均數(shù)改變,標(biāo)準(zhǔn)差不變C.兩者均不變D.兩者均改變E.根據(jù)資料不同,二者變化不同『正確答案』B2.要全面描述正態(tài)分布或近似正態(tài)分布資料的分布特征,可采用:A.均數(shù)與標(biāo)準(zhǔn)差B.中位數(shù)與四分位間距C.全距與中位數(shù)D.均數(shù)與變異系數(shù)E.采用頻數(shù)表『正確答案』A3.要全面描述一般偏態(tài)分布資料的分布特征,可采用:A.均數(shù)與標(biāo)準(zhǔn)差B.中位數(shù)與四分位間距C.全距與中位數(shù)D.均數(shù)與變異系數(shù)E.采用頻數(shù)表『正確答案』B第三單元總體均數(shù)的估計(jì)和假設(shè)檢驗(yàn)第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤

1.均數(shù)的抽樣誤差例如:在北京市估計(jì)10歲男孩1.均數(shù)的抽樣誤差例如:在北京市估計(jì)10歲男孩樣本均數(shù)與總體均數(shù)之間的差異或樣本均數(shù)之間的差異都是由于抽樣引起的,稱為均數(shù)的抽樣誤差。影響均數(shù)的抽樣誤差大小的因素有兩個(gè):總體內(nèi)各個(gè)個(gè)體間的變異程度;樣本的含量n的大小。與樣本量的關(guān)系:S一定,nt,標(biāo)準(zhǔn)誤I。2.標(biāo)準(zhǔn)誤描寫(xiě)抽樣誤差大小的統(tǒng)計(jì)量稱為標(biāo)準(zhǔn)誤。對(duì)計(jì)量資料其計(jì)算公式為:例1、1量140名正常人的空腹血糖,得弄=鴕.55唾%£=12.97^g%,試計(jì)算標(biāo)準(zhǔn)誤。用,處,叫…,后服從正態(tài)分布J自由度p=劉-1例1、1量140名正常人的空腹血糖,得弄=鴕.55唾%£=12.97^g%,試計(jì)算標(biāo)準(zhǔn)誤。用,處,叫…,后服從正態(tài)分布J自由度p=劉-1口2.圖形特征t分布以0為中心,左右對(duì)稱;形狀與自由度有關(guān),自由度越小,曲線的峰部越低,尾部越高;隨自由度增大逼近標(biāo)準(zhǔn)正態(tài)分布,當(dāng)自由度為8時(shí),t分布就是標(biāo)準(zhǔn)正態(tài)分布。3.曲線下面積特點(diǎn)與t臨界值表t值表(附表1)橫坐標(biāo):自由度,u。縱坐標(biāo):概率p,即曲線下陰影部分的面積;表中的數(shù)字:相應(yīng)的|t|界值?!狐c(diǎn)第三節(jié)總體均數(shù)的估計(jì)r參教估計(jì)一統(tǒng)計(jì)推斷 I區(qū)間估計(jì)〔假設(shè)檢驗(yàn)參數(shù)估計(jì):用樣本指標(biāo)值(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)值(參數(shù))。統(tǒng)計(jì)推斷的任務(wù)就是用樣本信息推論總體特征。參數(shù)估計(jì),用樣本均數(shù)估計(jì)總體均數(shù)。1、點(diǎn)(值)估計(jì)(近似值)2、區(qū)間估計(jì)(近似范圍)▲概念:根據(jù)樣本均數(shù),按一定的可信度計(jì)算出總體均數(shù)很可能在的一個(gè)數(shù)值范圍,這個(gè)范圍稱為總體均數(shù)的可信區(qū)間(confidenceinterval,CI)。區(qū)間估計(jì):.當(dāng)n足夠大時(shí),總體均數(shù)的區(qū)間估計(jì):總體均數(shù)的95%的置信區(qū)間:(X-l,96S^,X+1,968^)總體均數(shù)的99%的置信區(qū)間:(X-2,5^,X+2,538^)140名正常人的空腹血糖的95%與99%的區(qū)間估計(jì)為:(88.55—1.96X1.096,88.55+1.96X1.096)即: (86.40,90.70)(88.55—2.58X1.096,88.55+2.58X1.096)即: (85.72,91.38).當(dāng)n較小且總體方差未知時(shí),總體均數(shù)的區(qū)間估計(jì)(■工-b2HS友,友+ ,S友)

例2、測(cè)得25名1歲嬰兒血紅蛋白均數(shù)為123.7g/L,標(biāo)準(zhǔn)差為11.9g/L。計(jì)算1歲嬰兒血紅蛋白均數(shù)的95%可信區(qū)間。v=25—1=24,比=口.口3查表得j口口3/224=2口日4(123.7-2.064x11.9/725,12 工口Mx11.9/衣)t界值去規(guī)律:(1)自由度(U)一定時(shí),p與t成反比;(2)概率(p)一定時(shí),u與t成反比。正常值范圍估計(jì)與可信區(qū)間估計(jì)可信區(qū)間(置信區(qū)間)正常值范圍概念:總體均數(shù)所在的數(shù)值范圍概念:絕大多數(shù)正常人的某指標(biāo)范圍。(95%,99%,指95%,99%指可信度)絕大多數(shù)正常人)計(jì)算公式:計(jì)算公式:1、正態(tài)分布資料的95%參考值范圍:正態(tài)分布法:2、o2、o未知,但n較大:雙側(cè):■了一1.9版勃1.95S.X土兀無(wú)只有下限:XT64S只有上限:X+1.64S2、非正態(tài)分布資料的95%參考值范圍:百分位數(shù)法雙側(cè):P2.5?P97.5只有下限:〉P5只有上限:<P95用途:判斷觀察對(duì)象的某項(xiàng)指標(biāo)是否正常用途:估計(jì)總體均數(shù)例題:.減少均數(shù)的抽樣誤差的可行方法之一是:A.嚴(yán)格執(zhí)行隨機(jī)抽樣B.增大樣本含量C.設(shè)立對(duì)照D.選一些處于中間狀態(tài)的個(gè)體E.選一些處于極端狀態(tài)的個(gè)體『正確答案』.在標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的關(guān)系中,說(shuō)法正確的是:A.樣本例數(shù)增大時(shí),樣本差減小,標(biāo)準(zhǔn)差不變B.可信區(qū)間大小與標(biāo)準(zhǔn)差有關(guān),而參考值范圍與標(biāo)準(zhǔn)誤有關(guān)C.樣本例數(shù)增大時(shí),標(biāo)準(zhǔn)差增大,標(biāo)準(zhǔn)誤也增大D.樣本的例數(shù)增大時(shí),標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤均減小E.總體標(biāo)準(zhǔn)差一定時(shí),增大樣本例數(shù)會(huì)減小標(biāo)準(zhǔn)誤『正確答案』E.統(tǒng)計(jì)推斷包括兩個(gè)重要方面是:A.統(tǒng)計(jì)量與參數(shù).統(tǒng)計(jì)量與假設(shè)檢驗(yàn)C.參數(shù)估計(jì)與假設(shè)檢驗(yàn)D.參數(shù)估計(jì)與統(tǒng)計(jì)預(yù)測(cè)E.區(qū)間估計(jì)與假設(shè)檢驗(yàn)『正確答案』C第四節(jié)假設(shè)檢驗(yàn)1.假設(shè)檢驗(yàn)的基本原理及思想▼科本1?...同一常年.工總抽村注注引起P-OX'5界串土就廿字定文兌體即桿本I工舁小砥不同引星改⑴婚(本亞不同) /' 有統(tǒng)Y1手忠義總體人——打本之不AUH融格展若束解畀2.假設(shè)檢驗(yàn)的步驟一一以t檢驗(yàn)為例(1)建立假設(shè),確定檢驗(yàn)水準(zhǔn)檢驗(yàn)假設(shè)或者稱零假設(shè)(無(wú)效假設(shè)),用H0表示,H/假設(shè)是假設(shè)兩總體均數(shù)相等。對(duì)立假設(shè)(備擇假設(shè)),用斗表示。斗是與H0相反的假設(shè),假設(shè)兩總體均數(shù)不相等。檢驗(yàn)水準(zhǔn)(a)就是我們用來(lái)區(qū)分大概率事件和小概率事件的標(biāo)準(zhǔn)(即預(yù)先規(guī)定的小概率事件的水準(zhǔn)),是人為規(guī)定的。通常a取0.05或0.01。(2)計(jì)算統(tǒng)計(jì)量根據(jù)資料類型與分析目的選擇適當(dāng)?shù)墓接?jì)算出統(tǒng)計(jì)量t值。(3)確定概率值,作出推斷將計(jì)算得到的t值與查表tau或t“2口比較,得到P值的大小?;虿捎媒y(tǒng)計(jì)軟件計(jì)算,可得到精確其P值。當(dāng)a=0.05:如果P〉0.05,不拒絕H。,差別無(wú)統(tǒng)計(jì)學(xué)意義,結(jié)論是不認(rèn)為兩總體均數(shù)不相等。如果P<0.05,拒絕H0,接受斗,差別有統(tǒng)計(jì)意義,結(jié)論:可以認(rèn)為是兩總體均數(shù)不相等。第五節(jié)t檢驗(yàn)一、單個(gè)樣本的t檢驗(yàn)(樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn))(onesamplettest)1區(qū)一聞區(qū)一㈤自由度u=n—1例1、根據(jù)大量調(diào)查,已知健康成年男子脈搏的均數(shù)為72次/分鐘。某醫(yī)生在某山區(qū)隨機(jī)調(diào)查了25名健康成年男子,求得其脈搏均數(shù)74.2次/分鐘,標(biāo)準(zhǔn)差為6.5次/分鐘,能否據(jù)此認(rèn)為該山區(qū)成年男子的脈搏數(shù)高于一般地區(qū)。H0:p=p0,即該山區(qū)健康成年男子脈搏數(shù)與一般地區(qū)相同。H1:p>p。,即該山區(qū)健康成年男子脈搏數(shù)高于一般地區(qū)。a=0.05。年=74.2,『n,―6.5,h=25當(dāng)H成立時(shí),統(tǒng)計(jì)量:03.自由度u=n—1=25—1=24。查t界值表(附表1)單側(cè)得:0.05<P<0.10,不能拒絕H0,差異無(wú)統(tǒng)計(jì)學(xué)意義。尚不能認(rèn)為該山區(qū)健康成年男子脈搏數(shù)高于一般地區(qū)。二、配對(duì)資料比較的t檢驗(yàn)(pairedsamplettest)1、配對(duì)資料(三種情況)①配對(duì)的兩個(gè)受試對(duì)象分別接受兩種處理之后的數(shù)據(jù):②同一樣品用兩種方法(或儀器等)檢驗(yàn)的結(jié)果;⑶同一受試對(duì)象兩個(gè)部位的數(shù)據(jù)。2、目的:判斷不同的處理間是否有差別?即:差值的總體均數(shù)為03、公式:J刊_且_工辦辦1u—n—1例2、某地區(qū)隨機(jī)抽取12名貧血兒童的家庭,實(shí)行健康教育干預(yù)三個(gè)月,干預(yù)前后兒童的血色素(%)測(cè)量結(jié)果如表所示,試問(wèn)干預(yù)前后該地區(qū)貧血兒童血色素(%)平均水平有無(wú)變化?表1健康教育干預(yù)三個(gè)月前后血色素(%)編號(hào)干預(yù)刖干預(yù)后136452466435366457575657066055742708454592550105580115160125960表2健康教育干預(yù)三個(gè)月前后血色素(%)序號(hào)干預(yù)削干預(yù)后差值1364592466418353661345757056570566055-5742702884545092550251055802511516091259601使用配對(duì)t檢驗(yàn)解:1.建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)H。:p「0,即干預(yù)前后血色素(%)差值的總體均數(shù)為零Hjpd#0a=0.05.計(jì)算t值^=10.67Sd=11,18t= 1067-°=3.305Sd11.18/^v=總一1=12-1=11.確定P值,作出推斷查t臨界值得:0.005<P<0.01,按a=0.05水準(zhǔn)拒絕H°,差異有統(tǒng)計(jì)學(xué)意義??梢哉J(rèn)為健康教育干預(yù)措施前后該地區(qū)兒童血色素(%)有變化,且血色素(%)有所增加。三、兩獨(dú)立樣本均數(shù)比較的t檢驗(yàn)(成組t檢驗(yàn))(twoindependentsamplettest)▲目的:由兩個(gè)樣本均數(shù)的差別推斷兩樣本所取自的總體中的總體均數(shù)間有無(wú)差別?▲公式:閡-?其中:

u=n+nu=n+n—21 2例3、某克山病高發(fā)區(qū)測(cè)得11例急性克山病患者與該地13名健康人的血磷值(mg%)如表所示,定兩組均數(shù)差異有否統(tǒng)計(jì)學(xué)意義。表3患者與健康者的血磷測(cè)定值(mg%)患者編號(hào)X: 健康者編號(hào) X;14.7312.3426.4022.5032.6031.9843.2441.6756.5351.9865.1863.6075.5872.3383.7383.7394.3294.57105.78104.82113.73115.78124.17134.14解:1.H0:p]=p2,即克山病患者與當(dāng)?shù)亟】嫡叩难字档目傮w均數(shù)相同。H1:p1半p2,即克山病患者與當(dāng)?shù)亟】嫡叩难字档目傮w均數(shù)不相同。a=0.052.計(jì)算t為=4.71應(yīng)=1.3031X2=335,52=1,30423.自由度u=n+n—2=11+13—2=221 2查附表1可得:0.01<P<0.02,按a=0.05水準(zhǔn)拒絕H0,差異有統(tǒng)計(jì)學(xué)意義。可以認(rèn)為克山病患者血磷的平均值高于當(dāng)?shù)亟】等说难灼骄?。四、t檢驗(yàn)的應(yīng)用條件1、正態(tài)性2、方差齊性.正態(tài)性檢驗(yàn)(normalitytest):統(tǒng)計(jì)指標(biāo):偏度系數(shù)、峰度系數(shù);檢驗(yàn)方法:W值、D值(大樣本)等;統(tǒng)計(jì)圖:P—P圖、Q—Q圖、直方圖等。對(duì)于非正態(tài)分布的資料,若可以通過(guò)變量變換的方法,使之滿足正態(tài)分布的要求,則對(duì)變換的數(shù)據(jù)采用相應(yīng)的t檢驗(yàn)即可。.方差齊性檢驗(yàn):兩獨(dú)立樣本均數(shù)比較的t檢驗(yàn),要求相應(yīng)的兩總體方差相等,即方差具有齊性。為此我們要對(duì)兩樣本的方差作統(tǒng)計(jì)學(xué)檢驗(yàn)。方差齊性的檢驗(yàn):用F檢驗(yàn),計(jì)算公式為:?_41校大)一K第六節(jié)I型錯(cuò)誤與n型錯(cuò)誤假設(shè)檢驗(yàn)中作出的推斷結(jié)論可能發(fā)生兩種錯(cuò)誤:.拒絕了實(shí)際成立的Ho.稱為第一類錯(cuò)誤,它的概率用a表示。設(shè)H。:廠0,若p確實(shí)為。,則H。實(shí)際上是成立的。但是,由于抽樣的偶然性,得到了較大的t值,因而t〉tj而按所取的檢驗(yàn)水準(zhǔn)a,拒絕H。,結(jié)論為pW0(假陽(yáng)性),此推斷當(dāng)然是錯(cuò)誤的,其錯(cuò)誤的概率為a。.不拒絕實(shí)際上不成立的H。,稱為第二類錯(cuò)誤,它的概率用R表示。設(shè)H。:p=0,但實(shí)質(zhì)上pW0,即H。實(shí)際上是不成立的。但是,由于抽樣的偶然性,得到了較小的t值,t<tj因而按檢驗(yàn)水準(zhǔn)a,接受了Ho(假陰性),未拒絕p=0的錯(cuò)誤假設(shè),即接受了不成立的假設(shè)H0,此推斷當(dāng)然是錯(cuò)誤的。I型錯(cuò)誤和H型錯(cuò)誤由樣本推斷的結(jié)果真實(shí)結(jié)果拒絕H:不拒絕H:H二成立I型錯(cuò)誤0推斷正確(1一口)H二不成立推斷正確([一B)II型錯(cuò)誤B(1-P)即把握度或功效(powerofatest):兩總體確有差別,被檢出有差別的能力;(1—a)即可信度(confidencelevel):重復(fù)抽樣時(shí),樣本區(qū)間包含總體參數(shù)的百分?jǐn)?shù)。a與F間的關(guān)系:減少(增加)I型錯(cuò)誤,將會(huì)增加(減少)II型錯(cuò)誤,通常n固定時(shí),a愈小,F(xiàn)愈大;反之,a愈大.F愈小。增大n-同時(shí)降低a與F。第七節(jié)假設(shè)檢驗(yàn)的注意事項(xiàng).所觀察的樣本必須具備代表性,隨機(jī)性和可靠性;如果是兩個(gè)樣本比較,一定要注意兩個(gè)樣本間的齊同均衡性,即可比性。.必須根據(jù)實(shí)驗(yàn)設(shè)計(jì)的不同,選擇不同假設(shè)檢驗(yàn)方法。.“有統(tǒng)計(jì)學(xué)意義”,一般選P值為0.05作為界限,但這種選擇不是絕對(duì)的。應(yīng)當(dāng)根據(jù)所研究事物的性質(zhì),在實(shí)驗(yàn)設(shè)計(jì)時(shí)加以選定,不能在得出計(jì)算結(jié)果后再?zèng)Q定。當(dāng)然,在一般無(wú)特殊要求的條件下,可采用一般采用的界限。.統(tǒng)計(jì)分析不能代替專業(yè)分析。假設(shè)檢驗(yàn)結(jié)果“有”或“無(wú)”統(tǒng)計(jì)學(xué)意義,主要說(shuō)明抽樣誤差的可能性大小。在分析資料時(shí)還必須結(jié)合臨床醫(yī)療,預(yù)防醫(yī)學(xué)特點(diǎn),來(lái)加以分析。總之,不能用統(tǒng)計(jì)分析來(lái)代替專業(yè)分析,當(dāng)然,也不能認(rèn)為統(tǒng)計(jì)分析可有可無(wú)。.t值小于或很接近t°05時(shí),下結(jié)論要慎重。.正確理解P值的意義P值很小時(shí)拒絕H。,接受斗,但是不要把很小的P值誤認(rèn)為總體均數(shù)間差異很大。Significance并不含“顯著”之意。選擇題:.假設(shè)檢驗(yàn)的一般步驟中不包括以下哪一項(xiàng)?A.選擇檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量B.對(duì)統(tǒng)計(jì)參數(shù)作出區(qū)間估計(jì)C.建立假設(shè)和確定檢驗(yàn)水準(zhǔn)D.直接算出P值E.作出推斷性結(jié)論『正確答案』B.兩樣本均數(shù)比較,經(jīng)t檢驗(yàn)差別有統(tǒng)計(jì)學(xué)意義時(shí),P值越小,說(shuō)明:A.兩樣本均數(shù)差別越大.兩總體均數(shù)差別越大C.越有理由認(rèn)為兩總體均數(shù)不同D.越有理由認(rèn)為兩樣本均數(shù)不同E.以上均不正確『正確答案』C3.第1類錯(cuò)誤(I型錯(cuò)誤)的概念是:4是不對(duì)的,統(tǒng)計(jì)檢驗(yàn)結(jié)果未拒絕H0H。是對(duì)的,統(tǒng)計(jì)檢驗(yàn)結(jié)果未拒絕H0H。是不對(duì)的,統(tǒng)計(jì)檢驗(yàn)結(jié)果拒絕H0H。是對(duì)的,統(tǒng)計(jì)檢驗(yàn)結(jié)果拒絕H0E.以上都不對(duì)『正確答案』D4.統(tǒng)計(jì)推斷中,I,II型錯(cuò)誤均有可能發(fā)生,若要使兩者都減小,則:A.只要減小a就可以了B.只要減小F就可以了C.可適當(dāng)減少樣本含量D.可適當(dāng)增大樣本含量I,II型錯(cuò)誤不可能同時(shí)減小『正確答案』D.在比較兩組資料的均數(shù)時(shí),需要進(jìn)行t檢驗(yàn)的前提條件是:A.兩總體均數(shù)不等.兩總體均數(shù)相等C.兩總體方差不等D.兩總體方差相等E.以上都不對(duì)『正確答案』D第四單元方差分析一、方差分析的基本思想和適用條件(一)方差分析的基本思想——方差分析,又稱變異數(shù)分析。常用于多個(gè)樣本均數(shù)比較的假設(shè)檢驗(yàn)。方差分析的基本思想是:把全部觀察值間的總變異按設(shè)計(jì)類型的不同,分解成兩個(gè)或多個(gè)組成部分,然后將各部分的變異與隨機(jī)誤差進(jìn)行比較,以判斷各部分的變異是否具有統(tǒng)計(jì)學(xué)意義?,F(xiàn)以完全隨機(jī)設(shè)計(jì)為例來(lái)介紹方差分析的基本思想。.總變異:總變異反映所有觀察值的變異,其大小用均方MS總來(lái)反映。MS總為觀察值X與總均值離均差平方和SS總與相應(yīng)的自由度u總之比,計(jì)算公式為:SS=E(X一重)2=£X2—C,u=N—1總總MSJSS總/u總式中:C=(£X)2/N,N代表總樣本含量。完全隨機(jī)設(shè)計(jì)的方差分析將總變異分解為組間變異和組內(nèi)變異兩部分。.組間變基不同處理組樣本均數(shù)之間的差異稱為組間變異。組間變異可以采用組間均方MS組間來(lái)反映,MS組間為組間離均差平方和SS組間與相應(yīng)自由度u組間之比,計(jì)算公式為:防期間二二旗京一口口二二[(二苞)叮%]—C%間=無(wú)一1式中:k表示不同的處理組;2代表第i組的樣本含量。.組內(nèi)變異:處理組內(nèi)每個(gè)觀察值之間的差異稱為組內(nèi)變異,引起組內(nèi)變異的原因是個(gè)體變異和測(cè)量誤差。組內(nèi)變異采用組內(nèi)均方MS,由來(lái)反映,MS,由為組內(nèi)的離均差平方和SS,力與相應(yīng)的自由度u,由之比,組內(nèi) 組內(nèi) 組內(nèi) 組內(nèi)計(jì)算公式為:X,SS=E(X— )2或SS=SS-SS,u=N—k組內(nèi) 組內(nèi) 總 組間組內(nèi)MS組內(nèi)=SS組內(nèi)/u組內(nèi)可以證明:SSJSS組間+SS組內(nèi) u_^u + 總組間組內(nèi)一方差分析的無(wú)效假設(shè)H0為:p1=p2=?“=pk,即所有總體均數(shù)相等,相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量F為:F=MS組間/MS組內(nèi)若無(wú)效假設(shè)成立,即處理效應(yīng)相同,則組間變異應(yīng)與組內(nèi)變異一樣均只反映隨機(jī)誤差的大小,F(xiàn)值接近于1。相反,若根據(jù)樣本算得F的值過(guò)大,則拒絕無(wú)效假設(shè)。(二)方差分析的適用條件一數(shù)據(jù)應(yīng)滿足以下兩個(gè)基本條件:——1.各樣本是相互獨(dú)立的隨機(jī)樣本,均服從正態(tài)分布。.各樣本的總體方差相等,即方差齊性。.獨(dú)立性。二、多個(gè)均數(shù)的比較(一)完全隨機(jī)設(shè)計(jì)方差分析.完全隨機(jī)設(shè)計(jì)中變異的分解:完全隨機(jī)設(shè)計(jì)方差分析又稱單因素方差分析,是將受試對(duì)象隨機(jī)地分配到各處理組,再觀察其實(shí)驗(yàn)效應(yīng)。完全隨機(jī)設(shè)計(jì)方差分析的計(jì)算按照表2-8進(jìn)行。表2-8完全隨機(jī)設(shè)計(jì)方差分析表變異來(lái)源SSMSF總變異組同殳異EXL-C占1處理二二[N—1(工2/nJ-Ck—1ss組向八組間”士組間/MS組內(nèi)組內(nèi)變異SS瑟號(hào)占組間N—k N—kss組內(nèi)八組內(nèi).方差分析的步驟:下面以例2.19來(lái)說(shuō)明方差分析的一般步驟。例2.19:為研究大豆對(duì)缺鐵性貧血的恢復(fù)作用,某研究者進(jìn)行了如下實(shí)驗(yàn):選取已做成貧血模型的大鼠36只,隨機(jī)等分為3組,每組12只,分別用三種不同的飼料喂養(yǎng):不含大豆的普通飼料、含10%大豆飼料和含15%大豆飼料。喂養(yǎng)一周后,測(cè)定大鼠紅細(xì)胞數(shù)(X1012/L),試分析喂養(yǎng)三種不同飼料的大鼠貧血恢復(fù)情況是否不同?(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)H0:3個(gè)總體均數(shù)相等,即喂養(yǎng)三種不同飼料的大鼠紅細(xì)胞數(shù)相同―):3個(gè)總體均數(shù)不全相等,即喂養(yǎng)三種不同飼料的大鼠紅細(xì)胞數(shù)不全相同a=0.05

表2-9喂養(yǎng)三種不同飼料的大鼠紅細(xì)胞數(shù)(X1012/L)普通飼料10%大豆飼料15%大豆飼料合計(jì)4.784.656.804.656.925.913.984.447.284.046.617.513.445.997.513.776.677.743.655.298.194.914.707.154.795.058.185.316.015.534.055.677.795.164.688.03nL12121236(N)EX:52.5366.2387.62206.3S(EX)EX:234.2783373.2851647.73211255.2946(EX:)(2)計(jì)算統(tǒng)計(jì)量1)計(jì)算CC=(EX)2/N=(206.38)2/36=1183.13072)計(jì)算離均差平方和及相應(yīng)的自由度SS=£(X—H)2=£X2—C=1255.2946—1183.1307=72.1639總u=N—1=36—1=35總SE想間=Z屐%L牙=二[(二區(qū)//瑪]—C=(52.532/12+66.232/12+87.622/12)—1183.1307=52.1258組間=k—1=3—組間=k—1=3—1=2SSSS組內(nèi)=SS總一SS組間=72.1639—52.1258=20.0381組內(nèi)=N—k=33組內(nèi)=N—k=333)計(jì)算均方M編『萍="二獨(dú)皿u覿間 乙乂端小評(píng)二誓I-.?%內(nèi)a4)計(jì)算F值F=MS組間/MS組內(nèi)=26.0629/0.6072=42.92u=2,u=33組間 組內(nèi)方差分析結(jié)果見(jiàn)表2—10。表2-10完全隨機(jī)設(shè)計(jì)方差分析表變異來(lái)源SSMSFP總變異72.163935組間變異52.1258226.062942.92<0.01組內(nèi)變異20.0381330.6072(3)確定P值,作出推斷本例u1=2,u2=33查F界值表,因表中u2無(wú)33,在保守的原則下取不大于33且與其最接近者u2=32,得F005(232)=3.29,F001(232)=5.34,P<0.01。按a=0.05水準(zhǔn),拒絕H0,差異有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為嗯養(yǎng)三種不同飼料的大鼠紅細(xì)胞數(shù)的總體均值不全相同。(二)隨機(jī)區(qū)組設(shè)計(jì)方差分析1.隨機(jī)區(qū)組設(shè)計(jì)方差分析中的變異分解:隨機(jī)區(qū)組設(shè)計(jì)又稱配伍組設(shè)計(jì),通常是將受試對(duì)象按性質(zhì)相同或相近者組成b個(gè)區(qū)組,再將每個(gè)區(qū)組中的受試對(duì)象分別隨機(jī)分配到k個(gè)處理組中去。隨機(jī)區(qū)組設(shè)計(jì)的方差分析屬無(wú)重復(fù)數(shù)據(jù)的兩因素方差分析。隨機(jī)區(qū)組設(shè)計(jì)資料的總離均差平方和與自由度可以分解為以下3部分:SSJSS處理+SS區(qū)組+SS誤差u=u4u+u總處理區(qū)組誤差

隨機(jī)區(qū)組設(shè)計(jì)方差分析的計(jì)算按表2-11進(jìn)行。表2-11隨機(jī)區(qū)組設(shè)計(jì)方差分析計(jì)算表變異來(lái)源SSuMS F總變異Ex:-cN—1處理組工[(ZxJ7b-ck—1SS處埋八處理臟處理/M5誤差區(qū)組E[(Ex:)7k-cb—13S區(qū)組八區(qū)組MS區(qū)組/M3誤差i天麥ss總一S占處理一±S區(qū)組??傄籾處理一。區(qū)組占占誤匏/0誤髭2.方差分析的步驟以例2.20來(lái)說(shuō)明隨機(jī)區(qū)組設(shè)計(jì)資料方差分析的步驟。例2.20:為觀察不同劑量木賊藥液對(duì)心率的影響,取體重300?400g的雄性Wistar大鼠24只,按照月齡及體重相近原則每3只配成一組。將每組的3只動(dòng)物隨機(jī)分配到三個(gè)處理組,分別給予不同劑量的木賊灌流液,測(cè)定大鼠的心率,結(jié)果見(jiàn)表2-12。試問(wèn)不同劑量木賊灌流液對(duì)心率的影響是否不同?表2-12給予不同劑量木賊灌流液后的大鼠心率(次/分)區(qū)組低劑量中劑量局劑量12101861305262211179122512321217812251242291821345455218184137539622118514555172111911525548213182143538工及1725146710854277(ZX)2X:372261269131147971789363(工相)(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)1)處理組間H。:不同劑量木賊灌流液對(duì)心率的影響相同,即p]=p2=p3H1:pjp「p3不全相等a=0.O52)區(qū)組間H0:不同區(qū)組動(dòng)物心率的總體均數(shù)相等斗:不同區(qū)組動(dòng)物心率的總體均數(shù)不全相等a=0.05

(2)計(jì)算統(tǒng)計(jì)量1)計(jì)算CC=(EX)2/N=(4277)2/24=762197.0422)計(jì)算離均差平方和及相應(yīng)的自由度SS總=£先—C=789363—762197.042=27165.958u^=N-1=24-1=23SS,a=E(EXi)2/b-C(1725了(1725了+(iog5y-762197.042=25920.333=25920.333u=k-1=3—1=2處理SS區(qū)組=£(£Xj)2/k一C=(526)2+(5^+(538)2"陽(yáng)9加42=626.625u=b-1=8-1=7區(qū)組SS誤差=SS總一SS處理-SS區(qū)組=27165.958-25920.333-626.625=619.000u=u-u -u=23-2-7=14誤差總處理區(qū)組3)計(jì)算均方MS=SS /u=25920.333/2=12960.167處理 處理處理MS=SS /u=626.625/7=89.518區(qū)組 區(qū)組 區(qū)組MS=SS /u=619.000/14=44.214誤差 誤差 誤差4)計(jì)算F值F處理=MS處理/MS誤差=12960.167/44.214=293.123處理=2處理=2誤差=14F區(qū)組=MS區(qū)組/MS誤差:89.518/44.214:2.025區(qū)組=7,誤差=14區(qū)組=7,誤差=14方差分析結(jié)果見(jiàn)表2-13。表2-13隨機(jī)區(qū)組設(shè)計(jì)方差分析表變異來(lái)源SSMSFP總變異27165.95823處理組25920.333212960.167293.123<0.01區(qū)組626.625789.5182.025>0.05送麥619.0001444.214(3)確定P值,作出推斷以u(píng) =2為u,u=14為u,查F界值表,得P<0.01。按a=0.05水準(zhǔn)拒絕H,接受H,差異處理 1誤差 2 0 1有統(tǒng)計(jì)學(xué)意義,可認(rèn)為接受不同劑量木賊灌流液的大鼠心率有差異。對(duì)于不同動(dòng)物區(qū)組,以u(píng)=7為u,u =14為u,查F界值表,得P〉0.05。按a=0.05水準(zhǔn)不區(qū)組 1誤差 2拒絕H。,差異無(wú)統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為不同區(qū)組間大鼠心率的總體均數(shù)有差異。(三)多個(gè)均數(shù)間兩兩比較在處理組數(shù)大于2時(shí).若仍用t檢驗(yàn)對(duì)任意兩個(gè)均數(shù)進(jìn)行比較.會(huì)增大犯1型錯(cuò)誤的概率.即可能將實(shí)際上無(wú)差異的兩個(gè)總體均數(shù)誤判為有差異。兩兩比較的方法很多,如SNK法、LSD法、Dunnett-t檢驗(yàn)等。SNK法,又稱q檢驗(yàn),其檢驗(yàn)統(tǒng)計(jì)量為:u=ue式中: 分別為兩對(duì)比組的樣本均數(shù);nA、nB為兩對(duì)比組的樣本例數(shù);MSe為方差分析中算得的誤差均方;ue為誤差的自由度。以例2.19資料來(lái)介紹q檢驗(yàn)的一般步驟,對(duì)喂養(yǎng)三種不同飼料的大鼠紅細(xì)胞數(shù)的總體均數(shù)進(jìn)行兩兩比較。將三組大鼠紅細(xì)胞數(shù)的均數(shù)從大到小排列,并編上組次:組次123均數(shù)7.305.524.38組另U15%大豆飼料10%大豆飼料普通飼料H0:任兩組大鼠紅細(xì)胞數(shù)的總體均數(shù)相同,即pA=pb斗:任兩組大鼠紅細(xì)胞數(shù)的總體均數(shù)不同,即pAWpba=0.05列出兩兩比較計(jì)算表:表2-14三組紅細(xì)胞均數(shù)兩兩比較q檢驗(yàn)分析表對(duì)比組內(nèi)Q界值對(duì)比組兩均數(shù)之差包含組數(shù)q值-P值也與EXa-Xba0.050.01(1)(2)(3)⑷(5)(6)(7)1與32.92313.273.494.45<0.011與21.7828.092.893.89<0.012與31.1425.182.893.89<0.01表中第(1)列為所有可能的對(duì)比組。第(2)列為兩對(duì)比組均數(shù)之差,如第一行的2.92=7.30—4.38。第(3)列的a是排序后兩對(duì)比組間包含的組數(shù)(包含本身在內(nèi)),如1與3比較,a為3。第(4)列是按q=2.92公式計(jì)算的統(tǒng)計(jì)量,如第一行, 7 2 1212=13.27。第(5)、(6)列是按自由度u=33和組數(shù)a查q界值表得出,第(7)列是P值。結(jié)果顯示任意兩組紅細(xì)胞數(shù)的差異均有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為3組大鼠的紅細(xì)胞數(shù)的總體均數(shù)兩兩不相同。第五單元分類資料的統(tǒng)計(jì)描述分類資料一般采用相對(duì)數(shù)指標(biāo)進(jìn)行統(tǒng)計(jì)描述。常用相對(duì)數(shù)有率、構(gòu)成比和相對(duì)比。一、常用相對(duì)數(shù)(一)率率又稱頻率,指某現(xiàn)象實(shí)際發(fā)生數(shù)與可能發(fā)生該現(xiàn)象的觀察單位總數(shù)之比,用以說(shuō)明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。計(jì)算公式為:去一某時(shí)期內(nèi)實(shí)際發(fā)生某現(xiàn)象的觀察單位數(shù)R’一同時(shí)期可能發(fā)生該現(xiàn)象的觀察單位總數(shù)式中:K稱為比例基數(shù),K可以選擇100%、1O00%。、100000/10萬(wàn)等。例2.21:某地2005年平均人口數(shù)為580360人,該年細(xì)菌性痢疾新發(fā)病人數(shù)為400人,則該地2005年細(xì)菌性痢疾發(fā)病率為400/580360X100000/10萬(wàn)=68.92/10萬(wàn)。(二)構(gòu)成比構(gòu)成比是指事物內(nèi)部某一組成部分觀察單位數(shù)與事物內(nèi)部各組成部分觀察單位總數(shù)之比。計(jì)算公式為:構(gòu)成比-某一組成部分的觀察單位數(shù)“加化一同一事物各組成部分的觀察單位總數(shù)1UU此構(gòu)成比有兩個(gè)特點(diǎn):①事物內(nèi)部各組成部分的構(gòu)成比之和等于100%或1;②事物內(nèi)部各組成部分之間呈此消彼長(zhǎng)的關(guān)系。例如,表2-15為某市2006年食物中毒發(fā)生場(chǎng)所的分布,其中“家庭”在食物中毒發(fā)生場(chǎng)所中所占的比重為92/156X100%=58.97%。表2-15某市2006年食物中毒發(fā)生場(chǎng)所的分布場(chǎng)所中毒起效構(gòu)成比(%)家庭9258.97集體食堂3723.72誓依單位、攤販148.98其他138.33合計(jì)156100.00(三)相對(duì)比相對(duì)比是指兩個(gè)有關(guān)指標(biāo)之比,用以說(shuō)明一個(gè)指標(biāo)是另一個(gè)指標(biāo)的幾倍或幾分之幾。計(jì)算公式為:相對(duì)比=號(hào)需(或父10瀚例2.22:抽查某地社區(qū)衛(wèi)生服務(wù)機(jī)構(gòu)180家,其中醫(yī)生761人,全科醫(yī)學(xué)培訓(xùn)率為33.66%;護(hù)士452人,其全科醫(yī)學(xué)培訓(xùn)率為27.12%,則醫(yī)護(hù)比為761/452=1.68,即醫(yī)生的數(shù)量是護(hù)士數(shù)量的1.68倍;醫(yī)生與護(hù)士的全科醫(yī)學(xué)培訓(xùn)率之比為33.66%/27.12%=1.24,即醫(yī)生全科醫(yī)學(xué)培訓(xùn)率為護(hù)士的1.24倍。二、應(yīng)用相對(duì)數(shù)應(yīng)注意的問(wèn)題(一)構(gòu)成比和率在應(yīng)用中的區(qū)別在實(shí)際應(yīng)用中,以構(gòu)成比代替率的錯(cuò)誤通常發(fā)生在以下兩種情況:.相同時(shí)期率的比較:例如,表2-16為2005年某地區(qū)各年齡組心腦血管疾病死亡資料。在表2-16中,第4列為各年齡組心腦血管疾病死亡人數(shù)構(gòu)成比,其中40?歲組的構(gòu)成比大于60?歲組,說(shuō)明2005年該地區(qū)心腦血管疾病死亡人口中,屬于該年齡組的人較多。但若據(jù)此認(rèn)為40?歲組的心腦血管疾病死亡發(fā)生頻率比60?歲組高,則犯了以構(gòu)成比代替率的錯(cuò)誤,利用第3列和第2列的數(shù)據(jù)按公式計(jì)算出第5列各年齡組的心腦血管疾病死亡率,才能反映各年齡組心腦血管疾病死亡水平。表2-162005年某地年齡別心腦血管疾病死亡構(gòu)成比與死亡率年齡組(歲)(1)平均人口數(shù)(2)死亡數(shù)(3)死亡人數(shù)構(gòu)成比(%)死亡率(1/10萬(wàn))⑷(5)Q?5325195.7716.9020?82308159.6218.22如?554716843.59122.59249126441.02256.90合計(jì)215942156100.0072.24.不同時(shí)期率的動(dòng)態(tài)比較:例如表2-17為某縣2000年與2005年5種傳染病的發(fā)病情況。若要反映各類型疾病的發(fā)病強(qiáng)度,應(yīng)比較2005年與2000年各類型傳染病的發(fā)病率。要注意假設(shè)檢驗(yàn)表2-17某縣2000年與2005年傳染病的發(fā)病情況疾病2000年2005年病例數(shù)構(gòu)成比(婦病例數(shù)構(gòu)成比呼吸道傳染病217648.8960341.59血源及性傳播疾病157335.3467146.27腸道傳染病61113.7315S10.90體表傳染病591.32181.24蟲(chóng)媒及自然疫源性疾病320.7200.00合計(jì)4451100.001450100.00(二)合計(jì)率的計(jì)算對(duì)分組資料計(jì)算合計(jì)率時(shí),不能簡(jiǎn)單地把各組率取平均數(shù),而應(yīng)該用各率的分子合計(jì)除以分母合計(jì)。例如,表2-16資料中2005年某地區(qū)各年齡組心腦血管疾病的合計(jì)死亡率為156/215942X1OOO00/10萬(wàn)=72.24/10萬(wàn)。(三)相對(duì)數(shù)比較時(shí)應(yīng)注意其可比性通常應(yīng)注意:.觀察對(duì)象是否同質(zhì),研究方法、觀察時(shí)間是否相同。.其他影響因素在各組的內(nèi)部構(gòu)成是否相同。(四)觀察例數(shù)問(wèn)題觀察單位不能太少,觀察單位數(shù)太少,會(huì)造成計(jì)算出的相對(duì)數(shù)不穩(wěn)定。三、動(dòng)態(tài)數(shù)列及其分析指標(biāo)動(dòng)態(tài)數(shù)列是一系列按時(shí)間順序排列起來(lái)的統(tǒng)計(jì)指標(biāo)(包括絕對(duì)數(shù)、相對(duì)數(shù)或平均數(shù)),用以觀察和比較事物在時(shí)間上的變化水平和發(fā)展趨勢(shì)。動(dòng)態(tài)數(shù)列常用的分析指標(biāo)及其應(yīng)用如下:.絕對(duì)增長(zhǎng)量:兩指標(biāo)之差。.發(fā)展速度和增長(zhǎng)速度:說(shuō)明某事物在一定時(shí)期的速度變化。發(fā)展諫展表示報(bào)告期指標(biāo)水平是基期水平的百分之多少。可計(jì)算:①定基比龍比速度,即報(bào)告期指標(biāo)與基期指標(biāo)之比,用符號(hào)表示為a1/a0,a/a0,…,an/a。;②環(huán)比發(fā)展速度,即報(bào)告期指標(biāo)與前一期指標(biāo)之比,用符號(hào)表示為a/a°,a/%…,an/an^o增長(zhǎng)速度=發(fā)展速度一1,表示發(fā)展速度的凈增長(zhǎng)量,可計(jì)算定基比增長(zhǎng)速度和環(huán)比增長(zhǎng)速度。.平均發(fā)展速度和平均增長(zhǎng)速度:常用于說(shuō)明某一時(shí)期某事物的平均變化速度。平均發(fā)展速度= ,平均增長(zhǎng)速度=平均發(fā)展速度-1o表2-18動(dòng)態(tài)數(shù)列分析指標(biāo)計(jì)算式中的符號(hào)示意時(shí)間No.1No.2 No.3 No.(n+1)指標(biāo)符號(hào) a: a: a; … &例2.23:某市醫(yī)療機(jī)構(gòu)2002?2006年床位數(shù)的變化情況見(jiàn)表2-19第2歹U。試就該資料作動(dòng)態(tài)分析。ia/66003/618252002?2006年床位數(shù)的平均發(fā)展速度= =101.3%2002?2006年床位數(shù)的平均增長(zhǎng)速度=101.3%—1=1.3%表2-19某市區(qū)療機(jī)構(gòu)2002?2006年床位的發(fā)展動(dòng)態(tài)年份床位數(shù)絕對(duì)增長(zhǎng)量發(fā)展速度(%)噌長(zhǎng)速度(%)累計(jì)逐年定基比環(huán)比定基比環(huán)比200261825100.00100.0020036328714621462102.4102.42.42.420046497131461684105.1102.75.12.72005656563831685106.2101.16.21.12006660034178347106.8100.56.80.5四、標(biāo)準(zhǔn)化法(一)標(biāo)準(zhǔn)化法的基本思想、及其意義標(biāo)準(zhǔn)化法選用統(tǒng)一的混雜因素構(gòu)成作為標(biāo)準(zhǔn),以消除因混雜因素構(gòu)成不同對(duì)總指標(biāo)的影響,以增強(qiáng)可比性。(二)直接和間接標(biāo)準(zhǔn)化法的應(yīng)用

標(biāo)準(zhǔn)化率常用的計(jì)算方法有直接法和間接法,但兩種方法的應(yīng)用條件不同。表2-20計(jì)算標(biāo)準(zhǔn)化率的數(shù)據(jù)符號(hào)年齡組標(biāo)準(zhǔn)組被標(biāo)化組人口人死亡數(shù)死亡率人口口死亡數(shù)死亡率1N-艮P111亡2N;R:P;11;工;P:k氐巳.工.合計(jì)NRPnYP.直接接:當(dāng)已知知標(biāo)化組的年齡別死亡率pi時(shí),宜采用直接法計(jì)算標(biāo)準(zhǔn)化率。丁二二第跖已知標(biāo)準(zhǔn)組年齡別人口數(shù)時(shí):已知標(biāo)準(zhǔn)組年齡別人口構(gòu)成比時(shí):已知標(biāo)準(zhǔn)組年齡別人口構(gòu)成比時(shí):.間接法:當(dāng)被標(biāo)化組的年齡別死亡率pi未知,只有年齡別人口數(shù)和死亡總數(shù)時(shí),可采用間接法。r/EniPi是被標(biāo)化組的實(shí)際死亡數(shù)與預(yù)期死亡數(shù)之比,稱為標(biāo)準(zhǔn)化死亡比(SMR)。若SMR〉1,表示被標(biāo)化組的死亡率高于標(biāo)準(zhǔn)組;若SMR<1,表示被標(biāo)化組的死亡率低于標(biāo)準(zhǔn)組。.標(biāo)準(zhǔn)化率的計(jì)算步驟一(1)根據(jù)被標(biāo)化組的數(shù)據(jù)條件選擇直接法或間接法。(2)選擇標(biāo)準(zhǔn)組:①根據(jù)研究目的選擇有代表性的、較穩(wěn)定的、數(shù)量較大的人群。如以全國(guó)的、全省的或本地區(qū)歷年累計(jì)的數(shù)據(jù)作為標(biāo)準(zhǔn)較為理想;②也可將欲比較的兩地或兩組的人口數(shù)合并或選擇其中一組人口作為標(biāo)準(zhǔn)。(3)計(jì)算標(biāo)準(zhǔn)化率。

例2.24:欲了解2006年甲、乙兩地人群貧血患病情況,分別在兩地進(jìn)行了抽樣調(diào)查,結(jié)果見(jiàn)表2-21。試比較甲、乙兩地人群貧血的患病率。表2-212006年甲、乙兩地人群貧血患病例情況用比 乙包三糜組調(diào)查人翱年齡詞成比,1姐患病率(啕調(diào)堂J.數(shù)年的構(gòu)成匕,(患痛率(率6皿8.71匕09E7415,)9田-121'必犯匕奐2(.21732(.-175928.14*,必115519.M2^,814-L683把灰15,211(55區(qū)21W.5916.86K.8(EJT13,)515⑼i合計(jì)■535-100.0014.T二57J31M)017(1)已知甲、乙兩地人群的年齡別患病率,采用直接法計(jì)算標(biāo)準(zhǔn)化患病率。(2)選擇甲、乙兩地人群各年齡組合并人口數(shù)作為標(biāo)準(zhǔn)人口數(shù)Ni見(jiàn)表2-22第2歹U。表2-22直接法計(jì)算甲、乙兩地調(diào)查人群貧血的標(biāo)準(zhǔn)化患病率三鬣組標(biāo)他人口鼓甲地3地內(nèi)原由西壁⑺地朝目后人戒陣患石芨前期患病;■藥P;什31P;P:)口?111:3.前WG?3222S.LG-23'?,D.I'D2?G£一如1;20.47雙23.51□944'.」必二1-41cId.:jy454也一r-bl14.cj州?lb.JuL7y合計(jì)12)^1門門1-1.741j6(z(二艮口:14.17(二RpJ(3)按式 計(jì)算甲、乙兩地調(diào)查人群的標(biāo)準(zhǔn)化患病率。尸甲甲地調(diào)查人群貧血標(biāo)準(zhǔn)化患病率空?父100%12043=13.84%尸甲甲地調(diào)查人群貧血標(biāo)準(zhǔn)化患病率空?父100%12043=13.84%乙地調(diào)查人群貧血標(biāo)準(zhǔn)化患病率=15.32%可見(jiàn),經(jīng)標(biāo)準(zhǔn)化以后,甲地調(diào)查人群貧血患病率低于乙地,與各年齡組的兩率比較的結(jié)果一致。例2.25:已知某地2005年惡性腫瘤死亡總數(shù)48人,該地2005年各年齡組平均人口數(shù),見(jiàn)表2-23第(3)歹U。試比較該地惡性腫瘤死亡率是否高于所屬省份的平均水平。表2-23間接法計(jì)算某地2005年惡性腫瘤標(biāo)準(zhǔn)化死亡率if止血4-n標(biāo)準(zhǔn)死亡率(1/1。萬(wàn))某地年聆組人口數(shù)預(yù)期死亡數(shù)(t)(nJ(1)⑵(3)⑷=(2)(3)2.61171810.44820?10.59310063.28478.031690313.189呂。?251.491035526.042合計(jì)49.387544542.963(Zn.Pj(1)由于知道該地惡性腫瘤死亡總數(shù)r和各年齡組人口數(shù)n/,未知該地各年齡組的惡性腫瘤死亡率p「故選用間接法計(jì)算標(biāo)準(zhǔn)化死亡率。(2)選擇該地所屬省份同期各年齡組惡性腫瘤死亡率Pj作為標(biāo)準(zhǔn)死亡率,見(jiàn)表2-23第(2)歹U。(3)用式 13'計(jì)算該地惡性腫瘤標(biāo)化死亡率。42某地惡性腫瘤的標(biāo)化死亡比smr=42.963=i.i2某地惡性腫瘤的標(biāo)準(zhǔn)化死亡率p'=49.38/10萬(wàn)*42.963=55.31/10萬(wàn)該地惡性腫瘤的標(biāo)化死亡比為1.12,說(shuō)明該地惡性腫瘤的死亡率是該省平均水平的1.12倍;該地惡性腫瘤的標(biāo)化死亡率為55.31/10萬(wàn),略高于其所屬省份的平均水平。4.應(yīng)用標(biāo)準(zhǔn)化法的注意事項(xiàng)一(1)選擇的標(biāo)準(zhǔn)不同,計(jì)算出的標(biāo)準(zhǔn)化率也不相同。(2)在已知被標(biāo)化組各年齡段死亡率時(shí),宜采用直接法計(jì)算標(biāo)準(zhǔn)化率。但如果被標(biāo)化組各年齡段人口數(shù)太少,年齡別死亡率波動(dòng)較大時(shí),宜采用間接標(biāo)準(zhǔn)化法。

(3)當(dāng)所比較的兩組內(nèi)部各分組率呈現(xiàn)交叉或非平行變化趨勢(shì)時(shí),不宜采用標(biāo)準(zhǔn)化法,應(yīng)分層比較。(4)比較樣本代表的總體標(biāo)準(zhǔn)化率是否不同時(shí),需作假設(shè)檢驗(yàn)。第六單元率的抽樣誤差與Z檢驗(yàn)一、率的標(biāo)準(zhǔn)誤(一)率的抽樣誤差在抽樣研究中,抽樣誤差是不可避免的。由于隨機(jī)抽樣造成的樣本率與總體率的差別稱為率的抽樣誤差。描述率的抽樣誤差大小的指標(biāo)為率的標(biāo)準(zhǔn)誤。(二)率的標(biāo)準(zhǔn)誤的含義若從陽(yáng)性率為n的總體中隨機(jī)抽取m個(gè)樣本含量均為n的樣本,可得到m個(gè)樣本陽(yáng)性率p1,凡,…,p。當(dāng)n較大,n既不接近0也不接近1時(shí),樣本率的分布近似服從正態(tài)分布N(n,。2)。樣本率的標(biāo)m p準(zhǔn)差。反映各樣本率對(duì)總體率n的離散程度,可用于描述率的抽樣誤差大小,稱為率的標(biāo)準(zhǔn)誤。率的標(biāo)準(zhǔn)p誤越小,說(shuō)明其抽樣誤差越?。环粗?,抽樣誤差越大。(三)率的標(biāo)準(zhǔn)誤的計(jì)算率的標(biāo)準(zhǔn)誤。計(jì)算公式為:

p率的標(biāo)準(zhǔn)誤。計(jì)算公式為:

p式中:n為總體率;n為樣本含量。實(shí)際工作中總體率n往往是未知的,常用樣本率p作為總體率n的估計(jì)值,相應(yīng)可得到op的估計(jì)值Sp,釬尸其計(jì)算公式為:從上式可以看出,減小率的抽樣誤差的有效方法是適當(dāng)增大樣本含量。例2.26:為調(diào)查某縣成年人乙型肝炎表面抗原(HBsAg)的攜帶情況,隨機(jī)抽查了100名成年人,發(fā)現(xiàn)HBsAg陽(yáng)性者12人,試估計(jì)此次HBsAg陽(yáng)性率調(diào)查的抽樣誤差大小。樣本陽(yáng)性率p=12/100=0.12。p~y—vwo=0.0325=3.25%即此次HBsAg陽(yáng)性率調(diào)查的抽樣誤差為3.25%。二、總體率的置信區(qū)間總體率的估計(jì)包括點(diǎn)估計(jì)和區(qū)間估計(jì)。點(diǎn)估計(jì)是直接用樣本率來(lái)估計(jì)總體率,沒(méi)有考慮抽樣誤差。區(qū)間估計(jì)則考慮到抽樣誤差,按一定的概率1—a(即置信度為1—a)估計(jì)總體率的可能范圍,此范圍稱為總體率的置信區(qū)間。總體率的置信區(qū)間估計(jì)方法有以下兩種:.查表法:當(dāng)nW50,可采用查表法,獲得總體率的95%和99%置信區(qū)間。.正態(tài)近似法:當(dāng)n足夠大,p和1—p均不太小時(shí)(一般要求np與n(1—p)均大于5),樣本率的抽樣分布1斤似服從正態(tài)分布,這時(shí)可利用正態(tài)分布理論來(lái)估計(jì)總體率的置信區(qū)間??傮w率的(1—a)置信區(qū)間按下式計(jì)算:(p-Za/2S,p+Za/2S)例2.2;:根據(jù)例2.26的資料,估計(jì)該縣成年人HBsAg陽(yáng)性率的95%置信區(qū)間。本例n=100,p=0.12,可采用正態(tài)近似法估計(jì)總體率的置信區(qū)間。陽(yáng)性率的95%的置信區(qū)間按式(p-Za/2Sp,p+Za/2Sp)計(jì)算:下限:p-1.96S=0.12—1.96X0.0325=0.0563上限:p+1.96S=0.12+1.96X0.0325=0.1837所以該縣成年人HBsAg陽(yáng)性率的95%置信區(qū)間為(5.63%,18.37%)。三、率的Z檢驗(yàn)(一)樣本率與總體率比較樣本率與總體率比較的目的是推斷樣本所代表的未知總體率n與已知總體率n。是否相同。有以下兩種方法可供選用:.利用二項(xiàng)分布原理直接計(jì)算概率。.正態(tài)近似法(Z檢驗(yàn)):Z檢驗(yàn)適用于樣本含量n較大,p和1—p均不太小,如np和n(1—p)均大于5的資料。檢驗(yàn)統(tǒng)計(jì)量Z的計(jì)算公式為:回1一/)\nZ=例2.28:一項(xiàng)調(diào)查結(jié)果表明某市一般人群艾滋病知識(shí)的知曉率為65%。現(xiàn)對(duì)該市吸毒人群進(jìn)行艾滋病知識(shí)調(diào)查,在150名吸毒人員中有130人回答正確。問(wèn)該市吸毒人群的艾滋病知識(shí)知曉率是否高于一般人群?記該市一般人群的艾滋病知識(shí)知曉率n=65%,吸毒人群的艾滋病知識(shí)知曉率為n,樣本含量n=150,0樣本率p=130/150=86.7%,可采用樣本率與總體率比較的Z檢驗(yàn)。假設(shè)檢驗(yàn)步驟如下:(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)H0:n=0.65,即該市吸毒人群的艾滋病知識(shí)知曉率等于該市一般人群H1:n〉0.65,即該市吸毒人群的艾滋病知識(shí)知曉率高于該市一般人群a=0.05(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量7P一飛0367—0.65, — — —III1"]耳(1—耳)-10,65x(1-0.65)-'V-7 \ 150(3)確定P值,作出推斷查t界值表(u-8),得PV0.0005,按a=0.05水準(zhǔn),拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為該市吸毒人群的艾滋病知識(shí)知曉率高于該市一般人群。(二)兩樣本率比較采用Z檢驗(yàn)的條件是兩個(gè)樣本含量n1與4均較大,且凡與\均不接近于0也不接沂于1,一般要求%和n2分別為兩樣本的樣本含量;X1和X2分別為兩樣本的事件發(fā)生數(shù)。例2.29:為了解某校本科生體測(cè)合格率的性別差異,在本科生中隨機(jī)抽查了男生110人和女生130人,結(jié)果男生有100人合格,女生有70人合格,問(wèn)該校男女生體測(cè)合格率是否不同?此題需進(jìn)行兩樣本率的比較,符合Z檢驗(yàn)的條件。假設(shè)檢驗(yàn)步驟如下:(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)H0:n1=n2,該校男生的體測(cè)合格率與女生相同H1:n1Wn2,該校男生的體測(cè)合格率與女生不同a=0.05(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量ni=110,X1=100,P1=X1/nx=100/110=0.9091;n2=130,{=70,P2=X2/n2=70/130=0.5385;以二3也點(diǎn)為受嗨+玲 110+130Z二i- S9⑼-0.E -E"叫+?加吟舄+2)(3)確定P值,作出推斷查t界值表(u-8),得p<0.001,按a=0.05水準(zhǔn),拒絕H。,接受斗,差異有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為該校男生的體測(cè)合格率與女生的不同,男生體測(cè)合格率較高。第七單元x2檢驗(yàn)X2檢驗(yàn)是一種用途很廣泛的統(tǒng)計(jì)方法,在分類資料的統(tǒng)計(jì)推斷中,可用于推斷兩個(gè)及多個(gè)總體率(或構(gòu)成比)是否有差別,檢驗(yàn)兩個(gè)分類變量是否有關(guān)聯(lián),以及檢驗(yàn)頻數(shù)分布的擬合優(yōu)度等。一、四格表資料(一)成組設(shè)計(jì)四格表資料X2檢驗(yàn)的計(jì)算及應(yīng)用條件.1.成組設(shè)計(jì)四格表資料:表2-24為成組設(shè)計(jì)四格表的一般形式,包含a、b、c、d四個(gè)基本數(shù)據(jù),其余數(shù)據(jù)均由這4個(gè)數(shù)據(jù)計(jì)算出來(lái),這種兩組二分類的資料,稱為2X2列聯(lián)表資料,亦稱四格表資料。表2-24成組設(shè)計(jì)四格表資料組別屬性合計(jì)1aba+bCdc+d合計(jì)a+cb+dn成組設(shè)計(jì)四格表資料的X2檢驗(yàn)可用于檢驗(yàn)兩個(gè)樣本率(或構(gòu)成比)是否有差別。.X2檢驗(yàn)的基本思想:X2檢驗(yàn)中,從樣本觀察到的頻數(shù)稱為實(shí)際頻數(shù),用符號(hào)A表示。在無(wú)效假設(shè)H0成立的前提下,根據(jù)實(shí)際頻數(shù)算得的各個(gè)格子的期望頻數(shù)稱為理論頻數(shù),用符號(hào)T表示。T可由下式求得:式中:q為第R行第C列格子的理論頻數(shù);nR為該格相應(yīng)的行合計(jì)數(shù);nc為該格相應(yīng)的列合計(jì)數(shù);n為總例數(shù)。X2檢驗(yàn)的基本公式為:X-2值反映了實(shí)際頻數(shù)和理論頻數(shù)之間的吻合程度。若H0成立,則A與T相差不應(yīng)該很大,即X2統(tǒng)計(jì)量不應(yīng)該很大。A與T相差越大,X2值越大,相應(yīng)的P值越小。若PWa,則A與T相差較大,有理由認(rèn)為無(wú)效假設(shè)不成立,從而拒絕H。,接受H1。由式 可以看出,由于每個(gè)格子的 〉0,因此格子數(shù)越多,X2值也會(huì)越大,即X2值的大小除了和A與T的差別大小有關(guān)外,還與格子數(shù)有關(guān)。因而在考慮X2值大小的同時(shí),應(yīng)同時(shí)考慮格子數(shù)的多少(嚴(yán)格地說(shuō)是自由度u的大?。@樣才能更準(zhǔn)確地反映A與T的吻合程度。自由度u可由下式求得:(R—1)(C—1)

.成組設(shè)計(jì)四格表資料X2檢驗(yàn)的步驟例2.30:某研究欲了解某市在校男、女中學(xué)生對(duì)艾滋病知識(shí)的掌握情況,隨機(jī)抽取該市某中學(xué)243名學(xué)生進(jìn)行問(wèn)卷調(diào)查,其中對(duì)問(wèn)題“與艾滋病患者握手是否會(huì)感染艾滋?。俊钡幕卮鹎闆r見(jiàn)表2-25。問(wèn)該市男、女中學(xué)生對(duì)該問(wèn)題的知曉率是否有差異?表2-25某市男、女中學(xué)生對(duì)“與艾滋病患者握手是否會(huì)感染艾滋病”知曉率的比較性別知道不知道合計(jì)知曉率(%)男903012075.00支705312356.91合計(jì)1608324365.84(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)H0:n^n2,即該市男、女中學(xué)生的知曉率相等H1:ni#n2,即該市男、女中學(xué)生的知曉率不等a=0.05(2)計(jì)算統(tǒng)計(jì)量1)計(jì)算理論頻數(shù)本例若H本例若H0成立,則a、b、c、d各格的理論頻數(shù)分別為:120x160=79Q12 120x83=4098g243 243_123xl60_ _123x83_2--|n— —i」U.2— —斗心.U1乙243 2432)計(jì)算X2值:按公式計(jì)算X2值(90-79,012)2(30-40,988)2(70-80,988)2(53-42,012)2=79.01240.98880,98842.012=8.8383)計(jì)算自由度u:u=(2—1)(2—1)=1(3)確定P值,作出推斷查X2界值表得p<0.005,按a=0.05水準(zhǔn),拒絕H。,接受斗。差異有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為該市男、女中學(xué)生對(duì)該問(wèn)題的知曉率不相同,男生知曉率較高。.成組設(shè)計(jì)四格表資料X2檢驗(yàn)的專用公式2 (ad—bc^n2_(90x50-30x70)2x243_J— —.I」將例題2.30數(shù)據(jù)代入上式,得 120父123次160M苫3 ,結(jié)論同前。.成組設(shè)計(jì)四格表資料X2檢驗(yàn)的應(yīng)用條件用式一『 g+H)g+#g+c)@+d)算得的*2值在所有格子的一且nN40時(shí),近似服從自由度為1的X2分布。當(dāng)有理論頻數(shù)小于5時(shí),這種近似程度降低。因此,在分析成組設(shè)計(jì)四格表資料時(shí),需根據(jù)具體情況作不同處理:(1)當(dāng)n?40.日T丁5時(shí).用X2檢驗(yàn)基本公式或成組設(shè)計(jì)四格表X2檢驗(yàn)的專用公式。(2)當(dāng)n力40.日1WTV5時(shí),用成組設(shè)計(jì)四格表X2檢驗(yàn)的校正公式或用四格表的確切概率法。出口-川2_ (|ad-bc\-^l2),‘ (0+占)匕+以+g@+以)(3)當(dāng)n<40或T<1時(shí),不能用X2檢驗(yàn),應(yīng)當(dāng)用四格表的確切概率法。當(dāng)樣本含量較大時(shí),兩樣本率比較也可采用兩樣本率比較的Z檢驗(yàn),兩種假設(shè)檢驗(yàn)方法等價(jià),且Z2=X2=T2X2,而相對(duì)應(yīng)的界值的關(guān)系為皿…(二)配對(duì)設(shè)計(jì)四格表資料X2檢驗(yàn)的計(jì)算及應(yīng)用條件.配對(duì)設(shè)計(jì)四格表資料的X2檢驗(yàn):配對(duì)設(shè)計(jì)且實(shí)驗(yàn)結(jié)果為二分類資料時(shí),可整理為配對(duì)設(shè)計(jì)四格表資

料,如表2-26所示。表2-26配對(duì)設(shè)計(jì)四格表形式乙甲曾計(jì)+a b a+bc d c+d合計(jì)a+c b十d n配對(duì)設(shè)計(jì)四格表資料的X2計(jì)算公式為:U=1U=1卜式又稱McNemar檢驗(yàn).當(dāng)b+c<40時(shí),需作連續(xù)性校正.見(jiàn)下式。.假設(shè)檢驗(yàn)步驟:本節(jié)以例2.31為例介紹配對(duì)設(shè)計(jì)四格表資料X2檢驗(yàn)的步驟。例2.31:某研究者欲比較心電圖和生化測(cè)定診斷低血鉀的價(jià)值,分別采用兩種方法對(duì)79名臨床確診的低血鉀患者進(jìn)行檢查,結(jié)果見(jiàn)表2-27。問(wèn)兩種方法的檢測(cè)結(jié)果是否相同?表2-27兩種方法診斷低血鉀的結(jié)果生化測(cè)定心電圖+曾計(jì)+452570459合計(jì)493079(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)H:B=C,即兩種方法的檢測(cè)結(jié)果相同0H:BWC,即兩種方法的檢測(cè)結(jié)果不同1a=0.05

(2)計(jì)算統(tǒng)計(jì)量本例b+c=29<40,故用式計(jì)算:二號(hào)盧(2)計(jì)算統(tǒng)計(jì)量本例b+c=29<40,故用式計(jì)算:二號(hào)盧—(3)確定P值,作出推斷查X2界值表,得P<0.005,按a=0.05水準(zhǔn),拒絕H,接受H,差異有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為兩種0 1方法的檢測(cè)結(jié)果不同,由于b〉C,故心電圖的陽(yáng)性檢出率高于生化測(cè)定方法。二、行X列表資料(一)行X列表資料的X2檢驗(yàn).行X列表資料:當(dāng)比較組數(shù)大于等于2,或資料的屬性分類數(shù)大于等于2種時(shí),數(shù)據(jù)可采用多行X多列表形式來(lái)表達(dá),稱行X列表。行X列表的X2檢驗(yàn)用于檢驗(yàn)兩個(gè)或多個(gè)樣本率(構(gòu)成比)的差別是否有統(tǒng)計(jì)學(xué)意義。.行X列表資料X2檢驗(yàn)的計(jì)算公式U=(R—1)(C—1).行X列表資料x(chóng)2檢驗(yàn)的步驟(1)多個(gè)樣本率的比較例2.32:某研究者欲比較A、B、C三種方案治療輕、中度高血壓的療效,將年齡在50?70歲的240例輕、中度高血壓患者隨機(jī)等分為3組,分別采用三種方案治療。一個(gè)療程后觀察療效,結(jié)果見(jiàn)表2-28。問(wèn)三種方案治療輕、中度高血壓的有效率有無(wú)差別?表2-28三種方案治療輕、中度高血壓的效果方案有效無(wú)效合計(jì)有效率(%)A7468092.50B58228072.50C7198088.75合計(jì)2033724084.581)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)H0:n1』2』3,即三種方案治療輕、中度高血壓的有效率相同斗:三種方案治療輕、中度高血壓的有效率不全相同a=0.052)計(jì)算x2值和自由度將表2-28的數(shù)據(jù)代入公式,得X二二7TOC\o"1-5"\h\z.房,7甲62 582 222 712 92 八240x( + + + + + -1)80x203 80x37 80x203 80x37 80x203 80x37=13.868u=(3—1)(2—1)=23)確定P值,作出推斷查X2界值表得P<°.005,按a=0.05水準(zhǔn),拒絕H。,接受斗,差異有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為三種方案治療輕、中度高血壓的有效率不全相同。(2)兩組構(gòu)成比的比較例2.33:為了解新型農(nóng)村合作醫(yī)療對(duì)于農(nóng)村貧困居民住院服務(wù)利用的影響,在經(jīng)濟(jì)條件相似的甲、乙兩個(gè)國(guó)家級(jí)貧困縣(其中甲縣2006年已開(kāi)展新型農(nóng)村合作醫(yī)療,乙縣2006年尚未開(kāi)展)分別進(jìn)行抽樣調(diào)查,得到2006年應(yīng)住院者未住院原因,見(jiàn)表2-29。問(wèn)甲、乙兩縣應(yīng)住院者未住院原因的構(gòu)成比是否不同?

表2-29甲乙兩縣應(yīng)住院者未位院原因構(gòu)成比(%)縣別經(jīng)濟(jì)困難沒(méi)有必要沒(méi)有時(shí)間其他合計(jì)甲293(87.99)10(5.11)17(3.00)13(3.90)333(100.00)乙282(92.16)9(2.94)9(2.94)6(1.96)306(100.00)合計(jì)5751926196391)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn),:甲、乙兩縣應(yīng)住院者未住院原因的總體

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論