醫(yī)學(xué)統(tǒng)計(jì)學(xué)第二章_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)第二章_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)第二章_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)第二章_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)第二章_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2 2 統(tǒng)計(jì)資料的整理與描述統(tǒng)計(jì)資料的整理與描述原始資料雜亂無(wú)章【例例2.1】 2011年某市120名7歲男童身高(cm)資料如下,試編制頻數(shù)表。分類資料的整理 列出類別,計(jì)算頻數(shù),列表2.1 頻數(shù)表頻數(shù)表資料整理的必要性 條理化,系統(tǒng)化,顯示數(shù)量特征、分布規(guī)律,便于進(jìn)一步統(tǒng)計(jì)分析數(shù)值變量資料的整理2.1.1. 頻數(shù)表的編制 【例例2.1】 2011年某市120名7歲男童身高(cm)資料如下,試編制頻數(shù)表。頻數(shù)表的編制方法如下頻數(shù)表的編制方法如下 :(1)找出觀察值中的最大值和最小值,并求出極差極差 (2)決定組段數(shù)、組段和組距 確定組段數(shù)要以充分反映數(shù)據(jù)的分布特征為原則 組距26.6/102

2、.66可以參考斯特奇斯(Sturges)提出的經(jīng)驗(yàn)公式來(lái)確定分組數(shù)cmcmcmR6 .264 .1170 .144組數(shù)極差組距 2lglg1nk(3)列表劃記:計(jì)算各組段包含的觀察單位個(gè)數(shù)2.1.2 頻數(shù)分布的圖示 圖圖2.1 2011年某地年某地120名名7歲男童身高的頻數(shù)分布?xì)q男童身高的頻數(shù)分布 2.1.3. 頻數(shù)分布的分析對(duì)頻數(shù)表的分析,主要在于以下幾個(gè)方面: (1)有無(wú)可疑值 通過(guò)對(duì)頻數(shù)分布的分析,發(fā)現(xiàn)某些特大或特小的離 群值、可疑值 (2)分布的類型 頻數(shù)分布可分為對(duì)稱分布和偏態(tài)分布兩種類型. 不同類型的分布,應(yīng)采用不同的統(tǒng)計(jì)分析方法 對(duì)稱分布,是指觀察值向中央部分集中,以中等數(shù)據(jù)居

3、多,左右兩側(cè)分布大體對(duì)稱。 如:正常人身高、體重,脈搏,血紅蛋白等的分布所謂偏態(tài)分布,是指觀察值偏離中央所謂偏態(tài)分布,是指觀察值偏離中央 尾部偏向數(shù)軸正側(cè)(或右側(cè)),稱正偏態(tài)(或右偏態(tài)); 如:食物中毒引起腹瀉的潛伏期尾部偏向數(shù)軸負(fù)側(cè)(或左側(cè)),稱負(fù)偏態(tài)(或左偏態(tài)) 如:慢性病患者年齡的分布(3)分布特征分布特征 分布的兩個(gè)重要特征:集中趨勢(shì)和離散趨勢(shì) 總體中的個(gè)體總是具有同質(zhì)性,這些同質(zhì)性使得觀察值應(yīng)趨向同一數(shù)值(即集中趨勢(shì))。同一總體中的個(gè)體之間又普遍存在著各種差別,使得個(gè)體觀察值不會(huì)完全相同。2.2 集中趨勢(shì)的描述集中趨勢(shì)的描述平均數(shù)反映一組觀察值的集中趨勢(shì)、中心位置或平均水平它是該組數(shù)

4、據(jù)的代表,能對(duì)一群同類事物或現(xiàn)象的數(shù)量特征作出概括的說(shuō)明,是統(tǒng)計(jì)學(xué)中應(yīng)用最廣泛、最重要的一個(gè)指標(biāo)體系。常用的平均數(shù)有(算術(shù))均數(shù),幾何均數(shù)和中位數(shù) 2.2.1 均數(shù)均數(shù) 均數(shù)是算術(shù)均數(shù)的簡(jiǎn)稱,習(xí)慣上用希臘字母 表示總體均數(shù);用 表示樣本均數(shù)。均數(shù)反映一組觀察值在數(shù)量上的平均水平,最適合單峰對(duì)稱分布資料的平均水平的描述。1)未分組資料(原始資料)的均數(shù)的計(jì)算方法: 將所有的觀察值直接相加,再除以總觀察數(shù)nX2)分組資料的均數(shù)計(jì)算法 有時(shí)我們面對(duì)的資料不是原始數(shù)據(jù),而是經(jīng)過(guò)加工整理后的分組資料。這時(shí)用加權(quán)法求均數(shù)。 iiiikkfXffXfXfXfX2211 式中 fi是第 i 組的頻數(shù),fi表示

5、各組段頻數(shù)之和,即總觀察數(shù) n; Xi是第 i 組的組中值,即該組的(下限+上限)/2。 由于只知道有 fi個(gè)觀察值屬于該組段,而不知道具體的數(shù)值,故該組的 fi個(gè)觀察值均以組中值代替。 【例例 2.3 】 求表2.1中資料的均數(shù)2.2.2 幾何均數(shù)幾何均數(shù) 有些醫(yī)學(xué)資料,如抗體的滴度,細(xì)菌計(jì)數(shù)等,其頻數(shù)分布呈明顯偏態(tài),各觀察值之間呈倍數(shù)變化(等比關(guān)系),算術(shù)均數(shù)對(duì)這類資料集中趨勢(shì)的代表性就差,這時(shí)宜用幾何均數(shù)反映其平均增(減)倍數(shù)。幾何均數(shù)一般用G表示,適用于各變量值之間成倍數(shù)關(guān)系,但作對(duì)數(shù)變換后指標(biāo)成單峰對(duì)稱分布的資料。 (1) 未分組資料的幾何均數(shù)計(jì)算法。將 n 個(gè)觀察值 X1,X2,X

6、n直接相乘 再開(kāi) n 次方,即為幾何均數(shù)。以公式表示: nnXXXG 21 nXininXnXXXGlg121110lglglglglglg【例例2.4 】 5人的血清抗體滴度分別為1:10,1:20,1:40,1:40,1:160,求平均滴度。8 .34160404020105G8 .345160lg40lg40lg20lg10lglg1G(2)分組資料的幾何均數(shù)計(jì)算法。 nXffXfXfXfGiiikklglglglglglg122111 【例例2.5 】 某地107人接種疫苗后抗體滴度見(jiàn)表2.2第(1)(2)欄,求平均滴度。表表2.2 107例試驗(yàn)受試者免疫后麻疹例試驗(yàn)受試者免疫后麻疹H

7、I抗體滴度及平均滴度計(jì)算抗體滴度及平均滴度計(jì)算計(jì)算幾何均數(shù)時(shí)注意 變量值中不能有0,因?yàn)?與任何數(shù)的乘積均為0,且0不能取對(duì)數(shù)。 同一組變量值不能同時(shí)存在正、負(fù)值。 若變量值全為負(fù)值,可在計(jì)算時(shí)將負(fù)號(hào)除去,算出結(jié)果后再冠以負(fù)號(hào) 2.2.3 中位數(shù)與百分位數(shù)中位數(shù)與百分位數(shù) 資料是偏態(tài)分布的,資料中的少數(shù)數(shù)據(jù)過(guò)分偏大(或偏?。?,分布不規(guī)則,一端或兩端有不確定數(shù)據(jù)(開(kāi)口資料)時(shí),用中位數(shù)表示他們的集中趨勢(shì)比算術(shù)均數(shù)合理。 中位數(shù)(median,簡(jiǎn)記為M)是將一組觀察值從小到大按順序排列,位次居中的觀察值就是中位數(shù)百分位數(shù)(percentile)是一種位置指標(biāo),以 表示,一個(gè)百分位數(shù) 將總體或樣本的

8、全部觀察值分為兩個(gè)部分,理論上有X的觀察值比 小,有(100-X)觀察值比 大XPXPXPXP中位數(shù)與百分位數(shù)的計(jì)算(1)未分組資料的中位數(shù)計(jì)算法 設(shè)個(gè)觀察值X1,X2,Xn已按從小到大的順序排列,則:【例2.6 】 9名沙門(mén)菌食物中毒患者的潛伏期(小時(shí))為:2,5,9,12,14,15,18,24,60。求其中位數(shù)。為偶數(shù)當(dāng)為奇數(shù)當(dāng)nXXXMnnn2/n12/2/2/1【例2.7】 8名桿菌痢疾治愈者的住院天數(shù)如下,求其中位數(shù)。 4,9,10,12,14,20,24,61(2)分組資料的中位數(shù)和百分位數(shù)計(jì)算法 百分位數(shù)的計(jì)算公式:LxxfXnfiLP%例 2.8 157 名桿菌痢病治愈者的住

9、院天數(shù)如表 2.3 第(1)(2)欄所示,試計(jì)算其中位數(shù)及25和 75百分位數(shù)。 表 2.3 157 名桿菌痢病治愈者的住院天數(shù) 住院天數(shù) 治愈人數(shù) 累計(jì)頻數(shù) 累計(jì)頻率(%) (1) (2) (3) (4) 0 3 3 1.9 5 38 41 26.1 10 49 90 57.3 15 24 114 72.6 20 13 127 80.9 25 8 135 86.0 30 7 142 90.4 35 4 146 93.0 40 4 150 95.5 45 1 151 96.2 50 1 152 96.8 55 2 154 98.1 60 1 155 98.7 65 1 156 99.4 70

10、0 156 99.4 75 1 157 100.0 2.3 離散程度的描述離散程度的描述【例例2.9】 三組同性別、同年齡兒童的體重(kg)如下,試分析其集中趨勢(shì)和離散程度。 甲組 26 28 30 32 34 乙組 24 27 30 33 36 丙組 26 29 30 31 34 kgXkgXkgX303030丙乙甲 三組的的均數(shù)相同,但顯然5個(gè)數(shù)據(jù)間參差不齊的程度是不一樣的。二者結(jié)合,才能全面全面認(rèn)識(shí)事物。 描述離散程度的指標(biāo)有極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差及變異系數(shù) 2.3.1. 極差極差極差(range,記為R)亦稱全距。即一組數(shù)據(jù)中最大值與最小值之差。反映個(gè)體的變化范圍。極差大,說(shuō)

11、明變異度大;反之,說(shuō)明變異度小 優(yōu)點(diǎn):優(yōu)點(diǎn):計(jì)算簡(jiǎn)單,意義明確。 缺點(diǎn):缺點(diǎn):1. 除了最大值和最小值外,不能反映組內(nèi)其它數(shù)據(jù)的變異程度 ;2. 樣本例數(shù)懸殊時(shí)不宜比較極差;3. 抽樣誤差較大,極不穩(wěn)定。 2.3.2 四分位數(shù)間距四分位數(shù)間距 四分位數(shù)四分位數(shù)(quartile,記為Q),是特定的百分位數(shù),即P25(下四分位數(shù))和P75(上四分位數(shù)) 四分位數(shù)間距(inter-quartile range)就是上四分位數(shù)與下四分位數(shù)之差 QQUQL 四分位數(shù)間距可看成中間一半觀察值的極差 用四分位數(shù)間距反映變異程度的大小 優(yōu)點(diǎn):優(yōu)點(diǎn):比極差穩(wěn)定, 缺點(diǎn):缺點(diǎn):但仍未考慮全部觀察值的變異程度。

12、適用場(chǎng)合:適用場(chǎng)合:如集中趨勢(shì)用中位數(shù)描述,則相應(yīng)的離散趨勢(shì)用四分位數(shù)間距描述。2.3.3 方差與標(biāo)準(zhǔn)差方差與標(biāo)準(zhǔn)差 離均差 :總體中每個(gè)變量值X與總體均數(shù)之差,X-,稱為離均差 離均差平方和:將離均差平方后再相加,得(X-)2,稱為離均差平方和(sum of squares) ,其除了與變異度有關(guān),還與變量值的個(gè)數(shù)N有關(guān)。 總體方差: NX22 方差的度量單位是原變量值度量單位的平方 總體標(biāo)準(zhǔn)差 : 方差標(biāo)準(zhǔn)差越大說(shuō)明個(gè)體的變異度越大;反之,說(shuō)明個(gè)體的變異度就越小NXNii12)( 樣本標(biāo)準(zhǔn)差s : 實(shí)際計(jì)算時(shí)用公式:12nXXs1/22nnXXs 分組資料用公式 :1/X22nnfXfs2

13、.3.4. 相對(duì)離散度相對(duì)離散度為什么要引進(jìn)相對(duì)離散度?常用的相對(duì)離散度指標(biāo)有:極差與中位數(shù)之比;四分位數(shù)間距(QU-QL)與(QU+QL)之比;而最常用的是變異系數(shù)(coefficient of variation,記為CV)。 變異系數(shù)(離散系數(shù)): 主要用于 :1. 度量衡單位不同的幾組資料間的比較 2. 均數(shù)相差懸殊的幾組資料間的比較 %100XsCV注解:”來(lái)表達(dá)。四分位數(shù)間距適合用“中位數(shù)布。此類資料可以認(rèn)定資料呈偏態(tài)分或遠(yuǎn)大于均數(shù),若計(jì)算出的標(biāo)準(zhǔn)差大于正態(tài)分布的資料是用來(lái)表達(dá)呈標(biāo)準(zhǔn)差平均數(shù);sx 2.4 分類資料的率和比分類資料的率和比分類資料常用的描述性指標(biāo)是相對(duì)數(shù)表表 2.4

14、 某市某年各區(qū)急性傳染病發(fā)生數(shù)及其相對(duì)數(shù)某市某年各區(qū)急性傳染病發(fā)生數(shù)及其相對(duì)數(shù) 市區(qū)市區(qū) 年平均年平均 人口數(shù)人口數(shù) 急性傳染急性傳染病發(fā)生數(shù)病發(fā)生數(shù) 各區(qū)與各區(qū)與 I 區(qū)區(qū) 發(fā)病數(shù)之比發(fā)病數(shù)之比 各區(qū)急性傳染病各區(qū)急性傳染病發(fā)生數(shù)構(gòu)成 (發(fā)生數(shù)構(gòu)成 (%) 各區(qū)急性傳染各區(qū)急性傳染病發(fā)病率 (病發(fā)病率 (1/萬(wàn))萬(wàn)) (1) (2) (3) (4) (5) (6) I 636723 2433 18.9 38.21 II 389540 3033 1.25 23.5 77.86 III 699712 1650 0.68 12.8 23.58 IV 328363 1503 0.62 11.6 45

15、.77 V 286967 1282 0.53 10.0 44.67 VI 317504 1853 0.76 14.4 58.36 VII 153838 1130 0.46 8.8 73.45 合計(jì)合計(jì) 2812647 12884 100.0 45.81 2.4.1 比比 (相對(duì)比相對(duì)比 )比亦稱相對(duì)比,是A、B兩個(gè)有關(guān)指標(biāo)之比,說(shuō)明A為B的若干倍或百分之幾。 比A/B例如:新生嬰兒(全人口)性別比,醫(yī)護(hù)比,病床數(shù)與醫(yī)護(hù)人員之比,醫(yī)院的門(mén)診人數(shù)與病床數(shù)之比,發(fā)展速度和增長(zhǎng)速度等等。2.4.2 2.4.2 構(gòu)成比構(gòu)成比 說(shuō)明一種事物內(nèi)部各組成部分所占的比重或分布,常以百分?jǐn)?shù)表示,計(jì)算公式為: 如:

16、班級(jí)女生比例,不及格比例,死因構(gòu)成比%100觀察單位總數(shù)同一事物各組成部分的位數(shù)某一組成部分的觀察單構(gòu)成比2.4.3 2.4.3 率率u如:流感發(fā)生有季節(jié)性;南部非洲是愛(ài)滋病的重災(zāi)區(qū),說(shuō)明現(xiàn)象發(fā)生的強(qiáng)度是有差異的 說(shuō)明某現(xiàn)象發(fā)生的頻率或強(qiáng)度.常以百分率()、千分率()、萬(wàn)分率(1/萬(wàn))、十萬(wàn)分率(1/10萬(wàn))等表示。計(jì)算公式為: 比例基數(shù)的選取:至少保留一二位整數(shù) 醫(yī)學(xué)中有些頻率指標(biāo)的定義并不符合率的定義)比例基數(shù)(單位總數(shù)可能發(fā)生某現(xiàn)象的觀察單位數(shù)實(shí)際發(fā)生某現(xiàn)象的觀察率K2.4.4. 2.4.4. 應(yīng)用相對(duì)數(shù)時(shí)應(yīng)注意的問(wèn)題應(yīng)用相對(duì)數(shù)時(shí)應(yīng)注意的問(wèn)題1.1. 計(jì)算相對(duì)數(shù)的分母不宜過(guò)小計(jì)算相對(duì)數(shù)的

17、分母不宜過(guò)小 原理:頻率的穩(wěn)定性 實(shí)際應(yīng)用中,如果觀察例數(shù)小于20時(shí),都不宜計(jì)算相對(duì)數(shù)。 發(fā)生率的大小對(duì)抽樣研究中的樣本的大小有指導(dǎo)意義 設(shè)計(jì)的周密程度,實(shí)驗(yàn)條件的嚴(yán)格控制不同時(shí)對(duì)研究對(duì)象的例數(shù)要求不同2.2.分析時(shí)不能以構(gòu)成比代替率(強(qiáng)度相對(duì)數(shù))分析時(shí)不能以構(gòu)成比代替率(強(qiáng)度相對(duì)數(shù)) 構(gòu)成比(構(gòu)成相對(duì)數(shù))只能說(shuō)明事物各組成部分的比重,并不說(shuō)明某現(xiàn)象發(fā)生的頻率或強(qiáng)度3.3.當(dāng)各分組的觀察單位數(shù)不等時(shí)當(dāng)各分組的觀察單位數(shù)不等時(shí),不能直接將各不能直接將各分組的率相加求其平均而成為總率分組的率相加求其平均而成為總率 4.4.對(duì)比時(shí)應(yīng)注意資料的可比性對(duì)比時(shí)應(yīng)注意資料的可比性 除研究因素外,其他的重要影

18、響因素應(yīng)相同或相近 觀察對(duì)象同質(zhì),時(shí)間相近,研究方法相同,以及地區(qū)、民族等客觀條件一致 其它影響因素在各組的內(nèi)部構(gòu)成應(yīng)相近2.4.5 2.4.5 標(biāo)準(zhǔn)化法標(biāo)準(zhǔn)化法(1)(1)標(biāo)準(zhǔn)化法的概念標(biāo)準(zhǔn)化法的概念 當(dāng)比較兩類事物的總率時(shí),如果此兩同類事物的內(nèi)部構(gòu)成,特別是某項(xiàng)能影響指標(biāo)水平的重要特征在構(gòu)成上不同,往往會(huì)造成總率的上升或下降,在這種情況下,冒然進(jìn)行兩總率的比較,會(huì)產(chǎn)生錯(cuò)誤的結(jié)論,此時(shí),必須設(shè)法消除這種內(nèi)部構(gòu)成上的差別,才能進(jìn)行比較。統(tǒng)計(jì)學(xué)上特將這種方法稱為率的標(biāo)準(zhǔn)化,即采用統(tǒng)一的標(biāo)準(zhǔn)對(duì)內(nèi)部構(gòu)成不同的各組頻率進(jìn)行調(diào)整和對(duì)比的方法,調(diào)整后的率為標(biāo)準(zhǔn)化率,簡(jiǎn)稱為標(biāo)化率,亦稱調(diào)整率。 表表 2.5

19、 某市某市甲乙兩甲乙兩院院各各科出院和治愈人數(shù)科出院和治愈人數(shù) 甲甲 院院 乙乙 院院 科室科室 出院人數(shù)出院人數(shù) 治愈人數(shù)治愈人數(shù) 治愈率治愈率(%) 出院人數(shù)出院人數(shù) 治愈人數(shù)治愈人數(shù) 治愈率治愈率(%) (1) (2) (3) (4) (5) (6) (7) 內(nèi)科內(nèi)科 876 295 33.67 329 104 31.61 外科外科 305 292 95.74 702 657 93.59 婦科婦科 564 492 87.23 591 501 84.77 兒科兒科 329 301 91.49 263 233 88.59 合計(jì)合計(jì) 2074 1380 66.54 1885 1495 79.31 表 2.6 計(jì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論