衛(wèi)生統(tǒng)計(jì)學(xué)知識點(diǎn)總結(jié)_第1頁
衛(wèi)生統(tǒng)計(jì)學(xué)知識點(diǎn)總結(jié)_第2頁
衛(wèi)生統(tǒng)計(jì)學(xué)知識點(diǎn)總結(jié)_第3頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、衛(wèi)生統(tǒng)計(jì)學(xué)統(tǒng)計(jì)工作基本步驟:統(tǒng)計(jì)設(shè)計(jì)(調(diào)查設(shè)計(jì)和實(shí)驗(yàn)設(shè)計(jì))、資料分析收集資料、整理資料、分析資料【統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷(參數(shù)估計(jì)和假設(shè)檢驗(yàn))】。統(tǒng)計(jì)推斷:是利用樣本所提供的信息來推斷總體特征,包括:參數(shù)估計(jì)和假設(shè)檢驗(yàn)。a參數(shù)估計(jì)是指利用樣本信息來估計(jì)總體參數(shù),主要有點(diǎn)估計(jì)(把樣本統(tǒng)計(jì)量直接作為總體參數(shù)估計(jì)值)和區(qū)間估計(jì)【按預(yù)先設(shè)定的可信度(1- a),來確定總體均數(shù)的所 在范圍】。b假設(shè)檢驗(yàn):是以小概率反證法的邏輯推理來判斷總體參數(shù)間是否 有質(zhì)的區(qū)別。變量資料可分為定性變量、定量變量。不同類型的變量可以進(jìn)行轉(zhuǎn)化,通常是由高級向低級轉(zhuǎn)化。資料按性質(zhì)可分為計(jì)量資料、計(jì)數(shù)資料和等級資料。定量資料的統(tǒng)計(jì)

2、描述1頻率分布表和頻率分布圖是描述計(jì)量資料分布類型及分布特征的方法。離散型定量變量的頻率分布圖可用 直條圖表達(dá)。2頻率分布表(圖)的用途:描述資料的分布類型;描述分布的集中趨勢和離散趨勢;便于發(fā)現(xiàn)一些特大和特小的可疑值;便于進(jìn)一步的統(tǒng)計(jì)分析和 處理;當(dāng)樣本含量足夠大時(shí),以頻率作為概率的估計(jì)值。 3集中趨勢和離散趨勢是 定量資料中總體分布的兩個(gè)重要指標(biāo)。(1)描述集中趨勢的統(tǒng)計(jì)指標(biāo):平均數(shù)(算術(shù)均數(shù)、幾何均數(shù)和中位數(shù))、百分位數(shù)(是一種位置參數(shù),用于確定醫(yī)學(xué)參考值范圍,P50就是中位數(shù))、眾數(shù)。算術(shù)均數(shù):適用于對稱分布資料,特別是正態(tài)分布資料或近似正態(tài)分布資料;幾何均數(shù):對數(shù)正態(tài)分布資料(頻率圖

3、一般呈正偏峰分布)、等比數(shù)列;中位數(shù):適用于各種分布的資料,特別是偏峰分布資料,也可用于分布末端無確定值得 資料。(2)描述離散趨勢的指標(biāo): 極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系數(shù) 四分位數(shù)間距:適用于各種分布的資料,特別是偏峰分布資料,常把中位數(shù)和_ 四分位數(shù)間距結(jié)合起來描述資料的集中趨勢和離散趨勢。方差和標(biāo)準(zhǔn)差:都適 用于對稱分布資料,特別對正態(tài)分布資料或近似正態(tài)分布資料,常把均數(shù)和標(biāo)_ 準(zhǔn)差結(jié)合起來描述資料的集中趨勢和離散趨勢;變異系數(shù):主要用于量綱不同 時(shí),或均數(shù)相差較大時(shí)變量間變異程度的比較。標(biāo)準(zhǔn)差的應(yīng)用:表示變量分布的離散程度;結(jié)合均數(shù)計(jì)算變異系數(shù)、描述 對稱分布資料;結(jié)合樣本

4、含量計(jì)算標(biāo)準(zhǔn)誤。定性資料的統(tǒng)計(jì)描述1定性資料的基礎(chǔ)數(shù)據(jù)是絕對數(shù)。 描述一組定性資料的數(shù)據(jù)特征, 通常需要計(jì)算 相對數(shù)。定性變量可以通過頻率分布表描述其分布特征。2常用相對數(shù)類型:頻率型、強(qiáng)度型和相對比型指標(biāo)。指標(biāo)頻率型指標(biāo)強(qiáng)度型指標(biāo)相對比型指標(biāo)概念近似反映某一時(shí)間出現(xiàn)概率單位時(shí)間內(nèi)某現(xiàn)象的發(fā)生片兩個(gè)有關(guān)聯(lián)的指標(biāo) A和B之比計(jì)算公式某事件發(fā)生的牛體數(shù) 可龍發(fā)生某爭件詢牛悴數(shù)縱亠某事件發(fā)生的個(gè)強(qiáng)觀察人日數(shù)總計(jì)x有無量綱無有可有、可尢取值 范圍【0,1】可大于1無限制本質(zhì)大樣本時(shí)作為概率近似值 分子式分母的一部分頻率強(qiáng)度,即概率強(qiáng)度的 值1 勺表示相對于B的一個(gè)單位,A有多A和B可以是絕對數(shù)、相對數(shù)

5、和平均數(shù)A和B的量綱可相同也可不同A和B互不包含相對比: A、B 兩指標(biāo)可以是絕對數(shù)、相對數(shù)或平均數(shù)。最常見的相對比是人口 學(xué)中的男女性別比,流行病學(xué)中的相對危險(xiǎn)度 10 也是相對比指標(biāo)。3 應(yīng)用相對數(shù)應(yīng)該注意: 防止概念混淆, 避免以比代率的錯(cuò)誤現(xiàn)象; 計(jì)算相 對數(shù)時(shí)分母應(yīng)有足夠數(shù)量 ,如果例數(shù)較少會使相對數(shù)波動較大,應(yīng)該使用絕對 數(shù);正確的計(jì)算頻率(或強(qiáng)度)指標(biāo)的合計(jì)值。當(dāng)分組的資料需要合并起來估計(jì)頻率(或強(qiáng)度)時(shí),應(yīng)將各組頻率的分子相加作為合并估計(jì)的分子,各組 的分母相加作為合并估計(jì)的分母; 頻率型指標(biāo)的解釋要緊扣總體和屬性;相對數(shù)間比較要具備可比性: 要注意觀察對象是否同質(zhì)、研究方法是

6、否相同、 觀察時(shí)間是否一致、觀察對象內(nèi)部結(jié)構(gòu)是否一致、對比不同時(shí)期資料應(yīng)注意客 觀條件是否相同; 正確進(jìn)行相對數(shù)的統(tǒng)計(jì)推斷:在隨機(jī)抽樣的情況下,從樣本估計(jì)值推斷總體相對數(shù)應(yīng)該考慮抽樣誤差,因此要進(jìn)行參數(shù)估計(jì)和假設(shè)檢驗(yàn)。4 醫(yī)學(xué)人口統(tǒng)計(jì)資料主要來源為日常工作記錄(報(bào)告單、卡、冊) 、統(tǒng)計(jì)報(bào)表、 人口調(diào)查(普查和抽樣調(diào)查) 。5 描述人口學(xué)特征的常用指標(biāo)一般有人口總數(shù)和反映人口學(xué)基本特征的某些指 標(biāo)。人口學(xué)的基本特征包括性別、年齡、文化、職業(yè)等,最常用來描述人口結(jié) 構(gòu)的是性別和年齡。人口學(xué)特征指標(biāo):老年人口系數(shù)、少兒人口系數(shù)、負(fù)擔(dān)系 數(shù)、老少比、性別比。6 有關(guān)生育的常用指標(biāo)有出生率、 生育率和人

7、口再生產(chǎn)指標(biāo)。 測量生育水平的統(tǒng) 計(jì)指標(biāo):粗出生率、總生育率、年齡別生育率、總和生育率。測量人口再生育 的統(tǒng)計(jì)指標(biāo):自然增長率、粗再生率和凈再生率。7 常用的死亡統(tǒng)計(jì)指標(biāo)有:粗死亡率、年齡別死亡率、嬰兒死亡率、新生兒死亡 率、圍生兒死亡率、死因別死亡率、某病病死率和死因構(gòu)成等。8疾病統(tǒng)計(jì)資料主要來源于:疾病報(bào)告和報(bào)表材料、醫(yī)療衛(wèi)生工作記錄、疾病 題調(diào)查資料。9標(biāo)準(zhǔn)化:兩個(gè)率或多個(gè)率之間進(jìn)行比較時(shí),為消除內(nèi)部構(gòu)成不同的影響,采 用統(tǒng)一的標(biāo)準(zhǔn),對兩組或多組資料進(jìn)行校正(調(diào)整),計(jì)算得到標(biāo)準(zhǔn)化率后再做比較的方法,稱為。其目的是統(tǒng)一內(nèi)部構(gòu)成,消除混雜因素,是資料具有可比 性。應(yīng)用標(biāo)準(zhǔn)化法的注意事項(xiàng):

8、標(biāo)準(zhǔn)化法的應(yīng)用范圍很廣。當(dāng)某個(gè)分類變量在兩組中分布不同時(shí),這兩個(gè)分類變量就成為兩組頻率比較的混雜因素,標(biāo)準(zhǔn)化的目的是消除混雜因素 。 標(biāo)準(zhǔn)化后的標(biāo)準(zhǔn)化率,已經(jīng)不再反映當(dāng)時(shí)當(dāng)?shù)氐膶?shí)際水平,只表示相互比 較的資料間的相對水平。 標(biāo)準(zhǔn)化法實(shí)質(zhì)是找一個(gè)標(biāo)準(zhǔn),使兩組得意在一個(gè)共同的平臺上進(jìn)行比較。選擇不同的標(biāo)準(zhǔn),算出的標(biāo)準(zhǔn)化率也會不同,比較的結(jié)果也未必相同,因此報(bào)告比較結(jié)果時(shí)必須說明所選用的標(biāo)準(zhǔn)和理由 兩樣本標(biāo)準(zhǔn)化率是樣本值,存在抽樣誤差。比較兩樣本標(biāo)準(zhǔn)化率,當(dāng)樣本含量較小時(shí),還應(yīng)作假設(shè)檢驗(yàn)。10常用的動態(tài)數(shù)列分析指標(biāo)有: 絕對增長量、發(fā) 展速度與增長速度、平均發(fā)展速度與平均增長速度。(1)絕對增長量:

9、是說明事物在一定時(shí)期增長的絕對值,可分為:累計(jì)增長量 (報(bào)告期指標(biāo)與基線期指標(biāo)之差)和逐年增長量(報(bào)告期指標(biāo)與前一期指標(biāo)之 差)。(2)發(fā)展速度與增長速度:均為相對比,說明事物在一定時(shí)期的變化,可計(jì)算定基匕(即報(bào)告期指標(biāo)與基線期指標(biāo)的比:0)和環(huán)比(報(bào)告期指標(biāo)與其前一期指標(biāo)之比:1)。增長速度表示的是凈增長速度,增長速度=發(fā)展速度-100 %。(3)平均發(fā)展速度與平均增長速度:用于概括某現(xiàn)象在一段時(shí)期中的平均變化。平均發(fā)展速度是發(fā)展速度的幾何平均數(shù),平均發(fā)展速度=.,平均增長速度=平均發(fā)展速度-100 %。2LMJ11統(tǒng)計(jì)表和統(tǒng)計(jì)圖是描述資料特征、呈現(xiàn)統(tǒng)計(jì)分析結(jié)果的重要工具。統(tǒng)計(jì)表結(jié) 構(gòu)標(biāo)題、

10、標(biāo)目、線條、數(shù)字和備注。12常用統(tǒng)計(jì)圖用途:條圖:適用于相互獨(dú)立的資料(資料有明確分組、不連 續(xù));百分條圖、圓圖適用于構(gòu)成比資料;線圖適用于連續(xù)性資料,表達(dá)事 物的動態(tài)變化(絕對差值);半對數(shù)線圖適用于連續(xù)性資料,表達(dá)事物的發(fā)展速 度(相對比);直方圖用于描述連續(xù)變量的頻數(shù)分布;散點(diǎn)圖適用于雙變量 資料,用點(diǎn)的排列趨勢和密集度表示兩變量的相關(guān)關(guān)系。常用概率分布1正態(tài)分布(連續(xù)型隨機(jī)變量的概率分布)(1)正態(tài)概率密度曲線特點(diǎn):關(guān)于卩對稱;在卩處取得該概率密度函數(shù)的最大值,在卩土彷處有拐點(diǎn);曲線下面積為1;正態(tài)分布有兩個(gè)參數(shù):位置參數(shù)(決定曲線在橫軸上的位置)和變異參數(shù)彷(決定曲線的形狀):卩土

11、1.64彷面積為90%,土 1.96彷面積為95%,土 2.58彷面積為99%。(2) Z變換與標(biāo)準(zhǔn)正態(tài)分布:對于任意一個(gè)服從正態(tài)分布 N(u,2)的隨機(jī) 變量,可作Z變:匕1 ,變換后的z值仍然服從正態(tài)分布,且其總體均數(shù)為 0、 總體標(biāo)準(zhǔn)差為1,稱此為標(biāo)準(zhǔn)正態(tài)分布,用N (0,1 )表示。(z)為標(biāo)準(zhǔn)正態(tài)分布Z變量的累積面積,-Z的面積,即 下側(cè)累計(jì)面積。 ( 3)正態(tài)分布的應(yīng)用:確定醫(yī)學(xué)參考值范圍:是指特定的“正常”人群(排 除了對所研究的指標(biāo)有影響的的疾病和有關(guān)因素的特定人群)的解剖、生理、生化指標(biāo)及組織代謝產(chǎn)物含量等數(shù)據(jù)中大多數(shù)個(gè)體的取值所在范圍,習(xí)慣用該人群的95%的個(gè)體某項(xiàng)醫(yī)學(xué)指標(biāo)

12、的取值范圍作為該指標(biāo)的醫(yī)學(xué)參考值范圍。方法:a百分位數(shù)法:適用于任何分布類型的資料;b正態(tài)分布法。質(zhì)量控制圖: 如果某一波動僅僅由個(gè)體差異或隨機(jī)測量誤差所致,那么觀察結(jié)果服從正態(tài)分布??刂茍D共有7條水平線,中心線位于總體均數(shù)卩處, 警戒限位于土 2”處, 控制限位于土 3彷處,此外還有兩條位于土彷處。 ( 4)確定醫(yī)學(xué)參考值的步驟:從“正常人”總體中抽樣,明確研究總體;用統(tǒng)一和準(zhǔn)確的方法測定相應(yīng)的指標(biāo);根據(jù)不同的用途選定適當(dāng)?shù)陌俜纸缦?,常?5% ;根據(jù)此指標(biāo)的實(shí)際意義,決定單側(cè)范圍還是雙側(cè)范圍;根據(jù)此指標(biāo)的分布決定計(jì)算方法,常用的計(jì)算方法:正態(tài)分布法、百分位數(shù)法。2二項(xiàng)分布:(1)是一種離散

13、型隨機(jī)變量 的分布類型。如果每個(gè)觀察對象陽性結(jié)果的發(fā)生概率為n,陰性結(jié)果的發(fā)生概率為(1- n);而且每個(gè)觀察對象的結(jié)果是相互對立的, 那么,重復(fù)觀察n個(gè)人,發(fā)生陽性結(jié)果的人數(shù) X的概率分布為而二項(xiàng)分布,記作B (n, n) o二項(xiàng)分布的概率函數(shù) P (X) = n (1- n ),=丄n決定適用條件:每次實(shí)驗(yàn)只有兩種 互斥的結(jié)果;各次實(shí)驗(yàn)互相 獨(dú)立;發(fā)生 成功事件的概率恒定o 分布特征:二項(xiàng)分布的特征由二項(xiàng)分布的參數(shù)n以及觀察的次數(shù) 圖形分布特征:二項(xiàng)分布圖的高峰在yn處或附近;n =0.5時(shí),圖形對稱; 冗工0.5時(shí),分布不對稱,且對同一 n,n離0.5愈遠(yuǎn),對稱性愈差。對于同一 n,隨著

14、n的增大,分布趨于對稱。當(dāng) nfg時(shí),只要n不太靠近 0或1 (特別 是當(dāng)nn和n (1- n )均大于5時(shí)),二項(xiàng)分布趨于對稱。 二項(xiàng)分布的均數(shù)和標(biāo)準(zhǔn)差:若X服從二項(xiàng)分布B(n, n),則X的總體均數(shù)為yn,總體方差為彷2n( 1- n),總體標(biāo)準(zhǔn)差為彷=;若將出現(xiàn)陽性結(jié)果的頻率記為: 兇,則樣本率P的總體均數(shù)為yn,總體方差為彷 _1= 乂丨,總體標(biāo)準(zhǔn)差為彷 * |(T p是頻率P的標(biāo)準(zhǔn)差,又稱頻率的標(biāo)準(zhǔn)誤,反映陽性頻率的抽樣誤差大小。累積概率計(jì)算:二項(xiàng)分布出現(xiàn)陽性的次數(shù)至多為k次的概率為:P (Xw k)出現(xiàn)陽性的次數(shù)至少為 k次的概率為:P (X k) =y H3分布:是一種離散型隨機(jī)

15、變量 的分布類型,是二項(xiàng)分布的特例,用以描述單位時(shí)間、 空間、面積等的罕見事件發(fā)生次數(shù)的概率分布。一般記作P (入),入是分布的唯一參數(shù)??傮w均數(shù)為入n。前提條件:互斥、獨(dú)立、恒定。概率函數(shù)為:P (X)入,X為觀察單位內(nèi)稀有事件的發(fā)生次數(shù),2.71828。分布特性:分布是非對稱的,總體參數(shù)入值越小,分布越偏;隨著入fx,分布趨于對稱,當(dāng)入20時(shí),分布資料可按正態(tài)分布處理。分布總體均數(shù)與總體方差相等,均為入;分布的觀察結(jié)果可加性,即對于服從分布的m歌互相獨(dú)立的隨機(jī)變量 XI、X2,它們的和也服從分布,其均數(shù)為這個(gè)m隨機(jī)變量的均數(shù)之和。概率計(jì)算:如果稀有事件發(fā)生次數(shù)的總體均數(shù)為入,有事件發(fā)生次數(shù)

16、至多為k次的概率為:P (Xw k)= 回:;生次數(shù)至少為k次的概率:P (X k) =1 (Xw 1)4三種常用分布之間的關(guān)系: 二項(xiàng)分布與分布的關(guān)系:當(dāng) n很大,發(fā)生概率n (或1- n )很小,二項(xiàng)分 布B (n,n)近似于分布P (nn); 二項(xiàng)分布與正態(tài)分布的關(guān)系:當(dāng) n較大,n不接近0或1 (特別是當(dāng)nn和 n( 1- n )均大于5時(shí)),二項(xiàng)分布B (n,n)近似于正態(tài)分布 N(nn, nn(1- n);分布與正態(tài)分布的關(guān)系:當(dāng)入 20時(shí),分布漸進(jìn)正態(tài)分布 N (入,入)。5二項(xiàng)分布與分布的區(qū)別:相同點(diǎn):都是離散型隨機(jī)變量的常見分布;區(qū)別:a取值不同。服從二項(xiàng)分布的隨機(jī)變量有 1

17、個(gè)不同的取值;分布的隨 機(jī)變量的可能去只有無限多個(gè),即非負(fù)整數(shù) 0,1 , 2;b隨機(jī)變量的概率 不同:二項(xiàng)分布P () I 分布P ()入勺;c描述的隨機(jī)變量不同。二項(xiàng)分布描述的是一次試驗(yàn)只會出現(xiàn)兩種對立的結(jié)果之一,n次獨(dú)立重復(fù)試驗(yàn)中某種結(jié)果出現(xiàn)次數(shù)的概率分布。分布描述的是在單位時(shí)間、面積、空間等范圍中某種事件發(fā)生數(shù)的概率分布。 聯(lián)系:B(n ,n) N亠分布。參數(shù)估計(jì)1在服從正態(tài)分布的總體中進(jìn)行隨機(jī)抽樣,樣本均數(shù)的抽樣分布特點(diǎn):各樣 本均數(shù)未必等于總體均數(shù);樣本均數(shù)見存在差異;樣本均數(shù)圍繞總體均 數(shù),中間多、兩邊少,左右基本對稱,呈近似正態(tài)分布;樣本均數(shù)間的變 異明顯小于原始變量間的變異。

18、2標(biāo)準(zhǔn)誤: 均數(shù)的標(biāo)準(zhǔn)誤的理論值:彷=,總體標(biāo)準(zhǔn)差通常未知,需用樣本標(biāo)準(zhǔn)差S來估計(jì),均數(shù)標(biāo)準(zhǔn)誤的估計(jì)值為:頻率的標(biāo)準(zhǔn)誤:若隨機(jī)變量(n, n),則樣本頻率 0的總體概率為n,標(biāo)準(zhǔn)誤是(T冋,頻率標(biāo)準(zhǔn)誤的估計(jì)值:.* 工(增加樣本含量可以減少樣本誤差)。3標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別與聯(lián)系:區(qū)別:標(biāo)準(zhǔn)差S ():意義:描述個(gè)體觀察值變異程度的大小。標(biāo)準(zhǔn)差小, 均數(shù)對一組觀察值得代表性好;應(yīng)用:與結(jié)合,用以描述個(gè)體觀察值的分布范圍,常用于醫(yī)學(xué)參考值范圍的估計(jì);與n的關(guān)系:n越大,S越趨于穩(wěn)定;標(biāo)準(zhǔn)誤S (彷):意義:描述樣本均數(shù)變異程度及抽樣誤差的大小。標(biāo) 準(zhǔn)誤小,用樣本均數(shù)推斷總體均數(shù)的可靠性大;應(yīng)用于

19、何結(jié)合,用以估計(jì)總體均數(shù)可能出現(xiàn)的范圍以及對總體均數(shù)作假設(shè)檢驗(yàn);與n的關(guān)系:n越大,S越小。聯(lián)系:都是描述變異程度的指標(biāo);由.可知,S與S成正比。n 定時(shí),s越大,S越大。4 t分布:當(dāng)X服從均數(shù)為卩的正態(tài)分布時(shí),統(tǒng)計(jì)量服從自由度為1的t分布,是小樣本總體均數(shù)的區(qū)間估計(jì)及假設(shè)檢驗(yàn)的理論基礎(chǔ)。t分布的圖形特征:t值得分布于自由度有關(guān)。t分布只有一個(gè)參數(shù)即v。特征:單峰分布,以0為中心,左右對稱;v越小,t值越分散,曲線的 峰部越矮,尾部越高;隨著 v逐漸增大,t分布逐漸接近標(biāo)準(zhǔn)正態(tài)分布; 當(dāng)v趨向時(shí),t分布趨近標(biāo)準(zhǔn)正態(tài)分布,故標(biāo)準(zhǔn)正態(tài)分布是t分布的特例;t分布是一簇曲線。t界值表:在自由度相同時(shí)

20、,直越大,t分布的尾部概率越??;在 t臨界值相同時(shí),雙側(cè)尾部面積概率為單側(cè)尾部面積概率的兩倍。5參數(shù)估計(jì):包括點(diǎn)估計(jì)和區(qū)間估計(jì)。 置信區(qū)間的兩個(gè)要素: 準(zhǔn)確度:反 映置信度1- a的大小,及區(qū)間包括總體均數(shù)a的理論概率的大小,愈接近 1 越好;精密度:即區(qū)間的寬度,區(qū)間越窄越好,如樣本含量不變,將置信 度由95%提高到99%,貝y置信區(qū)間由窄變寬,估計(jì)的精度下降。6總體均數(shù)及總體概率的區(qū)間估計(jì):體均數(shù)的置信區(qū)間:t分布法和正態(tài)近似法分布法:當(dāng)彷未知且 n較小時(shí),總體均數(shù)口的雙側(cè)(1- a )置信區(qū)間為 土 廠一;單側(cè)(一刁 一,s)或(-a, + .n 3 );.正態(tài)近似法:當(dāng)彷已知時(shí),總體均

21、數(shù)口的雙側(cè)(1- a )置信區(qū)間為土ZB彷目;單側(cè)(回目彷目,8 )或(-a,耳+ Zil彷冃);當(dāng)彷未知但 n足 夠大時(shí)(n50), t分布近似服從標(biāo)準(zhǔn)正態(tài)分布,總體均數(shù)卩的雙側(cè)(1- a)置信區(qū)間為: LI,單側(cè)(-Z S ,8)或(-a, + Z S )總體概率的置信區(qū)間:對于二項(xiàng)分布的樣本資料,可根據(jù)樣本含量n和樣本頻率p的大小,選用查表法(nW 50,特別是p很接近0或100%時(shí))或正 態(tài)近似法估計(jì)總體概率冗的(1- a)置信區(qū)間。正態(tài)近似法:當(dāng)n足夠大,且及n(1)均大于5時(shí),p的抽樣分布近似正態(tài)分布,總體概率n的雙側(cè)(1- a )置信區(qū)間等于P 7醫(yī)學(xué)參考值范圍與總體均數(shù)的置信區(qū)

22、間的區(qū)別:意算:絕大總體均數(shù)一定信區(qū)間度估計(jì)總體均數(shù)所在范圍;偏峰某人;指側(cè)否數(shù)單,8)或(-, Pl00) 計(jì)算:正態(tài)分布彷未知:雙側(cè) IT,單側(cè)(:=F, )或(-, +出 1_);彷已知:雙側(cè) 土 Z _1彷.,單側(cè)(心,)或(-,+ Z (T );正態(tài)分布或偏峰分布:彷未知但 n足夠大:雙側(cè) 土 ,單側(cè)(- Z S ,)或(-,+ Z S ) 應(yīng)用:估計(jì)總體均數(shù)所在范圍。假設(shè)檢驗(yàn)1假設(shè)檢驗(yàn)的過程:建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)f計(jì)算統(tǒng)計(jì)量f確定P值并與給定的a比較f做出推斷結(jié)論2假設(shè)檢驗(yàn)的基本邏輯: 在H成立的條件下(處理因素不起作用),計(jì)算統(tǒng)計(jì)量 和P值,把“不太可能出現(xiàn)假陽性”當(dāng)作“不

23、可能出現(xiàn)假陽性”,從而拒絕H),接受Hi (處理因素起作用)3假設(shè)檢驗(yàn)的兩類錯(cuò)誤:I型和型錯(cuò)誤。(見名解)實(shí)際情況統(tǒng)計(jì)推斷差異Ho成立,無差異第I類錯(cuò)誤(假陽性),概率=a正確,概率=1-aH成立,有差異 正確,該概率=1- B第H類錯(cuò)誤(假陰性),概率=B4t檢驗(yàn):應(yīng)用條件:隨機(jī)樣本:來自正態(tài)分布總體;均數(shù)比較時(shí),要求兩總體方差相等(方差齊性)。單樣本資料的t檢驗(yàn):實(shí)際上是推斷該樣本來自的總體均數(shù)卩與已知的某一總體均數(shù)a 0有無差別。檢驗(yàn)假設(shè):H0:a = a o, Hi:o;前提條件:樣本來自正態(tài)總體;計(jì)算公式:|;自由1。配對設(shè)計(jì)資料的t檢驗(yàn):配對資料的分析著眼與每一對中兩個(gè)觀察值之差,

24、這 些差值構(gòu)成一組資料,用t檢驗(yàn)推斷差值總體均數(shù)是否為 0。檢驗(yàn)假設(shè):H0: a 0, H : a d工0;前提條件:差值服從正態(tài)分布;計(jì)算公式自由度1 (n是對子數(shù))。兩獨(dú)立樣本資料的t檢驗(yàn):兩樣本均數(shù)的比較。檢驗(yàn)假設(shè):H:回=回,H:回工回;前提條件:兩樣本服從正態(tài)分布,且具有方差齊性;計(jì)算公式:LH ,代表兩樣本均數(shù)之差的標(biāo)準(zhǔn)誤,S為兩樣本聯(lián)合估計(jì)的方差,;自由度 r II5 檢驗(yàn):前提條件:兩小樣本來自正態(tài)總體且方差不等。方差不齊,可米用的 處理方式有:檢驗(yàn),基于秩次的非參數(shù)檢驗(yàn)和數(shù)據(jù)變換。非正態(tài)分布,方差不齊:基于秩次的非參數(shù)檢驗(yàn)和數(shù)據(jù)變換。檢驗(yàn)假設(shè):H0:二也,Hi: 工;計(jì)算公式

25、:廠| ;自由度 6兩組獨(dú)立樣本資料的方差齊性檢驗(yàn):兩組正態(tài)分布隨機(jī)樣本判斷其總體方差是否齊同:|,當(dāng)H0成立時(shí),檢驗(yàn)統(tǒng)計(jì)量|當(dāng)F3時(shí),方差不齊。7大樣本資料的Z檢驗(yàn)(u檢驗(yàn)):前提條件:樣本足夠大;兩獨(dú)立樣本資料的Z檢驗(yàn):假定從兩個(gè)正態(tài)總體(或非正態(tài))總體隨機(jī)抽取含量為n1和n2的樣本,總體均數(shù)和方差分別為J 。當(dāng)n1和n2均較大時(shí),兩樣本均數(shù)的和與差的分布也服從(或近似服從)正態(tài)分布,當(dāng)HO成立時(shí),這個(gè)統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布。 t檢驗(yàn)與Z檢驗(yàn)的比較:兩樣本均數(shù)比較的t檢驗(yàn)適用條件為:樣本含量小, 兩樣本獨(dú)立,來自正態(tài)總體,且兩總體方差相等。Z檢驗(yàn)是大樣本情況下的t檢驗(yàn)的近似,用于兩總體方差

26、已 知,或總體方差未知但樣本含量較大(n 160且n260)的兩樣本均數(shù)的比較。樣本量較大時(shí),兩種檢驗(yàn)方 法都可用。 8假設(shè)檢驗(yàn)與區(qū)間估計(jì)的關(guān)系:置信區(qū)間具有假設(shè)檢驗(yàn)的主要功能:在a水準(zhǔn)上可回答差別有無統(tǒng)計(jì)學(xué)意義;置信區(qū)間可提供假設(shè)檢驗(yàn)沒有提供的信息:根據(jù)置信區(qū)間上、下限的數(shù)值大小可判斷差別是否具有實(shí)際意義;假設(shè)檢驗(yàn)可提供確切的 P值,置信區(qū)間只能在預(yù)先確定的置信度 100 (1- a)%水平上進(jìn)行推斷,沒有精確 的概率值,且有可能增大口類錯(cuò)誤;置信區(qū)間推斷量的大小,即推斷總體 均數(shù)范圍;假設(shè)檢驗(yàn)推斷質(zhì)的大小即推斷總體均數(shù)是否存在不同。只有把置 信區(qū)間和假設(shè)檢驗(yàn)結(jié)合起來,互相補(bǔ)充才是對問題比較

27、的完整分析。9假設(shè)檢驗(yàn)的注意事項(xiàng):根據(jù)研究目的、設(shè)計(jì)類型、變量類型及樣本大小選擇恰當(dāng)?shù)慕y(tǒng)計(jì)分析方法;權(quán)衡兩類錯(cuò)誤的危害以確定a的大??;正確理解P值的意義:P值很小時(shí)“拒絕H0,接受H”,不能把很小的P值誤解為總體參數(shù)間差異很大。拒絕 H只是說差異不為0, P值小只是說犯一類錯(cuò)誤的機(jī)會遠(yuǎn)小于 a。P與a本質(zhì)相同,都為概率,P是根據(jù)當(dāng)前實(shí)驗(yàn)計(jì)算的概率,a是預(yù)先給定的概率,為檢驗(yàn)水準(zhǔn),是定義了的小概率上限。實(shí)驗(yàn)設(shè)計(jì)1根據(jù)研究者是否認(rèn)為地設(shè)置處理因素,即是否給予干預(yù)措施,可將醫(yī)學(xué)研究分為調(diào)查研究和實(shí)驗(yàn)研究兩類。 調(diào)查研究:又稱觀察性研究或非實(shí)驗(yàn)性研究,確切的說應(yīng)是非隨機(jī)化對比研究。它對研究對象不施加任

28、何干預(yù)措施,是在完全“自然狀態(tài)”下對研究對象的特征進(jìn)行觀察、記錄,并對觀察結(jié)果進(jìn)行描述和對比研究。 實(shí)驗(yàn)研究:又稱干預(yù)性研究,是對研究對象人為給予干預(yù)措施的研究。2實(shí)驗(yàn)設(shè)計(jì)的基本要素:受試對象、處理因素、實(shí)驗(yàn)效應(yīng)。 受試對象:是處理因素作用的客體,根據(jù)受試對象不同,實(shí)驗(yàn)可以分為三 類:動物實(shí)驗(yàn)、臨床試驗(yàn)、現(xiàn)場試驗(yàn)。 處理因素:是研究者根據(jù)研究目的而施加的特定的實(shí)驗(yàn)措施,又稱為受試因素。 實(shí)驗(yàn)效應(yīng):是處理因素作用下,受試對象的反應(yīng)或結(jié)局,它通過觀察指標(biāo)來體現(xiàn)。選擇觀察指標(biāo)時(shí),應(yīng)當(dāng)注意:a客觀性:客觀指標(biāo)具有較好的真實(shí)性和可靠性; b精確性:包括準(zhǔn)確度和精密度兩層含義。 準(zhǔn)確度指觀察值與真值的接近

29、程度, 主要受系統(tǒng)誤差的影響。 精密度指相同條件下對同一對象的同一指標(biāo)進(jìn)行重 復(fù)觀察時(shí),觀察值與其均數(shù)的接近程度, 其差值受隨機(jī)誤差的影響。c靈敏性 和特異性:指標(biāo)的靈敏度反映其檢出真陽性的能力,靈敏度高的指標(biāo)能將處 理因素的效應(yīng)更好地顯示出來;指標(biāo)的 特異度反映其鑒別 真陰性的能力,特 異度高的指標(biāo)不易受混雜因素的干擾。3實(shí)驗(yàn)設(shè)計(jì)的基本原則:對照、隨機(jī)化和重復(fù)。對照的形式:安慰劑對照:目的:在于克服研究者、受試對象等由心理 因素導(dǎo)致的偏倚。空白對照卩對照組不接受任何處理,在動物實(shí)驗(yàn)和實(shí) 驗(yàn)方法研究中最常見,常用于評價(jià)測量方法的準(zhǔn)確度,評價(jià)實(shí)驗(yàn)是否處于正 常狀態(tài)等。實(shí)驗(yàn)對照;標(biāo)準(zhǔn)對照:用現(xiàn)有標(biāo)

30、準(zhǔn)方法或常規(guī)方法作為對照; 自身對照:對照與實(shí)驗(yàn)在同一受試對象身上進(jìn)行。a隨機(jī)化體現(xiàn)在三方面:隨機(jī)抽樣:總體中每一個(gè)體都有相同機(jī)會被抽到 樣本中來;隨機(jī)分配:每個(gè)受試對象被分配到各組的機(jī)會相等,保證大量 難以控制的非處理因素在對比組間盡可能均衡,以提高組間的可比性;實(shí)驗(yàn)順序隨機(jī):每個(gè)受試對象先后接受處理的機(jī)會相等,它使實(shí)驗(yàn)順序的影響 也達(dá)到均衡。b在實(shí)驗(yàn)設(shè)計(jì)中常通過隨機(jī)數(shù)來實(shí)現(xiàn)隨機(jī)化。獲得隨機(jī)數(shù)的常用方法有: 隨機(jī)數(shù)字表和計(jì)算機(jī)的偽隨機(jī)數(shù)發(fā)生器。隨機(jī)數(shù)字表常用于抽樣研究及隨機(jī)分組。c常用的兩種隨機(jī)化分組的方法: 完全隨機(jī)化和分層隨機(jī)化 (配對隨機(jī)化和區(qū) 組隨機(jī)化可看成是分層隨機(jī)化的實(shí)際應(yīng)用)。

31、重復(fù)包括三種情形:整個(gè)實(shí)驗(yàn)的重復(fù);用多個(gè)受試對象進(jìn)行重復(fù); 同一受試對象的重復(fù)觀察。重復(fù)的主要作用:估計(jì)變異的大??;降低變 異大小。4 常用的實(shí)驗(yàn)設(shè)計(jì)方案:完全隨機(jī)設(shè)計(jì) ( ):又稱簡單隨機(jī)設(shè)計(jì),是最為常見的一種考察單因素兩 水平或多水平效應(yīng)的實(shí)驗(yàn)設(shè)計(jì)的方法,它是采用完全隨機(jī)分組的方法將同質(zhì) 的受試對象分配到各處理組,觀察其實(shí)驗(yàn)效應(yīng)。配對設(shè)計(jì) ( ):是將受試對象按一定條件配成對子,再將每對中的兩個(gè)受 試對象隨機(jī)分配到不同的處理組。據(jù)以配對的因素應(yīng)為可能影響實(shí)驗(yàn)結(jié)果的 主要混雜因素。配對設(shè)計(jì)主要有以下情形:將兩個(gè)條件相同或相近的受試 對象配成對子,通過隨機(jī)化,使對子內(nèi)個(gè)體分別接受兩種不同的處理

32、;同 一受試對象的兩個(gè)部分配成對子,分別速記地接受兩種不同的處理;自身 前后配對,即同一受試對象,接受某種處理之前和接受該處理后視為配對。交叉設(shè)計(jì) ( ):是一種特殊的自身對照設(shè)計(jì),它按事先設(shè)計(jì)好的實(shí)驗(yàn)次序, 在各個(gè)時(shí)期對受試對象先后實(shí)施各種處理,以比較處理組間的差異?;厩疤幔?個(gè)處理方式不能相互影響,即受試對象在接受第二種處理時(shí),不能有前 一種處理的剩余效應(yīng)。 優(yōu)點(diǎn): 節(jié)約樣本含量;能夠控制個(gè)體差異和時(shí)間對處 理因素的影響,故效率較高;在臨床試驗(yàn)中,每個(gè)受試對象均接受了各種處 理,均等的考慮了每個(gè)患者的利益。 進(jìn)行交叉設(shè)計(jì)應(yīng)注意: 盡可能采用盲法, 以提高受試對象的依從性,避免偏倚;不宜用

33、于具有自愈傾向或病程較短的 疾病研究。在慢性病觀察過程中,應(yīng)盡量保持條件的可比性。隨機(jī)區(qū)組設(shè)計(jì): 又稱單位設(shè)計(jì)、配伍組設(shè)計(jì),實(shí)際上是配對設(shè)計(jì)的擴(kuò)展。 通常是將受試對象按性質(zhì)相同或相近分為 b 個(gè)區(qū)組(或稱單位組、配伍組) , 再將每個(gè)區(qū)組中的 k 個(gè)受試對象隨機(jī)分配到 k 個(gè)處理組。設(shè)計(jì)應(yīng)遵循“區(qū)組 間差別越大越好,區(qū)組內(nèi)差別越小越好”的原則。析因設(shè)計(jì) ( ):a 是將兩個(gè)或多個(gè)處理因素的個(gè)水平進(jìn)行組合, 對各種可能 的組合都進(jìn)行實(shí)驗(yàn),從而探討個(gè)處理因素的主效應(yīng)以及個(gè)處理因素間的交互 效應(yīng),又稱完全交叉分組實(shí)驗(yàn)設(shè)計(jì)。所謂 交互作用 是指兩個(gè)或多個(gè)處理因素 間的效應(yīng)互不獨(dú)立,當(dāng)某一因素取不同水平

34、時(shí),另一個(gè)或多個(gè)因素的效應(yīng)相 應(yīng)的發(fā)生變化。兩因素間的交互作用為一階交互作用,三因素間交互作用為 二階交互作用。b當(dāng)觀察k個(gè)處理因素,每個(gè)因素均有 m個(gè)水平時(shí),共有種組合,簡記為析因 設(shè)計(jì)。c 可獲得三方面的信息: 各因素不同水平的效應(yīng); 各因素間的交互作用;通過 比較尋求最佳組合。5 樣本含量的估算:確定樣本含量的原則:在保證研究結(jié)論有一定可靠性的前提下,估算最少 需要多少受試對象。假設(shè)檢驗(yàn)所需樣本含量取決于四個(gè)要素: 第一類錯(cuò)誤概率a的大?。篴越小,所需樣本量越大;第二類錯(cuò)誤概率B或檢驗(yàn)功效(1- B)的大?。旱诙愬e(cuò)誤的概率越小,檢驗(yàn)功效越大,所需樣本含量越多;容許誤差S:即兩總體參數(shù)的

35、的差值,3越大,所需樣本含量越小;總體標(biāo)準(zhǔn)差彷和總 體概率n:越大,所需樣本含量越多;總體概率n越接近50%,變異性越大,所需樣本含量越多。方差分析1 基本思想: 把全部觀察值間的變異按設(shè)計(jì)和需要分解成兩個(gè)或多個(gè)組成部分,然后將各部分的變異與隨機(jī)誤差進(jìn)行比較,以判斷各部分的變異是否具有統(tǒng)計(jì)學(xué)意義。2應(yīng)用條件:各樣本是相互獨(dú)立的隨機(jī)樣本; 各樣本來自正態(tài)總體; 各 處理組總體方差相等,即方差齊性。3任何設(shè)計(jì)方案的總和v總算法均相同,即在不考慮數(shù)據(jù)按任何方向分組的情況下,將所有數(shù)據(jù)看成一個(gè)整體計(jì)算,即 目 1 K 1( 1)S2,VEI 1。幾種設(shè)計(jì)方案中且和VE的分解:設(shè)計(jì)方案勺的分解完全隨機(jī)設(shè)

36、計(jì)組間組內(nèi)弓組間組內(nèi)隨機(jī)區(qū)組設(shè)計(jì)處理區(qū)組誤差j處理區(qū)組誤差析因設(shè)計(jì)月處理+誤差勺處理+ V誤差=() 誤差=()+ V誤差重復(fù)測量設(shè)計(jì)(兩因素)受試對象間受試對象內(nèi)V 受試對象間受試對象內(nèi)=(處理個(gè)體間誤差)+:(v處理個(gè)體間誤差)+(時(shí)間處理與時(shí)間交互個(gè)體內(nèi)誤差)(V時(shí)間處理與時(shí)間交互個(gè)體內(nèi)誤差)4重復(fù)測量資料和隨機(jī)區(qū)組設(shè)計(jì)資料的區(qū)別:同一受試對象在不同時(shí)間點(diǎn)的數(shù)據(jù)高度相關(guān);重復(fù)測量資料中的處理因素在受試對象(看成區(qū)組)間為隨機(jī) 分配,但受試對象(看成區(qū)組)內(nèi)的各時(shí)間點(diǎn)是固定的,不能隨機(jī)分配。隨機(jī) 區(qū)組設(shè)計(jì)資料中每個(gè)區(qū)組內(nèi)的受試對象彼此獨(dú)立,處理只在區(qū)組內(nèi)隨機(jī)分配, 同一區(qū)組內(nèi)的受試對象接受

37、的處理各不相同。5重復(fù)測量資料方差分析的前提條件:各樣本是相互獨(dú)立的隨機(jī)樣本; 各樣本來自正態(tài)總體;各處理組總體方差相等,即方差齊性;需滿足協(xié)方差陣 的球形性或復(fù)合對稱性。6多各樣本均數(shù)的兩兩比較方法: 未計(jì)劃的每兩個(gè)均數(shù)的事后比較, 常用檢驗(yàn); 計(jì)劃好的某些均數(shù)間的兩兩比較,常用檢驗(yàn)法和法適于所有的兩兩比較。方差分析后不能作兩兩比較的 t檢驗(yàn)的原因:會增加犯一類錯(cuò)誤的概率。如果 比較次數(shù)為k,每次檢驗(yàn)水準(zhǔn)為a,則犯一類錯(cuò)誤的累積概率為1-( 1- a)k,高于原有的a。7數(shù)據(jù)變換的目的:使各組達(dá)到方差齊性; 使資料轉(zhuǎn)換為正態(tài)分布, 以滿足 方差分析和t檢驗(yàn)的應(yīng)用條件。通常情況下,一種適當(dāng)?shù)暮?/p>

38、數(shù)轉(zhuǎn)換可使上述兩 個(gè)目的同時(shí)達(dá)到。曲線直線化。常用于曲線擬合。常用的數(shù)據(jù)變換有對數(shù)變換、平方根變換、平方根反正弦變換。8方差分析中的F檢驗(yàn)是單側(cè)檢驗(yàn)的原因:方差分析中檢驗(yàn)統(tǒng)計(jì)量 F的計(jì)算通常 是用某部分的均方(如處理因素、交互效應(yīng)等)除以誤差的均方,其中分母誤差部分盡含隨機(jī)因素作用,分子某部分的均方含有相應(yīng)處理因素或交互作用的 效應(yīng),而且還含有隨機(jī)因素的作用,因此得F值從理論上應(yīng)1,不會小于1,所以方差分析中F檢驗(yàn)是單側(cè)檢驗(yàn)。檢驗(yàn)1 檢驗(yàn)用途:常用于分類變量資料的統(tǒng)計(jì)推斷,主要用途包括:單樣本分 布的擬合優(yōu)度;比較兩個(gè)或多個(gè)獨(dú)立樣本頻率分布;比較配對設(shè)計(jì)兩樣本 頻率和兩頻率分布;推斷兩個(gè)變量或

39、特征之間有無關(guān)聯(lián)性。2 檢驗(yàn)的理論基礎(chǔ)是 X2分布和擬合優(yōu)度檢驗(yàn)。卜分布是一種連續(xù)型隨機(jī)變量的概率分布,按分布的密度函數(shù)可給出自由 度=1, 2. 3,二的一簇分布曲I 1布形狀完全依賴于自由度v 當(dāng)、V1戲,隨著v的增加,曲線逐漸趨于對稱;當(dāng)自由度 v趨于a時(shí), 逼近正態(tài)分布。擬合優(yōu)度檢驗(yàn)是根據(jù)樣本的頻率分布檢驗(yàn)其總體分布是否等于給定的理論分布。3 X檢驗(yàn)的基本思想是:用統(tǒng)計(jì)量度量實(shí)際頻數(shù)和理論頻數(shù)之間的偏離程度,永遠(yuǎn)是正值,檢驗(yàn)統(tǒng)計(jì)量的基本公式是:=1 , 1, s是用樣本估計(jì) 量代替總體參數(shù)的個(gè)數(shù)。若假設(shè)成立,則各格子的實(shí)際頻數(shù)與理論頻數(shù)相差不應(yīng)該很大,因而算出的 X2值也不會很大,即出

40、現(xiàn)較大值的概率P很小。若PWa,則認(rèn)為A與T的差別已超出了抽樣誤差允許的范圍,拒絕H。若Pa,不拒絕4獨(dú)立樣本2X 2列聯(lián)表資料的 檢驗(yàn):H):兩總體率相等;H:兩總體率不等。 n40 且5,.“1=,回=1, 1; n40且1W Tv 5,校正公式:1丿=,I =丨 ,1; nv 40或Tv 1,或Pa時(shí),精確概率法。5獨(dú)立樣本RX C列聯(lián)表資料的檢驗(yàn):(多個(gè)獨(dú)立樣本率、獨(dú)立樣本頻率分布的比較)多個(gè)總體率相等;H:多個(gè)總體率不等。乂 11(1)(1)要求:理論頻數(shù)不宜太小, 一般不宜有1/5以上的格子的理論頻數(shù)小于 5,或 不宜有一個(gè)理論頻數(shù)小于 1,否則可能會產(chǎn)生偏性。如果不滿足此要求,處

41、理 方法有:增加樣本含量(首選);結(jié)合專業(yè)知識考慮是否可以將該格所在 行或列與別的行和列合并,要根據(jù)樣本特性來確定,但會損失信息;改用RXC表精確概率法,可以用計(jì)算機(jī)軟件實(shí)現(xiàn)。RX C列聯(lián)表的分割:多個(gè)實(shí)驗(yàn)組間的兩兩比較:分析目的為k個(gè)實(shí)驗(yàn)組間,任兩個(gè)率均進(jìn)行比較時(shí),須進(jìn)行 巳次獨(dú)立的四格表檢驗(yàn),再加上總的行X列表資料的 檢驗(yàn),共次檢驗(yàn)假設(shè)。故檢驗(yàn)水準(zhǔn) 用下式估計(jì):=工| ,= 乂丨,為樣本率的個(gè)數(shù)。實(shí)驗(yàn)組與同一個(gè)對照組的比較:分析目的為各實(shí)驗(yàn)組與同一個(gè)對照組的比較,而各實(shí)驗(yàn)組間不須比較。其檢驗(yàn)水準(zhǔn)用下式估計(jì):=丨。6配對設(shè)計(jì)資料的X2檢驗(yàn):配對2X 2列聯(lián)表資料的X2檢驗(yàn)(兩種處理方法陽性率

42、的比較):H):兩總體陽性率相等; H:兩總體陽性率不等。 當(dāng)40時(shí),,1;當(dāng)40時(shí),校正公式因二叵,1。配對RX R列聯(lián)表資料的 檢驗(yàn):H):兩變量的概率分布相同;H:兩變量的概率分布不相同?;谥却蔚姆菂?shù)檢驗(yàn)1假設(shè)檢驗(yàn)的方法有:參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)。 參數(shù)檢驗(yàn):是以特定的總體分布為前提,對未知的總體參數(shù)做推斷的假設(shè) 檢驗(yàn)方法統(tǒng)稱為,如t檢驗(yàn)和方差分析。 非參數(shù)檢驗(yàn):不以特定的總體分布為前提,也不針對決定總體分布的幾個(gè) 參數(shù)做推斷,進(jìn)行的是分布之間的檢驗(yàn)。一般不直接用樣本觀察值做分析, 統(tǒng)計(jì)量的計(jì)算基于原數(shù)據(jù)在整個(gè)樣本中按大小所占位次。由于丟棄了觀察值 的具體數(shù)據(jù),只保留了大小次序的信息,

43、凡適合參數(shù)檢驗(yàn)的資料,應(yīng)首選參 數(shù)檢驗(yàn)。2非參數(shù)檢驗(yàn)適用于:有序變量資料;總體分布類型不明的資料;分布不對稱且無法轉(zhuǎn)化為正態(tài)分布資料;對比組間方差不齊,有無適當(dāng)變換方 法達(dá)到方差齊性的資料;一端或兩端觀察值不確切的資料;等級資料。3 符號秩(和)檢驗(yàn):目的:可用于推斷總體中位數(shù)是否等于某個(gè)指定值,還可以推斷配對樣本 差值的總體中位數(shù)是否為 0。單樣本資料的符號秩檢驗(yàn)常用于不滿足t檢驗(yàn) 條件的單樣本定量變量資料的比較。 配對設(shè)計(jì)資料的符號秩和檢驗(yàn) :由檢 驗(yàn)配對樣本的差值是否來自中位數(shù)為 0 的總體,來推斷兩個(gè)總體中位數(shù)是否 相等,即兩種處理效應(yīng)是否相同。 配對符號秩和檢驗(yàn)基本思想: 在配對樣本

44、 中,假定兩種處理效果相同,則差值的總體分布為對稱分布,并且差值的總 體中位數(shù)為 0。若假設(shè)成立, 樣本差值的正秩和與負(fù)秩和應(yīng)相差不大, 均接近 n(1)/4 ;當(dāng)正負(fù)秩和相差懸殊,超出抽樣誤差可解釋的范圍時(shí),則有理由懷 疑該假設(shè),從而拒絕 H0。方法要點(diǎn):按差值絕對值從小到大編秩,差值為正的秩和以表示,為負(fù) 的秩和以表示,任?。ɑ颍┳鳛闄z驗(yàn)統(tǒng)計(jì)量 查T界值表確定P值;正態(tài) 近似法:隨著n的增大,T分布逼近均數(shù)為n (1)/4,方差為n (1)( 21)124 的正態(tài)分布。當(dāng) n50, 用 Z 檢驗(yàn)。注意事項(xiàng): 編秩時(shí)遇差值為 0 舍去, n 隨之減??; 遇有差值的絕對值相等, 符號相同,仍按

45、順序編秩;符號不同,取其平均秩次;笑( 1)/24秩和檢驗(yàn):目的是推斷連續(xù)型變量資料或有序變量資料的兩個(gè)獨(dú)立樣本代表的兩個(gè)總 體分布是否有差別。方法要點(diǎn):將兩組數(shù)據(jù)由小到大同一編秩,以樣本列數(shù)小者為ni,其秩和為T,查T界值表確定P值;正態(tài)近似法:當(dāng) ni10或n2- ni10時(shí),T分布接 近均數(shù)為ni( 1)/2,方差為ni n2( 1)/2的正態(tài)分布,可用 Z檢驗(yàn)。注意事項(xiàng):編秩中若有相同的數(shù)據(jù)在同一組則依次編秩;若相同數(shù)值在不 同組內(nèi),求平均秩次;當(dāng)相持出現(xiàn)較多時(shí)(超過25%),需使用校正公式?;舅枷耄杭僭O(shè)含量為 n1與n2的兩個(gè)樣本(且 mW nJ ,來自同一總體或分布 相同的兩個(gè)總

46、體,則n1樣本的秩和T1與其理論秩和n1 (1) /2相差不大,即n1(1) /2僅為抽樣誤差所致。當(dāng)二者相差懸殊,超出抽樣誤差可解釋的范圍時(shí), 則有理由懷疑該假設(shè),從而拒絕 H)o5 H檢驗(yàn):目的:用于推斷定量變量或有序分類變量的多個(gè)總體分布有無差別。方法要點(diǎn):先將k組數(shù)據(jù)由小到大同一編秩,求出各組秩和 ,計(jì)算檢驗(yàn)統(tǒng)計(jì) 量H;當(dāng)組數(shù)3,且各組例數(shù)W 5時(shí),查H界值表確定P值;若k3或最小樣 本例數(shù)大于5,則H統(tǒng)計(jì)量近似服從1的 分布。注意事項(xiàng):編秩中若有相同的數(shù)據(jù)在同一組則依次編秩;若相同數(shù)值在不同組內(nèi),求平均秩次;當(dāng)相持出現(xiàn)較多時(shí)(超過25%),需使用校正公式;當(dāng)結(jié)論為拒絕 H,認(rèn)為多組處理效應(yīng)不全相同時(shí),常需進(jìn)一步作多個(gè)樣本的兩 兩比較的秩和檢驗(yàn)。兩變量關(guān)聯(lián)性分析1相關(guān)系數(shù)的意義及計(jì)算: 相關(guān)系數(shù)= 總體相關(guān)系數(shù)P,若pH 0,稱X和Y線性相關(guān);若P =0,則簡稱X和Y不相 關(guān)。樣本協(xié)方差是離均差乘積在樣本中的平均,離均差在總體中的平均就是總體協(xié)方差。 樣本相關(guān)系數(shù),是兩個(gè)隨機(jī)變量之間線性相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論