



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、醫(yī)學統(tǒng)計學總結(jié)緒論1、隨機現(xiàn)象:在同一條件下進行試驗,一次試驗結(jié)果不能確定,而在一定數(shù)量的重復試驗之后呈現(xiàn)統(tǒng)計規(guī)律的現(xiàn)象。2、同質(zhì):統(tǒng)計學中對研究指標影響較大的,可以控制的主要因素。3、變異:同質(zhì)基礎上各觀察單位某變量值的差異。數(shù)值變量:變量值是定量的, 由此而構(gòu)成的資料稱為數(shù)值變量資料或計量資料,其數(shù)值是連續(xù)性的,稱之為連續(xù)型變量。變量無序分類變量:所分類別或?qū)傩灾g無順序和程度上的差異分類變量:定性變量有序分類變量:有順序和程度上的差異4、總體:根據(jù)研究目的確定的同質(zhì)研究對象中所有觀察單位某變量值的集合??梢苑譃橛邢蘅傮w和無限總體。5、樣本:是按隨機化原則從同質(zhì)總體中隨機抽取的部分觀察單位
2、某變量值的集合。樣本代表性的前提:同質(zhì)總體,足夠的觀察單位數(shù),隨機抽樣。統(tǒng)計學中,描述 樣本特征的指標稱為統(tǒng)計量,描述總體特征的指標稱為參數(shù)。6、概率:描述隨機事件發(fā)生的可能性大小的一個度量。若 P(A)=1,則稱 A 為必然事件;若P(A)=0,則稱 A 為不可能事件;隨機事件 A 的概率為 0P1.小概率事件:若隨機事件A 的概率 P,則稱隨機事件A 為小概率事件,其統(tǒng)計學意義為:小概率事件在一次隨機試驗中認為是不可能發(fā)生的。統(tǒng)計描述1、頻數(shù)分布有兩個重要的特征: 集中趨勢和離散程度。 頻數(shù)分布有對稱分布和偏態(tài)分布之分。后者是指頻數(shù)分布不對稱, 集中趨勢偏向一側(cè), 如偏向數(shù)值小的一側(cè)為正偏
3、態(tài)分布, 如偏向數(shù)值大的一側(cè)為負偏態(tài)分布。2、常用的集中趨勢的描述指標有:均數(shù),幾何均數(shù),中位數(shù)等。均數(shù) : 適用于正態(tài)或近似正態(tài)的分布的數(shù)值變量資料。樣本均數(shù)用x 表示,總體均數(shù)用表示。幾何均數(shù):適用于等比級數(shù) 資料和對數(shù)呈正態(tài)分布的資料。注意觀察值中不能有零, 一組觀察值中不能同時有正值和負值。中位數(shù):適用于偏態(tài)分布資料以及頻數(shù)分布的一端或兩端無確切數(shù)據(jù)的資料。3、常用的離散程度的描述指標有:全距,四分位數(shù)間距,方差,標準差,變異系數(shù)。全距:任何資料,一組中最大值與最小值的差。四分位數(shù)間距:適用于偏態(tài)分布以及分布的一端或兩端無確切數(shù)據(jù)資料。方差和標準差:正態(tài)分布資料。標準差表示觀察值的變異
4、度的大小。變異系數(shù):比較度量單位不同或均數(shù)相差懸殊的兩組資料的變異度。4、標準正態(tài)分布:對正態(tài)分布的(X-)/ 進行 u 的變換, u=(X-) / , 則正態(tài)分布變換為 =0, =1 的標準正態(tài)分布,亦稱u 分布。 u 被稱為標準正態(tài)變量或標準正態(tài)離差。兩個參數(shù):是位置參數(shù),是形狀參數(shù)。用 N(0,1 )表示標準正態(tài)分布。常用估計醫(yī)學參考值范圍的方法有:( 1) 正態(tài)分布方法:適用于正態(tài)或近似正態(tài)分布的資料。雙側(cè)界值: X±u/2 S 單側(cè)上界: X+u S,或單側(cè)下界: X-u S( 2) 對數(shù)正態(tài)分布方法:適用于對數(shù)正態(tài)分布資料。雙側(cè)界值: Lg-1 (X lgx ±
5、 u /2S lgx )單側(cè)上界: Lg-1 (X lgx +u S lgx ),或單側(cè)下界: Lg-1 ( X lgx -uS lgx )( 3)百分位數(shù)法:用于偏態(tài)分布資料以及資料中一端或兩端無確切數(shù)值的資料。雙側(cè)上界: P2.5 和 P97.5 ;單側(cè)上界: P95,或單側(cè)下界: P5常用的 u 值表參考值范圍( %)單側(cè)雙側(cè)800.8421.282901.2821.645951.6451.96992.3262.5765、分類變量資料的統(tǒng)計描述:常用相對數(shù)指標描述,包括:率,構(gòu)成比,相對比。率:說明某現(xiàn)象發(fā)生的頻率或強度。 (病死率不等于死亡率)構(gòu)成比:說明某現(xiàn)象內(nèi)部組成部分所占的比重或
6、分布,常以百分數(shù)表示。相對比:亦稱比,是 A、B 2 個有關(guān)指標之比,說明 A 為 B 的若干倍或百分之幾。兩個指標可以性質(zhì)相同,也可以性質(zhì)不同。應用相對數(shù)時的注意事項:1 、計算相對數(shù)的分母不宜過??; 2、分析時不能以構(gòu)成比代替率; 3、對觀察單位數(shù)不等的幾個率,不能直接相加求其平均率; 4、比較相對數(shù)時應注意其可比性; 5、對樣本率(或構(gòu)成比)的比較應遵循隨機抽樣,并做假設檢驗。6、標準化法:標準化的目的在于消除混雜因素對結(jié)果的影響,使資料更具有可比性。其基本思想是:將所比較的兩組或多組資料的構(gòu)成按統(tǒng)一的“標準”調(diào)整后,計算標化率,使其更具有可比性。標準化率的計算方法: 亦稱標化率, 直接
7、法用于已知被標化組的年齡別率, 以及已知標準組的年齡別人口數(shù)或年齡別人口構(gòu)成比時; 間接法用于已知被標化組的年齡別人口數(shù)與發(fā)病 (死亡)總數(shù),但年齡別率未知,以及已知標準組年齡別發(fā)?。ㄋ劳觯┞逝c總發(fā)?。ㄋ劳觯┞蕰r。通??蓮南铝?3 種方法選用標準組: 以兩組資料中任一組的年齡別人口數(shù)或構(gòu)成比作為標準組;以兩組資料合并的各年齡組的人口數(shù)或構(gòu)成比作為標準組; 以公認的或便于與他人資料比較的標準作為標準組。7、統(tǒng)計表:結(jié)構(gòu):由標題、標目、線條和數(shù)字構(gòu)成。編制統(tǒng)計表的要求:標題:概括表的內(nèi)容,列于表的上方居中,應注明時間和地點;標目:主語和謂語分別列于橫、縱標目,文字簡明,層次清楚。橫標目列于表的左側(cè)
8、,通常為被研究的事物,縱標目列于表的上端,為說明橫標目的統(tǒng)計指標。線條:通常,除表的頂線、底線、縱標目下以及合計上的橫線外,其余線條均省去,頂線和底線應略粗些,表的左上角不宜用斜線。數(shù)字:用阿拉伯數(shù)字表示, 同一指標的小數(shù)位數(shù)要一致并對齊, 數(shù)字暫缺或無數(shù)字者分別用“”或“ - ”表示,數(shù)字為 0 者要記作“ 0”,不應空項,為方便核實和分析,應有合計。備注:一般不列入表內(nèi),必要時可用“* ”標出,列于表下。8、統(tǒng)計圖:條圖:用于相互對比關(guān)系的資料;圓圖與百分條圖:適用于百分構(gòu)成比資料,表示事物各組成部分所占的比重或構(gòu)成;線圖:用于連續(xù)性資料, 用于說明事物在時間上的發(fā)展變化,或某現(xiàn)象隨另一現(xiàn)
9、象而變動的情況;直方圖:表示連續(xù)性資料的頻數(shù)分布;散點圖:適用于直線相關(guān)分析,說明兩個變量間的數(shù)量關(guān)系和變化趨勢。抽樣分布與參數(shù)估計抽樣研究的目的是用樣本信息來推斷總體特征, 即統(tǒng)計推斷,包括兩個內(nèi)容: 一是總體參數(shù)的估計,二是假設檢驗。1、抽樣誤差:由于變異的存在,抽樣研究所造成的樣本統(tǒng)計量與總體參數(shù)之間的差異或各樣本統(tǒng)計量之間的差異稱為抽樣誤差。常用標準誤 x 反映均數(shù)抽樣誤差的大??;用率的標準誤p 反映率的抽樣誤差的大??;用Possion 計數(shù)的標準誤 反映其抽樣誤差的大小。2、中心極限定理和正態(tài)分布推理:從正態(tài)分布N(, 2 )總體中以固定 n 隨機抽取樣本,樣本均數(shù) x 的分布仍服從
10、正態(tài)分布,即使是從偏態(tài)分布總體中隨機抽樣,只要n 足夠大, x 的分布也近似正態(tài)分布。樣本均數(shù)的均數(shù)仍為,樣本均數(shù)的標準差為x 。樣本均數(shù)的抽樣誤差x (簡稱標準誤)是反映均數(shù)抽樣誤差大小的指標。x =S用樣本均數(shù) S 作為的估計值,則 sx =nn3、t 分布:將 x 看成變量值,那么可將正態(tài)變量進行u 變換(u= x - / )后,也可將 N(,2x )變換成標準正態(tài)分布N( 0,1)。常用 s 作為的估計值,統(tǒng)計量為t ,此分布為 t 分布。統(tǒng)計量 t=xt曲線的形態(tài)變化與自由度v 的大小有關(guān)。 v 越小, t 值越分散,曲線越低sx平, v 逐漸增大時,則t 分布逐漸逼近正態(tài)分布,當
11、v=無窮大時, t 分布即為 u 分布。4、總體均數(shù)的估計有兩種方法:一種是點估計,即用統(tǒng)計量x 估計總體均數(shù);二是區(qū)間估計,亦稱可信區(qū)間。( 1)未知且 n ?。?x -t /2 ,v s x x +t /2 , v s x( 2)未知,但 n 足夠大, t 分布逼近 u 分布: x -u /2 sx x +u /2 sx( 3)已知: x -u /2 x x +u/2 x標準差和標準誤的比較標準差標準誤( x x)2sx = sS=n 1n表示觀察值的變異程度大小估計均數(shù)的抽樣誤差大小計算變異系數(shù) CV=s100%估計總體均數(shù)可信區(qū)間xx-t /2 , vsx+t/2 , vsxx確定醫(yī)學
12、參考值的范圍進行假設檢驗計算標準誤數(shù)值變量資料的假設檢驗1、假設檢驗的原理:假設在一次抽樣研究中得出了u1.96 ,則 P 0.05 ,此為小概率事件,依據(jù)“小概率事件在一次隨機試驗中認為是不可能發(fā)生的”的定理,可認為此樣本不是來自該總體。2、步驟:建立假設和確定檢驗水準;假設有兩種,一種是檢驗假設,常稱無效假設或零假設,記為 H0,假設樣本所代表的總體參數(shù)與已知總體參數(shù)相等;另一種是備擇假設 ,記為 H1 ,是與 H0 相聯(lián)系且對立的假設;檢驗水準,亦稱顯著性水準,是判斷拒絕或不拒絕H0,也是允許犯型錯誤的概率 ,通常用 0.05 。選定檢驗方法和計算統(tǒng)計量確定 P 值,做出推斷結(jié)論。 P
13、值是指從 H0 所規(guī)定的總體中隨機抽樣時,獲得等于及大于現(xiàn)有樣本統(tǒng)計量的概率。3、t 檢驗:適用于:樣本均數(shù)與總體均數(shù)比較(未知且n50 或 n30);成組設計的兩小樣本均數(shù)的比較( n1 ,n2 均小于 30 或 50);配對設計的兩樣本均數(shù)比較。應用條件:當樣本含量較?。╪ 50 或 n30)時,要求樣本來自正態(tài)分布總體;用于成組設計的兩樣本均數(shù)比較時,要求兩樣本來自總體方差相等的總體。4、單樣本 t 檢驗:用于樣本均數(shù)與已知總體均數(shù)的比較,研究目的是推斷樣本所代表的總體均數(shù)與已知總體均數(shù) 0 有無差別。統(tǒng)計量t=x0v=n-1s /n5、配對 t 檢驗:用于配對設計資料的 兩均數(shù)的 比較
14、。其研究目的是推斷某種處理有無作用,或兩種處理的效果有無差別。配對設計類型有 3 種:先將受試對象按配比條件配對,然后用隨機分組方法將各對中的 2 個受試對象分別分配到不同的處理組; 同一對象分別接受 2 種不同處理; 同一對象處理前后。 t=d( d 是差值的樣本均數(shù)) v=n-1sd /n6、兩樣本 t 檢驗:用于 完全隨機設計的兩樣本均數(shù)的比較,兩個樣本來自兩個總體,其研究目的是推斷兩樣本所分別代表的總體均數(shù)是否相等。x1 x2x1x2=x1x2v=n +n -2t=Sx1 x22 11s21) s212(n(n21)11sc ()112n1 n22()n1n2n1n27、單樣本 u 檢
15、驗:用于樣本均數(shù)與已知總體均數(shù)比較,其研究目的同t 檢驗。研究目的是推斷樣本所代表的總體均數(shù)與已知總體均數(shù) 0 有無差別。其統(tǒng)計量 u= x 0 s/ n8、兩樣本的 u 檢驗:用于完全隨機設計的兩樣本均數(shù)的比較,兩個樣本來自兩個總體,其研究目的是推斷兩樣本所分別代表的總體均數(shù)是否相等。其統(tǒng)計量為:u= x1x2 =x1x2sx1 x2s12 / n1s22 / n29、正態(tài)性檢驗和方差齊性檢驗: 資料在做假設檢驗之前首先應該檢驗資料是否來自正態(tài)總體,并且它們的方差是否齊。10、兩類錯誤:的總體,由于抽樣的偶然性, 按 =0.05型錯誤: 拒絕了實際上成立的 H, 即樣本來自 =00檢驗水準拒
16、絕了 H0, 接受 H1。這類在假設檢驗中拒絕了原本正確的H0 的錯誤稱為型錯誤。,理論上犯型錯誤的概率為,值得大小視研究目的而定。通常設=0.05 。型錯誤:不拒絕了實際上不成立的 H0 ,即樣本來自 0 的總體,由于抽樣的偶然性,按 =0.05 檢驗水準不拒絕 H,這類在假設檢驗中不拒絕原本不正確的H 的錯誤稱為型錯誤。00犯型錯誤的概率為,它只有與特定的H1 結(jié)合起來才有意義。同時減少和的方法是 增加樣本含量 。1- 稱為檢驗效能或把握度 ,即兩總體確有差別時,按水準能識別該差別的能力。 如 1- =0.95 表示:若兩總體確有差別, 理論上平均 100 次抽樣中,有 95 次能得出兩總
17、體有差別的結(jié)論。11、假設檢驗時應注意的事項:要有嚴密的抽樣研究設計- 假設檢驗的前提正確選用檢驗方法: 完全隨機的設計的兩數(shù)值變量資料比較時, 若 n 小且方差齊,則選用兩樣本 t 檢驗;若方差不齊,則選用 t 檢驗或成組設計的兩樣本比較的秩和檢驗;若 n1 ,n2 均大于 50,則選用兩樣本 u 檢驗。正確理解“顯著性”的含義對差別有無統(tǒng)計學意義的判斷 不能絕對化 。方差分析1、基本思想:按研究目的和設計類型,將總變異的離均差平方和SS 和自由度v 分別分解成若干部分,并求得各相應部分的變異。其中的組內(nèi)變異或誤差主要反映個體差異或抽樣誤差,其它部分的變異與之比較得出統(tǒng)計量 F 值,由 F
18、值的大小確定 P 值,并作出推斷,從而了解該因素對觀測指標有無影響。組內(nèi)變異主要由個體差異所致,組間變異可能由兩種原因所致:一是抽樣誤差,二是由于接受的處理不同。2、總離均差平方和SS和自由度 vk2niSS總 =(xij x) = x 2( x) 2 / ni 1j 1v 總 =n-13、組間離均差平方和SS組間 ,自由度 v 組間 和均方 MS組間nik (xij ) 2( x)2組間SS組間 =j 1v 組間 =k-1MS 組間=SSninv 組間i 14、組內(nèi)離均差平方和 SS組內(nèi) ,自由度 v 組內(nèi) 和均方 MS組內(nèi)SS組內(nèi) =SS總-SS 組間 v 組內(nèi) =n-k MS 組內(nèi) =S
19、S組內(nèi) /v 組內(nèi)多樣本均數(shù)比較的方差分析的應用條件: 各樣本是相互獨立的隨機樣本; 各樣本來自正態(tài)分布總體;各總體方差相等,即方差齊。5、完全隨機設計資料的方差分析:亦稱單因素的方差分析,可用于完全隨機設計的多個樣本均數(shù)比較的資料,研究目的是推斷各個樣本所代表的總體均數(shù)是否相等。單因素方差分析的計算公式變異來源SSvMSF總變異x 2Cn-1nixij ) 2k(SS組間MS組間j1Ck-1組間變異niv 組間MS組內(nèi)i1組內(nèi)變異SS總 -SS 組間n-kSS組內(nèi) /v 組內(nèi)*C 為校正系數(shù) C= (x) 2 / n6、配伍組設計資料的方差分析:亦稱兩因素的方差分析,用于配伍組設計的多個樣本
20、均數(shù)比較的資料,其研究目的是推斷各樣本所代表的總體均數(shù)是否相等, 但考慮了個體差異對試驗 效應的影響。兩因素方差分析的計算公式變異來源SSvMSF總變異x 2Cn-1bxij ) 2k(j1Ck-1SS處理 /v 處理處理組MS 處理 /MS 誤差i 1bkxij ) 2b(配伍組i1Cb-1SS配伍/v配伍MS配伍/MS誤差kj1誤差SS 總 -SS 處理 -SS 配伍(k-1)( b-1)SS 誤差 /v 誤差*C 為校正系數(shù)C= (x) 2 / n b為配伍組數(shù)分類資料的假設檢驗1、二項分布: 應用條件:各觀察單位只能具有兩種相互對立的結(jié)果已知發(fā)生某結(jié)果的概率為,其對立結(jié)果的概率為 1-
21、 n 次試驗是在相同的條件下進行的。性質(zhì): =n= n(1)若均數(shù)和標準差用率表示,則p= p= (1 )/ n未知時,用樣本率P 作為的估計值,則Sp=p(1p) / n總體率的估計:正態(tài)近似法:當樣本含量 n 足夠大,且樣本率 p 或 1-p 均不太小,如 np 與 n ( 1-p )均大于 5 時樣本率 p 的抽樣誤差分布近似正態(tài)分布, 可信區(qū)間為:( p-u /2 Sp,p+u /2 Sp)2、Poisson分布:對于二項分類變量,若某結(jié)果發(fā)生的概率很小,如 0.05 時,單位時間、人群、空間內(nèi)“陽性”發(fā)生次數(shù) x(x=0,1,2, )的概率可用 Poisson分布概率函數(shù)來描述:xP
22、(X)= e( / x?。┻f推公式: P( 0) =eP(x)=P(x1)x應用條件: 0.05 外,其余同二項分布。分布的性質(zhì):( 1)、Poisson 分布式一種單參數(shù)的離散型分布,其參數(shù)為,表示單位時間、人群、空間內(nèi)某事件平均發(fā)生的次數(shù)。2( 2)、Poisson分布的方差 與均數(shù)相等。( 3)、Poisson分布可以看成是二項分布的極限形式。( 4)、Poisson 分布的極限形式也是二項分布,一般當 n20 時,可按正態(tài)分布處理,當 0.01 時,二項分布可以當作 Poisson 分布來處理。( 5)、Poisson 分布具有 可加性 ??傮w均數(shù)的估計:(正態(tài)近似法)xux , xu
23、x/ 2/ 23、服從二項分布資料的假設檢驗:( 1)樣本率和總體率的估計:k直接計算法:最多有k 例陽性的概率: P(x k)=P( x)0nk 1最少有 k 例陽性的概率: P( x k) =P( x) =1-P( x)k0不太靠近 05) 5正態(tài)近似法: 當 0或 1,且樣本含量 n 足夠大;或 n 0且 n( 1- 0時,二項分布接近正態(tài)分布。P0=xn0u=( )nn(10 1000 )( 2)兩樣本率的比較:目的是推斷兩個樣本各自代表的兩總體率是否相等,當兩個樣本率均滿足正態(tài)近似條件時,可用 u 檢驗。其公式為: u= p1p2 =p1 p2s p1p211)pc (1 pc )(
24、n2n1pc 為合并陽性率, pc=( x1+x2)/(n1+n2)x1,x2 為兩個樣本的陽性例數(shù)。4、服從 Poisson分布的假設檢驗:對于 Poisson分布的假設檢驗,對于總體均數(shù)可以用乘法將小單位化大, 也可以用除法將大單位化小, 對于樣本均數(shù), 只能用除法將大單位化小, 而不能用乘法將小單位化大。( 1)樣本均數(shù)與總體均數(shù)的比較:適用于0 20,且樣本陽性數(shù)X 較小作單側(cè)檢驗時。k直接計算法:最多有k 例陽性的概率:P(x k)=P( x)0nk 1最少有k 例陽性的概率:P( x k) =P( x)=1-P( x)k0正態(tài)近似法:當 20 時, Poisson 分布逼近正態(tài)分布
25、。 u=( x0 )0( 2)兩樣本陽性數(shù)的比較:目的是推斷兩樣本各自代表的兩總體平均數(shù)是否相等。當兩樣本陽性數(shù) X 1,X 2 均大于 20 時,可用 u 檢驗。其計算用兩種情況:兩樣本觀察單位(時間、面積、容積等)相同時:u=x1x2=x1x2x1x2x1x2兩樣本觀察單位(時間、面積、容積等)不同時:u=x1x2x1n1x2n25、222 。2檢驗:是一種連續(xù)型分布,u 分布的平方即為分布 。對于同一份資料, u 222檢驗的檢驗統(tǒng)計量為(A T ) ,自由度v=(行數(shù) -1)(列數(shù) -1),其基本公式為: 2T式中 A 為實際頻數(shù), T 為理論頻數(shù)。理論頻數(shù)T 的計算公式為:TRCnR
26、 * nCT為第 RnRC行第 C 列的理論頻數(shù), nR 為相應行的合計, C為相應列的合計,n為總例數(shù)。自由度(R-1)nv=( C-1).22反映了實際頻數(shù)與理論頻數(shù)的吻合程度。只有考慮了自由度v 的影響,值才能正確地反應實際頻數(shù)A 和理論頻數(shù) T 的吻合程度。6、四格表資料的2的判斷, R 行與 C 列中,行合計數(shù)中的最小值與檢驗:最小理論頻數(shù)T RC列合計數(shù)中的最小值所對應的理論頻數(shù)最小。( 1)四個表資料22( adbc) 2 n檢驗的專用公式:( ab)(cd )(a c)(b d )( 2)四個表資料2檢驗的校正公式:2( A T0.5) 22( adbcn 2)2 nTc(a
27、b)(c d )( a c)(b d)在實際工作中,對于四個表資料,通常規(guī)定為:2檢驗的基本公式或四個表資料2( 1)當 n40 且所有的 T 5 時,用檢驗的專用公式;當 P時,改用四個表資料的Fisher 確切概率法。( 2)當 n40,但 1T5 時,用四格表資料的2檢驗的校正公式;或改用四個表資料的Fisher 確切概率計算法。( 3)當 n40,或 T 1 時,用四個表資料的 Fisher 確切概率法。( 4)2連續(xù)性校正僅用于 v=1 的四格表資料,尤其是 n 小時。當 v2 時一般不做校正。7、配對四個表資料的2b 和 c檢驗:由于在抽樣研究中,抽樣誤差是不可避免的,樣本中的2(
28、bc)2v=1 (條往往不相等(即 b c),為此,需進行假設檢驗,其檢驗統(tǒng)計量為:bc件為: b+c 40)2( b c1) 2v=1 (條件為: b+c40)bc本方法只適用于樣本含量不太大的資料,它僅考慮了兩種方法結(jié)果不一致的情況,而未考慮樣本含量 n 和兩種方法一致的兩種情況,所以當n 很大且 a 與 d 的數(shù)值也很大, 而 b 與 c的數(shù)值相對較小時 ,即使檢驗統(tǒng)計結(jié)果有統(tǒng)計學意義,其實際意義也不大。28、行* 列表資料的檢驗:只適用于多個樣本率的比較,兩個或多個構(gòu)成比的比較以及雙向無序分類資料的關(guān)聯(lián)性檢驗。其基本數(shù)據(jù)由三種情況:多個樣本率的比較時,有R行2列,稱為 R*2 表兩個樣
29、本的構(gòu)成比比較時,有2列C列,稱為 2*C 表多個樣本的構(gòu)成比比較以及雙向無序分類資料關(guān)聯(lián)性檢驗時,有R 行 C 列,稱為 R*C 表。以上三種可統(tǒng)稱為行 * 列表資料基本公式:基本公式為:2(A T)2T專用公式:2(A21)自由度v=(行數(shù)-1)(列數(shù)-1)nnR nC注意事項:一般人行 * 列表資料中各格的理論頻數(shù)不能小于1,且 1T5 格子數(shù)不能超過總數(shù)的1/5。如果出現(xiàn)以上情況, 可通過以下方法解決: 最好是增加樣本含量, 使得理論頻數(shù)增大; 根據(jù)專業(yè)知識,考慮能否刪去理論頻數(shù)太小的行和列,能否將理論頻數(shù)太小的行和列于性質(zhì)相近的鄰行或鄰列合并;改用雙向無序R*C 的 Fisher 確
30、切概率計算法。當多個樣本率比較時,所得統(tǒng)計推斷為拒絕H0,接受 H1 時,只能認為各樣本率間總的來說有差別,但不能說明任兩個樣本率間均有差別,需要做多個樣本率的多重比較。對于 有序的 R*C 表資料不宜用2檢驗。對于 R*C 表的資料要根據(jù)分類類型和研究目的選用恰當?shù)臋z驗方法。9、雙向無序分類資料的關(guān)聯(lián)性檢驗: 對于此資料,常常需要分析兩個分類變量之間有無關(guān)系,2關(guān)系的密切程度如何,進一步分析密切程度時,可以用Pearson 列聯(lián)系數(shù) r p , r p2nr p 取值在 01 之間, 0 表示完全不相關(guān), 1 表示完全相關(guān),愈接近于0,關(guān)系愈不密切,愈接近 1,關(guān)系愈密切。11、R*C 表的
31、分類及檢驗方法的選擇:分類:雙向無序、單向有序、雙向有序?qū)傩韵嗤碗p向有序但屬性不同四種。雙向無序 R*C 表:兩個分類變量皆為無序分類變量,對于該資料:如果研究目的為兩個2樣本率(或構(gòu)成比)的比較,可用行* 列資料的檢驗;如果研究目的是分析兩個分類變量之間有無關(guān)聯(lián)性以及關(guān)系的密切程度時,可用行 * 列表資料的2檢驗以及 Pearson列聯(lián)系數(shù)進行分析。單向有序 R*C 表:有兩種形式:一種是 R*C 表的分組變量是有序的, 而指標變量是無序的;2研究的目的通常是多個構(gòu)成比的比較,可用行* 列表資料的檢驗進行分析。另一種是R*C表中的分組變量是無序的, 而指標變量是有序的, 研究目的通常是多個
32、 等級資料的比較, 可用秩和檢驗或 Ridit 分析。雙向有序?qū)傩孕瓮?R*C 表:兩個分類變量皆為有序且屬性相同,研究目的通常是分析兩種檢測方法的一致性,此時宜用 一致性檢驗(或稱 Kappa 檢驗);也可用特殊模型分析方法。雙向有序?qū)傩圆煌?R*C 表:兩分類變量皆為有序的,但屬性不同,對于該資料:如果研究目的是分析不同年齡組患者療效見有無差別,可把它視為單向有序的 R*C 表資料,選用秩和檢驗; 如果研究目的是分析兩個有序分類變量間是否存在相關(guān)關(guān)系, 可以用等級相關(guān)分析或 Pearson積矩相關(guān)分析;如果研究目的是分析兩個有序分類變量是否存在線性變化趨勢,可以用有序分組資料的線性趨勢
33、檢驗。非參數(shù)檢驗非參數(shù)檢驗的統(tǒng)計推斷基礎是比較分布而不是比較參數(shù), 所以不必考慮被研究對象的為何種分布以及分布是否已知。 在實際工作中, 對符合參數(shù)檢驗應用條件的資料, 或經(jīng)變量變換后符合參數(shù)檢驗應用條件的資料應首選參數(shù)檢驗; 而不能滿足參數(shù)檢驗應用條件的資料, 應選用非參數(shù)檢驗。主要選擇編秩的方法,比較統(tǒng)計變量 T,而做出統(tǒng)計推斷。直線回歸與相關(guān)分析1、直線相關(guān):如果兩個隨機變量中,當其中的一個變量由大到小的變化時,另一個變量也相應的由大到小(后由小到大)的變化,并且相應變化的散點圖在直角坐標系呈現(xiàn)直線趨勢,則稱這兩個隨機變量存在直線相關(guān)。相關(guān)分析是研究變量和變量集合之間數(shù)量協(xié)同變化關(guān)系的密
34、切程度和方向的統(tǒng)計方法。要求:兩個變量X 和 Y 都服從正態(tài)分布,嚴格說應服從雙變量正態(tài)分布。直線相關(guān)系數(shù):用于說明具有直線相關(guān)關(guān)系的兩個變量間的相關(guān)關(guān)系的密切程度和相關(guān)方向;亦稱積差相關(guān)系數(shù),總體的為,樣本的為。x和y的協(xié)方差( xx)( yy)l xy(的方差)( 的方差)( xx)2( yy)2l xx l yyxy的取值在 -1,1 之間。其意義如下:若0 則 X 與 Y 存在直線相關(guān)關(guān)系;0 為正相關(guān);0 為負相關(guān);越大,說明兩變量間的相關(guān)關(guān)系越密切;越小,說明兩變量間的相關(guān)關(guān)系越不密切;若1為完全相關(guān);若0 ,則X 和Y 不存在相關(guān)關(guān)系。 01 表示存在不同程度的線性相關(guān)關(guān)系:00
35、.4 為低度線性相關(guān);0.40.7 為顯著線性相關(guān);0.71 為高度顯著線性相關(guān)。相關(guān)分析的步驟 :(在 X 與 Y 均服從雙變量正態(tài)分布的情況下)繪制散點圖 :呈線性趨勢,計算相關(guān)性;呈曲線趨勢,進行曲線擬合;無任何趨勢,不必分析。根據(jù)上述公式計算的值;相關(guān)系數(shù)的假設檢驗,由于抽樣誤差的存在,判斷是否來自0 的總體,常用 t 檢驗,公式:t0n2(或直接查 t 界值表)s12 n 2總體相關(guān)系數(shù)的區(qū)間估計:當0時,從這樣的總體中抽樣,計算出的不服從正態(tài)分布,而進行反正切變換后,n 較大時, Z 近似服從均數(shù)為Z,方差為21的正態(tài)分布。n31(1 )2z1則 Z 的可信區(qū)間為(u(n 3) ,
36、u(n 3) ),對其進行e2ln2z1e1的變換,可以得出的可信區(qū)間。直線相關(guān)分析的注意事項: 算相關(guān)系數(shù)時首先繪制散點圖,判斷兩變量是否存在線性趨勢;相關(guān)分析時要求X 、Y 均為隨機變量,而不能用于事先界定X 、Y 的資料;相關(guān)分析時必須剔除異常點;相關(guān)分析要有實際意義,兩變量相關(guān),并不一定存在聯(lián)系,可能是另外一種因素引起的;分層資料不宜盲目的合并, 進行相關(guān)分析; 同時進行相關(guān)分析時, 如果不能確定各層研究對象具有同質(zhì)基礎,不宜盲目合并。不能將假設檢驗中 顯著性大小 理解為兩變量 相關(guān)程度的 大小,后者是由相關(guān)系數(shù)的大小決定的。2、等級相關(guān):適用于不服從雙變量正態(tài)分布或總體分布未知的資料
37、,還可用于等級資料的相關(guān)分析。等級相關(guān)系數(shù)表示兩個變量間相關(guān)系數(shù)的密切程度與相關(guān)方向。s基本思想:對于不符合正態(tài)分布的資料或等級資料, 將兩個變量的原始觀察值分別由小到大編秩,然后利用量變量的秩次計算相關(guān)系數(shù)。3、直線回歸:處理兩個變量間線性數(shù)量依存關(guān)系的一種統(tǒng)計分析方法。?為應變量, 給定 x 的 y 的條件均數(shù)的估計值; b 為回歸斜率, 表示回歸方程為: y a bxy當自變量 x 每變化 1 個單位時,應變量y 平均變化 b 個單位; a 為截距,表示沒有自變量x 時其他因素對 y 的平均影響。線性回歸模型的前提條件:線性:應變量 y 的總體均數(shù)與自變量 x 呈線性關(guān)系;因此進行回歸分
38、析前應先繪制散點圖;獨立:任意兩個觀察單位之間相互獨立;正態(tài)性:對任意給定 x 的值, y 均服從正態(tài)分布;該分布的均數(shù)是回歸直線上與 x 值相對應的那點的縱坐標;等方差:自變量x 的取值范圍內(nèi),不論x 取什么值, y 都具有相同的方差。直線回歸分析的步驟 :繪制散點圖,通過觀察散點的形態(tài)來判斷線性假設是否成立;建立直線回歸方程,即求出回歸參數(shù)a 和 b;通常用最小二乘法估計參數(shù),即要求殘差平方和達到最??;nbi 1( xi x)( yi y)l xyl xxx2(x) 2nl xxn( xi x) 2i 1a ybxl xy(x)( y)xyn繪制回歸線;注意:不應超過x 的實測值范圍;所繪
39、制的直線必然通過( x , y );直線的左端延長與縱軸的焦點必然是截距a?;貧w方程的假設檢驗:檢驗方法有方差分析和t 檢驗方差分析:基本思想:將應變量y 的總變異 SS 總 分解成 SS 回歸 和 SS 剩余 兩部分,然后利用 F檢驗來判斷回歸方程是否成立。任意一點 P(x,y)的縱坐標被回歸直線與均數(shù)y 截成 3 段:三部分的變異可以表示為:( y y)2=?2+? 2( y y)( y y)即 SS 總=SS 回歸 +SS 剩余各部分的意義:SS 總 :即 l yy =( yy) 2 ,為 y 的總離均差平方和,反映未考慮x 和 y 的回歸關(guān)系時的 y 的變異;SS回歸:即?y)2,稱回
40、歸平方和,反映在y的總變異中,由于x和y的直線關(guān)系而使y( y變異減小的部分,即在總變異中可以用x 解釋的部分; SS 回歸 越大,說明回歸效果越好,即 SS總 中可用 X 與 Y 線性關(guān)系解釋的變異越多。SS剩余:即( y? 2,殘差平方和或剩余平方和, 反映x和y的線性影響之外的一切因素對yy)的變異的作用,即在總變異中無法用 x 解釋的部分。該部分越小說明直線回歸的估計值誤差越??;各部分的自由度為:總 =回歸+ 剩余總 =n-1, 回歸 =1, 剩余 =n-2各部分變異的計算公式為:SS總=( yy)2 = y 2(y) 2統(tǒng)計量 F 的計算公式: Fn2l xySS回歸bl xyl x
41、xSS剩余 =SS 總 -SS 回歸SS回歸回歸MS回歸SS剩余剩余MS剩余回歸系數(shù)的 t 檢驗:基本思想:通過樣本回歸系數(shù) b 與總體均數(shù)回歸系數(shù)進行比較來判斷回歸方程是否成立。有關(guān)公式如下:t bb;n 2 ; sbsXY; sXYMS剩余sbl xxsXY 為剩余標準差,是指扣除了x 因變量線性影響后離散程度。擬合效果評價: 回歸模型的擬合優(yōu)度假設檢驗,檢驗回歸方程對樣本數(shù)據(jù)的擬合程度。決定22( y?y)系數(shù) R表示, R( yy)22SS回歸222RSS總Rr總體回歸系數(shù)的區(qū)間估計: ( b t.sb , b t.sb ),n 2,n 222回歸方程的應用:利用回歸方程進行預報;統(tǒng)計
42、控制。直線回歸分析的注意事項: 回歸分析要有實際意義, 注意變量之間的內(nèi)在聯(lián)系和規(guī)律, 兩變量之間還必須是因果關(guān)系; 對資料的要求:一般 y 來自正態(tài)總體的隨機變量, x 可以是正態(tài)總體的隨機變量,也可以是精確測量和嚴密控制的值; 進行分析前應先繪制散點圖; 必須剔除一些異常點; 回歸方程的適用范圍不能隨意外延。其適用范圍一般以自變量取值范圍為界。直線相關(guān)和回歸的區(qū)別與聯(lián)系:區(qū)別:資料的要求不同:相關(guān)要求兩個變量呈雙變量正態(tài)分布;回歸要求 y 服從正態(tài)分布,而 x 可以是精確測量和嚴格控制的變量;統(tǒng)計意義不同: 相關(guān)反映的是兩變量間的伴隨關(guān)系, 二者的關(guān)聯(lián)程度如何, 而回歸反映的是兩變量間的依
43、存關(guān)系,即因果關(guān)系,或從屬關(guān)系;分析的目的不同: 相關(guān)分析的目的是描述兩個變量間的相互關(guān)系,用 r 來反映這種關(guān)系的方向以及密切程度, 而回歸分析的目的是描述兩個變量間的數(shù)量依存關(guān)系,從而進行統(tǒng)計預測和統(tǒng)計控制;聯(lián)系:對于同一資料, r 和 b 的符號一致,說明兩變量間關(guān)系的方向;相關(guān)系數(shù)與回歸系數(shù)的假設檢驗是等價的,對于同一樣本,trtb,實際應用中只檢驗其中之一即可;二者可以相互解釋, 相關(guān)系數(shù)的平方和等于回歸平方和占總平方和的比例, 即反映應變量 y 的總變異中歸因于 x 的部分;實驗設計的概述實驗室研究:以動物或標本為研究對象實驗研究的分類臨床試驗:以人為研究對象社區(qū)干預試驗:以社區(qū)人群為研究對象,又稱半試驗性研究處理因素試驗設計的基本因素受試對象實驗效應1、處理因素:研究者根據(jù)研究目的確定的,通過合理安排實驗,從而科學的考察其作用大小的因素;非處理因素:對正確的評價處理因素的作用有一定的干擾,但研究者并不想通過本次實驗考察其作用大小的因素;注意事項:要區(qū)分處理因素和非處理因素;主要依據(jù)研究目的來確定;抓住實驗中的主要因素,且因素的水平數(shù)不宜過多;處理因素必須標準化,即保證處理因素在整個實驗過程中始終如一,保持不變;2、實驗效應
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 風電產(chǎn)業(yè)知識與教育深度融合的未來趨勢研究
- 海洋氫能領域突破:電解槽陣列行業(yè)的市場分析與可行性研究
- 2025至2030落地扇行業(yè)市場深度調(diào)研及供需格局及有效策略與實施路徑評估報告
- 職場女性的性健康管理與維護
- 藝術(shù)教育培訓行業(yè)發(fā)展報告及市場現(xiàn)狀調(diào)研
- 2025至2030燃氣汽車行業(yè)產(chǎn)業(yè)運行態(tài)勢及投資規(guī)劃深度研究報告
- 2025至2030中國自行車外設行業(yè)市場占有率及投資前景評估規(guī)劃報告
- 2025至2030中國自動拖鞋機行業(yè)市場占有率及投資前景評估規(guī)劃報告
- 2025至2030中國自動去毛刺行業(yè)產(chǎn)業(yè)運行態(tài)勢及投資規(guī)劃深度研究報告
- 2025至2030中國自動催化鍍行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 棘阿米巴角膜炎診斷與治療專家共識(2025) 解讀
- 物業(yè)公司接管寫字樓項目工作時間倒推計劃表(T日為入駐日)
- 重點人口管理工作規(guī)定
- T-CALC 005-2024 急診患者人文關(guān)懷規(guī)范
- T-AHLPA 0003-2024 古樹名木雷電災害風險評估技術(shù)規(guī)范
- 病理學小鼠取材
- 勞務外包服務投標方案(技術(shù)標)
- 《中醫(yī)體重管理臨床指南》
- PCR實驗室(新冠核酸檢測實驗室)SOP文件 (一)
- 委托代辦購買水果合同范例
- 2024至2030年輕鋼隔墻龍骨項目投資價值分析報告
評論
0/150
提交評論