




已閱讀5頁,還剩41頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
醫(yī)學(xué)統(tǒng)計學(xué)及其軟件包,上海第二醫(yī)科大學(xué) 生物統(tǒng)計教研室,第一章 緒論,第一節(jié) 醫(yī)學(xué)統(tǒng)計學(xué), 數(shù)學(xué) 統(tǒng)計學(xué) 醫(yī)學(xué)統(tǒng)計學(xué),第一節(jié) 醫(yī)學(xué)統(tǒng)計學(xué),1.統(tǒng)計學(xué) (statistics):收集,整理和分析帶有隨機性的數(shù)據(jù)。 2.醫(yī)學(xué)統(tǒng)計學(xué) (medical statistics):統(tǒng)計學(xué)的原理和方法在醫(yī)學(xué)和生物學(xué)中的應(yīng)用。,第一節(jié) 醫(yī)學(xué)統(tǒng)計學(xué),醫(yī)學(xué)統(tǒng)計學(xué)的主要內(nèi)容有: 1.統(tǒng)計研究設(shè)計 2.統(tǒng)計描述 3.統(tǒng)計推斷 4.研究聯(lián)系 5.研究分類,鑒別 6.研究檢測,統(tǒng)計研究設(shè)計,1.估計研究對象的數(shù)量(樣本大小估計) 2.跟據(jù)研究目的確定對照的類型 3.保證隨機化和雙盲原則的貫徹 4.跟據(jù)研究目的確定主要和次要考核指標 5.如何收集和匯總數(shù)據(jù)以保證數(shù)據(jù)質(zhì)量 6.如何進行統(tǒng)計分析,統(tǒng)計研究設(shè)計,1調(diào)查研究或觀察性研究(observational study) 2實驗研究(experimental study),統(tǒng)計描述(statistical discription),統(tǒng)計描述指用統(tǒng)計指標、統(tǒng)計表、統(tǒng)計圖等方法,對資料的數(shù)量特征及其分布規(guī)律進行測定和描述。,統(tǒng)計推斷(statistical inference),統(tǒng)計推斷指用樣本推斷總體。 總體(population):一個統(tǒng)計問題所研究對象的全體。 總體中每一個研究對象稱為個體(individual)。 有限總體:有確定的時間和空間范圍,總體內(nèi)觀察單 位是有限的。 無限總體:沒有時間和空間范圍限制,因而觀察單位 數(shù)無限。,樣本(sample):按隨機的方式從總體中抽取若干個 體構(gòu)成一個樣本。 參數(shù)(parameter) :用于描述總體分布的數(shù)字特征 的量。如:, 統(tǒng)計量(statistics):不包含總體中任何未知參數(shù)的 樣本指標和樣本數(shù)據(jù)的函數(shù)。如: ,S,P,統(tǒng)計推斷(statistical inference),1.參數(shù)估計(estimation of parameter) 根據(jù)總體中所抽得的樣本,由樣本統(tǒng)計量估計總體分布中的未知參數(shù)。可分為點估計和區(qū)間估計。 1)點估計(point estimation):選擇一個適當(dāng)?shù)臉颖窘y(tǒng)計量作為總體參數(shù)的估計值稱為點估計。,統(tǒng)計推斷(statistical inference),統(tǒng)計推斷(statistical inference),2)區(qū)間估計(interval estimation):根據(jù)一定的精確度要求,確定一個概率水平,由樣本統(tǒng)計量計算出一個適當(dāng)?shù)膮^(qū)間作為未知總體參數(shù)真值所在的范圍,稱為區(qū)間估計。稱此概率水平為可信度,或置信度,或可信水平,或置信水平( confidence level)。所估計的區(qū)間稱為可信區(qū)間或置信區(qū)間(confidence interval),區(qū)間的端點稱為可信限(confidence limit),有上限,下限之分。,例如,估計用某方法治療某病的治愈率。從患某病的病人總體中隨機抽得100例病人進行治療,治愈50例,則可得樣本治愈率為50%??傮w治愈率的點估計為50%??傮w治愈率區(qū)間估計,當(dāng)可信度為95%時,總體治愈率的95%可信區(qū)間為40%60%。當(dāng)可信度為99%時,總體治愈率的99%可信區(qū)間為37%63%。,統(tǒng)計推斷(statistical inference),統(tǒng)計推斷(statistical inference),統(tǒng)計推斷(statistical inference),2.假設(shè)檢驗(hypothesis testing) 又稱顯著性檢驗(significance testing)。 先對總體的參數(shù)或分布作出某種假設(shè),例如總體為正態(tài)分布,兩個總體均數(shù)相等,兩總體率相等,然后檢驗這個假設(shè)成立的可能性大小,作出推斷。,統(tǒng)計推斷(statistical inference),統(tǒng)計推斷(statistical inference),無效假設(shè)(null hypothesis)H0 : 12 備擇假設(shè)(alternative hypothesis) H1 :12 然后根據(jù)檢驗假設(shè), 1270%,成立的情況 下,計算由于抽樣誤差得到目前樣本及更極端情況 的可能性大小。本例用卡方檢驗,得到檢驗統(tǒng)計量 2=9.524,根據(jù)檢驗統(tǒng)計量的分布計算概率(可 能性大小)P值,P=0.002,可能性很小。,統(tǒng)計推斷(statistical inference),概率論認為:在一次試驗中小概率事件不可能發(fā)生。 在統(tǒng)計中,一般公認為P0.05為小概率。本例P=0.0020.05,因此可認為假如12,即使抽樣誤差也不可能得到目前樣本,于是檢驗假設(shè), 12不成立;與檢驗假設(shè)對立的備擇假設(shè)成立,即12 ,A藥組的總體有效率不同于B藥組的總體有效率,從本例情況,A藥組的總體有效率大于B藥組的總體有效率。,統(tǒng)計推斷(statistical inference),如果本例用卡方檢驗,得到其可能性大小P=0.08 0.05,這個概率不是很小,有可能檢驗假設(shè), 1 2 ,成立的情況下,由于抽樣誤差得到目前樣本, 所以不能拒絕檢驗假設(shè)。 總結(jié)假設(shè)性檢驗的過程。 (1)建立H0,H1和確定顯著性水準(significance level, 用表示,常取0.05) (2)選擇合適的統(tǒng)計檢驗方法,計算統(tǒng)計量。 (3)根據(jù)檢驗統(tǒng)計量的分布計算概率P值, 根據(jù)P值 作出統(tǒng)計的推斷結(jié)論。,統(tǒng)計推斷(statistical inference),P值:根據(jù)H0規(guī)定的總體情況,作隨機抽樣,獲得 大于等于現(xiàn)有樣本統(tǒng)計量值的概率。 如果P0.05,則不拒絕H0;0.01P0.05,則在 =0.05水平上,拒絕H0;P0.01 則在=0.01水 平上,拒絕H0。 假設(shè)檢驗的特點: (1)反證法。 (2)結(jié)論是概率性的,不是絕對的肯定或否定,有 犯錯誤的可能性,假設(shè)檢驗時應(yīng)注意的問題,1.要有嚴密的抽樣研究設(shè)計 保證樣本的隨機性 組間的均衡性和可比性:除了對比的主要因素外其它影響結(jié)果的因素也應(yīng)可比?;蚰茉谫Y料處理時消除其影響。 2.選用的假設(shè)檢驗方法應(yīng)符合其應(yīng)用條件。 研究變量的類型不同,設(shè)計類型不同,是大樣本還是小樣本等,所用假設(shè)檢驗的方法也不同。,3.正確理解檢驗假設(shè)和備擇假設(shè) 以兩樣本均數(shù)差異的顯著性檢驗為例。 正確的寫法: H0:兩總體均數(shù)相等 H1:兩總體均數(shù)不相等 以下是錯誤的寫法。 H0:兩樣本均數(shù)相等 H1:兩樣本均數(shù)不相等 H0:兩總體均數(shù)無顯著差異 H1:兩總體均數(shù)有顯著差異 H0:兩樣本均數(shù)無顯著差異 H1:兩樣本均數(shù)有顯著差異,假設(shè)檢驗時應(yīng)注意的問題,假設(shè)檢驗時應(yīng)注意的問題,4.正確理解差別有無顯著性的統(tǒng)計意義,寫好統(tǒng)計結(jié)論 過去習(xí)慣: P0.05,兩樣本均數(shù)無顯著差異 P0.05,兩樣本均數(shù)有顯著差異 P0.01,兩樣本均數(shù)有非常顯著差異 “顯著”容易誤解為相差大,這和醫(yī)學(xué)上的差異大有區(qū)別。 不要混淆統(tǒng)計上的結(jié)論和專業(yè)上的結(jié)論。,現(xiàn)在主張: P0.05,兩樣本均數(shù)的差異無統(tǒng)計學(xué)意義( P0.05 ) P0.05,兩樣本均數(shù)的差異有統(tǒng)計學(xué)意義( P0.05 ) P0.01,兩樣本均數(shù)的差異有統(tǒng)計學(xué)意義( P0.01 ) 最好給出具體的P值,如P 0.0345 注意: “兩樣本均數(shù)的差異”,而不是“兩總體均數(shù)的差異” 從兩樣本均數(shù)的差異有統(tǒng)計學(xué)意義(P 0.0345),可 推斷出兩總體均數(shù)有差異,其結(jié)論錯誤的可能性為3.45 %,假設(shè)檢驗時應(yīng)注意的問題,兩類誤差,第一類誤差常是可控制的,=0.05,P0.05。 第二類誤差常未知。但也可根據(jù)樣本數(shù)據(jù)計算得到。 1-又稱為檢驗的效能(Power of Test),H0不成立時拒絕H0的概率。,檢驗效能(Power of Test),影響效能的四要素 (1) 客觀上兩種藥物效應(yīng)差異越大, 效能 越大。 (2) 個體間標準差越小, 效能越大。 (3) 樣本量越大, 效能越大。 (4) 第類誤差的概率越大, 效能越大。 同時降低兩類誤差的唯一辦法是加大樣本。,檢驗效能(Power of Test),例:一項關(guān)于降血壓藥的臨床試驗分設(shè)兩組隨機樣本, 各含15例。一組服用常規(guī)藥, 另一組服用新藥。如果新藥的降壓效果至少比常規(guī)藥平均高出0.8kPa方可考慮在臨床推廣; 據(jù)以往經(jīng)驗, 不論常規(guī)藥還是這種新藥, 個體降壓值的標準差約為1kPa。經(jīng)0.05水平的兩組均數(shù)比較的統(tǒng)計檢驗,兩組平均降壓效果的差異尚無統(tǒng)計學(xué)意義,此事如何理解?,檢驗效能(Power of Test),經(jīng)計算:0.2912, 1-0.7088,可見, 如果新藥的降壓 效果比常規(guī)藥高出0.8kPa, 只有70.88%的機會被此檢驗認可 ;如果比常規(guī)藥高出的數(shù)值還不如0.8kPa, 則被埋沒的機會更 大, 必須加大樣本量。如取0.01, 則得n59,即兩組各 含59例時,如果新藥的降壓效果比常規(guī)藥高出0.8kPa, 有 99%的機會可檢驗出差異有統(tǒng)計學(xué)意義。 如取0.10, 則得n41 如取0.20, 則得n25,檢驗效能(Power of Test),例 一項關(guān)于維生素C預(yù)防感冒作用的研究隨機抽取兩組正常人各30名, 一組服用維生素C, 另一組服用安慰劑, 欲比較一定時期內(nèi)發(fā)生感冒的頻率。結(jié)果,安慰劑組有6人發(fā)生感冒, 維生素C組有3人發(fā)生感冒, 經(jīng)0.05水平的檢驗 ,差異無統(tǒng)計學(xué)意義,此事如何理解? 經(jīng)計算:0.7071, 1-0.2929,檢驗效能(Power of Test),可見, 此項研究的效能只有29.29%。換言之, 若維 生素C 能使發(fā)生感冒的機會減為10%,此項研究只有 29.29%的機會發(fā)現(xiàn)這一差異性,約70%的機會給出 陰性的結(jié)果。 如取0.01, 則得n461,此項研究需要每組各461名受試者。每組各30例是遠遠不夠的。,單側(cè)檢驗和雙側(cè)檢驗,雙側(cè)檢驗(two-tailed test) H0: 1=2 H1: 12 單側(cè)檢驗(one-tailed test) H0: 1=2 H1: 12 (或H1: 12),單側(cè)檢驗和雙側(cè)檢驗,單側(cè)檢驗和雙側(cè)檢驗,單側(cè)檢驗如果誤認為是雙側(cè)的,就不易拒絕H0 雙側(cè)檢驗如誤用單側(cè)就較易拒絕H0 必須根據(jù)實際問題本身決定使用單側(cè)還是雙側(cè)。通常進行的都為雙側(cè)檢驗;進行單側(cè)檢驗時必須特別說明,要有充分的理由(另一側(cè)為不可能),并且在實驗設(shè)計階段就要預(yù)先規(guī)定好。,研究聯(lián)系,分類鑒別研究 檢測研究,第二節(jié) 一些基本概念,資料的類型 數(shù)值變量計量資料 分類變量-二分類變量 計數(shù)資料 無序多分類變量 有序多分類變量等級資料,自由度(degree of freedom),泛指事物在N維空間中能自由活動的維數(shù)。 在數(shù)學(xué)上自由度是指能自由取值的變量個數(shù)。,自由度(degree of freedom),第三節(jié) 幾種主要的分布,二項分布(binomial distribution) 二項分布常用于描述二分類變量的分布。 二項分布主要用于率的統(tǒng)計推斷,如總體率的估計, 樣本率與總體率的比較, 兩樣本率的比較,還可用于 兩分類變量的統(tǒng)計分析,如logistic回歸等。,正態(tài)分布(normal distribution),正態(tài)分布特征:呈鐘形,以均數(shù)為中心,左右對稱。,正態(tài)分布(normal distribution),均數(shù):位置參數(shù),增大,曲線向右移動。 標準差:形狀參數(shù),增大,數(shù)據(jù)分散,曲線 低平;減小,數(shù)據(jù)集中,曲線高尖。 記為 N(, 2),標準正態(tài)分布:uN(0,1) 正態(tài)曲線下面積分布規(guī)律: (1.96)(1.96)占95%,雙側(cè)尾 部各占2.5%。 (2.58)(2.58)占99%,雙側(cè)尾 部各占0.5%。,正態(tài)分布(normal distribution),正態(tài)分布的重要性 1.正態(tài)分布是很多統(tǒng)計方法的理論基礎(chǔ),很多統(tǒng) 計方法要求樣本來自正態(tài)分布的總體。 2.某些分布,如二項分布等的極限為正態(tài)分布, 當(dāng)樣本量較大時可按正態(tài)近似的方法來處理。 3.不少醫(yī)學(xué)資料服從正態(tài)分布或近似正態(tài)分布,有的呈偏態(tài)分布的醫(yī)學(xué)資料可經(jīng)過變量變換轉(zhuǎn) 換為正態(tài)分布。 4.正態(tài)曲線下面積分布規(guī)律可用于醫(yī)學(xué)正常值范圍和控制實驗中的檢測誤差。,2分布(2 distribution),2 分布是一種連續(xù)型分布,2變量是相互獨立的標準正態(tài)變量u的平方和,即 2=u12+u22+uv2 其中df=。 用途:檢驗資料的實際觀察頻數(shù)與按某種檢驗理論 所算得的理論頻數(shù)是否相符。,t 分布,t分布(t distribution)是一種連續(xù)型分布,隨機變量t是標準正態(tài)分布變量與 df=的2分布中的比值,即 用途:t檢驗、回歸系數(shù)及相關(guān)系數(shù)檢驗等。,F 分布,F= F分布有二個自由度1和2 ,它們分別為分子 的自由度與分母的自由度。 用途:多個均數(shù)比較的方差分析, 也用于回歸 分析中假設(shè)檢驗,以及方差齊性檢驗等。,第四節(jié) 統(tǒng)計軟件包簡介,一. SAS統(tǒng)計軟件包(Statistical Analysis System) 二.BMDP統(tǒng)計軟件包(Biomedical Computer Programs) 三.SPSS統(tǒng)計軟件包(Statistical Package for the Social Science) 四.SYSTAT統(tǒng)計軟件包(the System for Statistics) 五.GLIM統(tǒng)計軟件包(Generalized Linear Interactive Model System),第四節(jié) 統(tǒng)計軟件包簡介,六MINITAB統(tǒng)計軟件包(MINITAB statistical software) 七EPIINFO軟件包(statistics program for epidemiology on microcomputers) 八SLIDE軟件包 九STATPAL
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年中稀江西稀士有限公司招聘筆試真題
- 2024年西安市雁塔區(qū)第三小學(xué)招聘筆試真題
- 2025年法學(xué)概論考試的內(nèi)容框架與試題及答案
- 系統(tǒng)設(shè)計考試題目及答案解析
- 2024年黑龍江大慶大同區(qū)養(yǎng)老服務(wù)中心招聘真題
- 企業(yè)合規(guī)管理的總結(jié)與對策計劃
- 2024年連云港市灌云縣公安局招聘筆試真題
- 2024年安徽省退役軍人廳下屬事業(yè)單位真題
- 2024年雞東縣司法局招聘民調(diào)解員筆試真題
- 2024年河南事業(yè)單位聯(lián)考招聘筆試真題
- 《腦脊液幻燈》課件
- 建筑業(yè)商務(wù)禮儀指南
- 烹飪原料知識試題庫(含參考答案)
- 《體育保健學(xué)》課程筆記
- 關(guān)于貪污的檢舉信范文
- 企業(yè)環(huán)境信息披露評價研究的國內(nèi)外文獻綜述6400字
- 2024年中國防盜報警器系統(tǒng)市場調(diào)查研究報告
- 【水利水電】李想 案例專項班教案 01-案例專項班(一)
- 社區(qū)治理中的意識形態(tài)工作制度
- 計算機及外部設(shè)備裝配調(diào)試員(中級)學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 湖南省建筑工程消耗量標準裝飾定額
評論
0/150
提交評論