




已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2011高教社杯全國大學(xué)生數(shù)學(xué)建模競(jìng)賽承 諾 書我們仔細(xì)閱讀了中國大學(xué)生數(shù)學(xué)建模競(jìng)賽的競(jìng)賽規(guī)則.我們完全明白,在競(jìng)賽開始后參賽隊(duì)員不能以任何方式(包括電話、電子郵件、網(wǎng)上咨詢等)與隊(duì)外的任何人(包括指導(dǎo)教師)研究、討論與賽題有關(guān)的問題。我們知道,抄襲別人的成果是違反競(jìng)賽規(guī)則的, 如果引用別人的成果或其他公開的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參考文獻(xiàn)中明確列出。我們鄭重承諾,嚴(yán)格遵守競(jìng)賽規(guī)則,以保證競(jìng)賽的公正、公平性。如有違反競(jìng)賽規(guī)則的行為,我們將受到嚴(yán)肅處理。我們參賽選擇的題號(hào)是(從A/B/C/D中選擇一項(xiàng)填寫): 我們的參賽報(bào)名號(hào)為(如果賽區(qū)設(shè)置報(bào)名號(hào)的話): 所屬學(xué)校(請(qǐng)?zhí)顚懲暾娜?參賽隊(duì)員 (打印并簽名) :1. 2. 3. 指導(dǎo)教師或指導(dǎo)教師組負(fù)責(zé)人 (打印并簽名): 日期: 年 月 日賽區(qū)評(píng)閱編號(hào)(由賽區(qū)組委會(huì)評(píng)閱前進(jìn)行編號(hào)):2011高教社杯全國大學(xué)生數(shù)學(xué)建模競(jìng)賽編 號(hào) 專 用 頁賽區(qū)評(píng)閱編號(hào)(由賽區(qū)組委會(huì)評(píng)閱前進(jìn)行編號(hào)):賽區(qū)評(píng)閱記錄(可供賽區(qū)評(píng)閱時(shí)使用):評(píng)閱人評(píng)分備注全國統(tǒng)一編號(hào)(由賽區(qū)組委會(huì)送交全國前編號(hào)):全國評(píng)閱編號(hào)(由全國組委會(huì)評(píng)閱前進(jìn)行編號(hào)):白血病臨床治療的統(tǒng)計(jì)分析摘要白血病是造血組織的惡性疾病,又稱“血癌”。為了提高白血病在臨床試驗(yàn)中的治療效果,本文將針對(duì)藥物6-MP能否緩解病痛時(shí)間和預(yù)測(cè)以后用藥的病人病痛緩解時(shí)間的相關(guān)參數(shù)及對(duì)藥物效果的一定置信度的評(píng)估這兩個(gè)問題進(jìn)行如下的研究和分析:?jiǎn)栴}一:此問是將42位白血病患者隨機(jī)地分成兩組,一組病人用藥物6-MP治療以緩解病痛,而另一組病人則用安慰劑,根據(jù)所得到處理組和控制組病痛緩解的持續(xù)時(shí)間來確定藥物6-MP是否能夠顯著緩解病痛的持續(xù)時(shí)間。本問題的核心是檢驗(yàn)兩組數(shù)據(jù)的差異性是否顯著,這類統(tǒng)計(jì)問題常用到參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)。(一)本文首先將刪失數(shù)據(jù)丟棄截尾部分,轉(zhuǎn)化為完全數(shù)據(jù),來檢驗(yàn)兩樣本是否來自正態(tài)總體,從而建立模型一:基于偏度、峰度的正態(tài)分布檢驗(yàn),通過計(jì)算,我們得到結(jié)果為:兩樣本均不是來自正態(tài)總體,以此確定使用非參數(shù)檢驗(yàn)方法來解決問題一。 (二)確定檢驗(yàn)方法后,我們建立了模型二:基于秩和檢驗(yàn)的兩配對(duì)樣本均值差異性檢驗(yàn)?zāi)P停群蜋z驗(yàn)是通過兩個(gè)樣本的觀察值來判斷兩個(gè)總體的分布是否相同,通過建立假設(shè)、比較期望秩與秩和檢驗(yàn)臨界值、檢驗(yàn)兩樣本一致的顯著性概率p等步驟,我們求得,在顯著性水平=0.05的條件下,其概率值p=0.0042=0.05,并且期望秩W=568大于臨界值C=517,所以拒絕原假設(shè),得出“處理組有明顯增加效應(yīng)”的結(jié)論。秩和檢驗(yàn)?zāi)P椭校]有考慮刪失數(shù)據(jù),而且只從均值差異角度來分析,并不全面。 (三)為了進(jìn)一步改進(jìn)上述模型,我們考慮刪失數(shù)據(jù),并借鑒醫(yī)學(xué)上常用的生存分析方法,建立了模型三:基于乘積極限估計(jì)法的生存分析模型。對(duì)兩樣本數(shù)據(jù)適當(dāng)處理后,通過spss軟件進(jìn)行Kaplan-Meier生存分析,得到結(jié)果:處理組中位生存時(shí)間為23周,控制組中位生存時(shí)間為8周,而中位生存期越長(zhǎng),表示療效的的效果越好;通過log-rank檢驗(yàn)分析,得到統(tǒng)計(jì)量返回值P=0.00001=26)的95%置信下限為:0.52,未來病人使用6-MP后有80%的可能性緩解持續(xù)時(shí)間不短于某個(gè)下限值的95%置信下限為:8.90。關(guān)鍵詞:顯著性差異 秩和檢驗(yàn) 生存分析 極大似然估計(jì) 置信區(qū)間一、問題重述1.1問題背景白血病是造血組織的惡性疾病,又稱“血癌”。其特點(diǎn)是骨髓及其它造血組織中有大量無核細(xì)胞無限制地增生,并進(jìn)入外周血液,將正常血細(xì)胞的內(nèi)核明顯吸附,該病居年輕人惡性疾病中的首位。為了能夠?qū)惯@種病,很多醫(yī)院都對(duì)該病進(jìn)行了臨床醫(yī)學(xué)實(shí)驗(yàn)。1.2涉及材料背景 在持續(xù)1年的急性白血病治療的臨床試驗(yàn)中,研究者將42位急性白血病患者(進(jìn)入項(xiàng)目的時(shí)間有先后)隨機(jī)地分成兩組(各21人)。對(duì)一組病人用藥物6-MP治療以緩解病痛,而另一組病人用安慰劑。安慰劑的外形和顏色與藥物完全相同,但不含任何藥物,病人自己并不知道實(shí)際服用的是藥物還是安慰劑。研究者記錄下每個(gè)病人病痛緩解的持續(xù)時(shí)間(以周為單位),持續(xù)時(shí)間越長(zhǎng)則療效越好。數(shù)據(jù)如下: 處理組和控制組各21人的病痛緩解的持續(xù)時(shí)間(周)處理組(使用6-MP)21人6,6,6,7,10,13,16,22,23,6+,9+,10+,11+,17+19+,20+,25+,32+,32+,34+,35+,控制組(使用安慰劑)21人1,1,2,2,3,4,4,5,5,8,8,8,8,11,11,12,12,15,17,22,23表中數(shù)據(jù)后面有+者表示,當(dāng)項(xiàng)目結(jié)束時(shí)緩解仍在持續(xù)。例如,處理組中的20+表示:該病人在項(xiàng)目結(jié)束前20周進(jìn)入臨床治療,使用6-MP后,緩解持續(xù)到項(xiàng)目結(jié)束。因此,該病人的實(shí)際緩解持續(xù)時(shí)間至少為20周,很可能大于20周。這種數(shù)據(jù)在統(tǒng)計(jì)學(xué)中稱為刪失數(shù)據(jù)。1.3問題提出 (一)6-MP能否顯著延長(zhǎng)緩解的持續(xù)時(shí)間? (二)如果不能得到肯定的回答,則對(duì)該藥物沒有必要進(jìn)一步研究;反之,如果結(jié)論是肯定的,預(yù)測(cè)以后的病人在使用6-MP后的緩解持續(xù)時(shí)間的有關(guān)參數(shù),對(duì)6-MP的效果給出有足夠置信度的量化評(píng)估。二、問題分析問題一:該問題是問“6-MP能否顯著延長(zhǎng)緩解的持續(xù)時(shí)間”?;卮稹?-MP能否顯著延長(zhǎng)緩解的持續(xù)時(shí)間”這個(gè)問題,就是要看兩組不同的病人,接受不同的處理后,其病痛緩解的持續(xù)時(shí)間是否有明顯的差異。如果說,處理組的病痛緩解的持續(xù)時(shí)間顯著高于控制組的,那么說明,6-MP能夠顯著延長(zhǎng)緩解的持續(xù)時(shí)間。問題的解決,就轉(zhuǎn)化到了分析兩組數(shù)據(jù)之間的差異上了,這是一個(gè)統(tǒng)計(jì)學(xué)問題。統(tǒng)計(jì)學(xué)問題,首先是要找數(shù)據(jù)之間的規(guī)律。如果能從樣本中找到數(shù)據(jù)服從的某種分布,問題好解決很多,而一般都從正態(tài)分布著手(正態(tài)分布式自然界最常見的分布),看樣本數(shù)據(jù)是否滿足正態(tài)分布。分析了數(shù)據(jù)的分布規(guī)律后,就要對(duì)兩樣本進(jìn)行假設(shè)檢驗(yàn),分析樣本之間是否有明顯的差異。對(duì)于符合正態(tài)分布的兩樣本,可以用配對(duì)t檢驗(yàn),而不符合正態(tài)分布的兩樣本,采用wilcoxon秩和檢驗(yàn)。確定方法之后,作出假設(shè),并給定置信水平,就可以檢驗(yàn)了。問題二:?jiǎn)栴}二是在問題一的基礎(chǔ)上提出的。如果6-MP能夠顯著延長(zhǎng)緩解的持續(xù)時(shí)間,就預(yù)測(cè)以后的病人在使用6-MP后的緩解持續(xù)時(shí)間的有關(guān)參數(shù),并對(duì)6-MP的效果給出有足夠置信度的量化評(píng)估。如果6-MP不能夠顯著延長(zhǎng)緩解的持續(xù)時(shí)間,則對(duì)該藥物沒有必要進(jìn)一步研究,問題結(jié)束。在第一問求解結(jié)束后,我們得到的結(jié)論是6-MP能夠顯著延長(zhǎng)緩解的持續(xù)時(shí)間?,F(xiàn)在我們要對(duì)其治療效果的有關(guān)參數(shù)進(jìn)行預(yù)測(cè),并給出有足夠置信度的的量化評(píng)估。對(duì)于以后的病人在使用6-MP后病痛緩解時(shí)間的有關(guān)參數(shù),我們考慮到了三個(gè)參數(shù):未來病人使用6-MP后的期望緩解持續(xù)時(shí)間;未來病人使用6-MP后的緩解持續(xù)時(shí)間超過半年(26周)的概率;未來病人使用6-MP后有80%的可能性緩解持續(xù)時(shí)間不短于某個(gè)下限。為求解出這三個(gè)參數(shù),本文利用最大似然法來進(jìn)行求解。要對(duì)6-MP的效果給出有足夠置信度的量化評(píng)估,本文就是對(duì)上面提到的三個(gè)參數(shù)利用概率論的相關(guān)知識(shí)進(jìn)行了一定的量化評(píng)估。三、模型假設(shè)1.假設(shè)預(yù)測(cè)模型中,服藥病人所處環(huán)境與實(shí)驗(yàn)組人員所處環(huán)境相同。2.假設(shè)在試驗(yàn)過程中,處理組和控制組所處的環(huán)境都相同。3.假設(shè)不考慮病人服藥后產(chǎn)生的副作用對(duì)本題的影響。4.假設(shè)每個(gè)人在臨床試驗(yàn)前體質(zhì)都一樣,并且年齡、性別、體重等對(duì)此試驗(yàn)均無影響。5.假設(shè)題目所給的數(shù)據(jù)均為可靠數(shù)據(jù)。四、符號(hào)說明 i=1,2,21,Xi表示處理組樣本中第i個(gè)觀察值i=1,2,21,Yi表示處理組樣本中第i個(gè)觀察值 表示樣本的標(biāo)準(zhǔn)差 表示樣本的偏度 表示樣本k階中心矩表示Xi在混合樣本中的秩 表示從1,2,N中取n個(gè)數(shù)其和恰為d的取法的個(gè)數(shù)表示死亡概率 表示生存概率 表示生存率 表示死亡數(shù)據(jù) 表示刪失數(shù)據(jù)五、模型建立與求解5.1關(guān)于問題1的模型建立與求解5.1.1建模前的準(zhǔn)備(處理組數(shù)據(jù)去掉截尾)在建立模型前,為了對(duì)數(shù)據(jù)樣本有個(gè)初步的認(rèn)識(shí),本文首先將數(shù)據(jù)進(jìn)行了一定的處理,這些處理包括求平均值、中位數(shù)、偏度、峰度,畫直方圖等。對(duì)于容量為n的樣本(X1,X2,Xn):1.表示位置的統(tǒng)計(jì)量平均數(shù)和中位數(shù)平均值: (1)中位數(shù):將數(shù)據(jù)從小到大排序后,其中位于中間位置的那個(gè)數(shù)值。2.變異程度的統(tǒng)計(jì)量標(biāo)準(zhǔn)差和方差標(biāo)準(zhǔn)差: (2)它是各個(gè)數(shù)據(jù)與均值偏離程度的度量。 方差:標(biāo)準(zhǔn)差的平方。3.表示分布形狀的統(tǒng)計(jì)量偏度和峰度偏度: (3)峰度: (4)由上述的式子計(jì)算可得以上統(tǒng)計(jì)量的值,如下所示:表1 兩樣本的各統(tǒng)計(jì)量的值統(tǒng)計(jì)量平均值中位數(shù)標(biāo)準(zhǔn)差方差偏度峰度處理組17.095169.999599.990.512861.9479控制組8.666786.467941.8330.808262.8125由上表的數(shù)據(jù)可以看出:處理組的平均數(shù)大于控制組的平均數(shù),這表明處理組中病人的病痛緩解平均持續(xù)時(shí)間大于處理組中病人的病痛緩解平均持續(xù)時(shí)間,從這個(gè)角度,可以看出6-MP能顯著延長(zhǎng)緩解的持續(xù)時(shí)間;對(duì)于標(biāo)準(zhǔn)差而言,處理組的標(biāo)準(zhǔn)差大于控制組的標(biāo)準(zhǔn)差,說明處理組中的各數(shù)據(jù)與均值的偏離程度比控制組中的各數(shù)據(jù)與均值的偏離程度要大,從這個(gè)角度,可以看出,處理組中病人病痛的緩解時(shí)間有一定的差距。偏度反映分布的對(duì)稱性,g10稱為右偏態(tài),此時(shí)數(shù)據(jù)位于均值右邊的比位于左邊的多;g11.96,|u2|=12.01891.96,故拒絕假設(shè)H0,認(rèn)為數(shù)據(jù)不是來自正態(tài)總體。 用同樣的方法可以算得控制組的數(shù)據(jù)不是來自正態(tài)總體。分析完了兩樣本的一些基本特性,接下來就要對(duì)兩樣本的差異性進(jìn)行分析檢驗(yàn)。樣本的檢驗(yàn)有參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)。參數(shù)檢驗(yàn),即總體分布類型已知,用樣本指標(biāo)對(duì)總體參數(shù)進(jìn)行推斷或作假設(shè)檢驗(yàn)的統(tǒng)計(jì)分析方法。非參數(shù)檢驗(yàn):即不考慮總體分布類型是否已知,不比較總體參數(shù),只比較總體分布的位置是否相同的統(tǒng)計(jì)方法。而由上述的分析可知,兩組樣本不符合正態(tài)分布,也很難找到其滿足的參數(shù)分布,所以,對(duì)這兩組樣本的檢驗(yàn),只能用非參數(shù)檢驗(yàn)。樣本的檢驗(yàn)有參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)。參數(shù)檢驗(yàn),即總體分布類型已知,用樣本指標(biāo)對(duì)總體參數(shù)進(jìn)行推斷或作假設(shè)檢驗(yàn)的統(tǒng)計(jì)分析方法。非參數(shù)檢驗(yàn):即不考慮總體分布類型是否已知,不比較總體參數(shù),只比較總體分布的位置是否相同的統(tǒng)計(jì)方法。而由上述的分析可知,兩組樣本不符合正態(tài)分布,也很難找到其滿足的參數(shù)分布,所以,對(duì)這兩組樣本的檢驗(yàn),只能用非參數(shù)檢驗(yàn)。 兩配對(duì)樣本的非參數(shù)檢驗(yàn)是對(duì)總體分布不甚了解的情況下,通過對(duì)兩組配對(duì)樣本的分析,推斷樣本來自的兩個(gè)總體的分布是否存在顯著差異的方法。兩配對(duì)樣本非參數(shù)檢驗(yàn)的方法主要包括McNemar檢驗(yàn)、符號(hào)檢驗(yàn)、Wilcoxon秩和檢驗(yàn)等。 根據(jù)本題的特殊性,我們采用非參數(shù)統(tǒng)計(jì)中一種常用的檢驗(yàn)方法Wilcoxon秩和檢驗(yàn),其中“秩”又稱等級(jí)、即按數(shù)據(jù)大小排定的次序號(hào)。上述次序號(hào)的和稱“秩和”,秩和檢驗(yàn)就是用秩和作為統(tǒng)計(jì)量進(jìn)行假設(shè)檢驗(yàn)的方法。5.1.2模型二:基于秩和檢驗(yàn)的兩配對(duì)樣本均值差異性檢驗(yàn)?zāi)P?數(shù)據(jù)的處理:將處理組中刪失數(shù)據(jù)的截尾去掉,轉(zhuǎn)化成完全數(shù)據(jù),然后對(duì)轉(zhuǎn)化后的處理組樣本和控制組樣本,進(jìn)行均值的差異性檢驗(yàn)。一、秩和檢驗(yàn)的引入: 本題是針對(duì)同樣的急性白血病患者,將其分成兩組,分別給予不同的處理,即一組使用藥物6-MP治療,而另一組另一組病人用安慰劑(安慰劑不含任何藥物),分析兩種不同處理效果的差異,即6-MP的效果是否明顯比使用安慰劑好。將兩組病人的治療效果分別看做兩組樣本,問題的解決需要對(duì)這兩組樣本進(jìn)行檢驗(yàn)。 在實(shí)踐中我們常常遇到以下一些資料,如需比較患者和正常人的血鐵蛋白、血鉛值、不同藥物的溶解時(shí)間、實(shí)驗(yàn)鼠發(fā)癌后的生存日數(shù)、護(hù)理效果評(píng)分等,這類資料有如下特點(diǎn):資料的總體分布類型未知或者資料分布類型已知,但不符合正態(tài)分布或者某些變量可能無法精確測(cè)量。對(duì)于此類資料,傳統(tǒng)的u檢驗(yàn)、t檢驗(yàn)和方差分析都是假定樣本的數(shù)據(jù)來自正態(tài)或近似正態(tài)分布的總體,在實(shí)際工作中往往碰到非正態(tài)資料或不了解現(xiàn)有的數(shù)據(jù)來自何種分布,難以解決問題。而秩和檢驗(yàn)是一種非參數(shù)統(tǒng)計(jì)方法。此法可用于多種總體分布或分布不明確的情況,尤其在分析兩配對(duì)樣本的差異性時(shí),有很好的效果。 在秩和檢驗(yàn)中會(huì)涉及到一下基本概念:(1) 秩次:指將觀察值由小到大按次序排列后所編的次序號(hào)。(2)秩和:用秩次號(hào)代替原始數(shù)據(jù)后,所得的某些秩次之和。(3)秩和檢驗(yàn):用統(tǒng)計(jì)量秩和進(jìn)行的檢驗(yàn)。 二、模型的建立: 我們要研究的問題是兩總體均值的差異性假設(shè)檢驗(yàn),設(shè)有兩個(gè)配對(duì)樣本X:,Y:,要檢驗(yàn)第二個(gè)總體是否有增加效應(yīng),首先建立假設(shè):(1)第二個(gè)總體沒有增加效應(yīng),即H0: (2)第二個(gè)總體有增加效應(yīng),即H1:Wilcoxon秩和檢驗(yàn)的方法是:將兩個(gè)樣本混合為:混合之后樣本容量為,每個(gè)樣本點(diǎn)在樣本中從小到大排列的名次稱為該樣本點(diǎn)的秩,用表示在混合樣本中的秩,用表示在混合樣本中的秩,檢驗(yàn)統(tǒng)計(jì)量為 (19)例如諸為 1.1,3.3,5.5,7.7,諸為2.2,4.4,6.6,以下列表給出混合樣本及秩:表2 混合樣本及其秩混合樣本6.6秩1357246則。若H0成立,則的值應(yīng)該適中。注意到每個(gè)秩序的平均值為,故H0成立時(shí),W期望值為: (20) 的值在此值附近應(yīng)該是正常的。若的值異常偏大,說明第二個(gè)總體確有增加效應(yīng)。利用matlab自身的函數(shù)p = ranksum(X,Y)(3)可以進(jìn)行雙側(cè)的秩和檢驗(yàn)。返回的p值小于給定的顯著性水平則拒絕原假設(shè),認(rèn)為H1:成立。H0成立時(shí),可以證明關(guān)于對(duì)稱,要檢驗(yàn)H1:,只要判定,并且p = ranksum(X,Y)即可。根據(jù)以上分析推導(dǎo),W的求解,使用matlab編程,編寫如下函數(shù)(程序源代碼見附錄二)來完成:function W=rsum(x,y)(6)其中,x,y分別為對(duì)照組樣本、實(shí)驗(yàn)組樣本。為了求出Wilcoxon秩和檢驗(yàn)的臨界值,在H0成立時(shí),的概率分布為: (21) 其中表示從中取個(gè)數(shù)其和恰為的取法的個(gè)數(shù)??捎萌缦鲁跏紬l件及遞推公式計(jì)算: 當(dāng) 結(jié)合上述公式的推導(dǎo),的求解,使用matlab編程,編寫函數(shù)(程序源代碼見附錄二)來完成:function tmn=tmnd(m,n,d)可以證明,H0成立時(shí),的概率分布關(guān)于E=n*(m+n+1)/2對(duì)稱,我們給出單側(cè)檢驗(yàn)臨界值的求法,自定義函數(shù)(程序源代碼見附錄三)function c=wr(m,n,alpha)其中輸入?yún)?shù)m,n,alpha分別是對(duì)照組樣本容量、實(shí)驗(yàn)組樣本容量、檢驗(yàn)的顯著性水平,而輸出值c表示右側(cè)臨界值,即滿足的最小正整數(shù)。上述函數(shù)可用于右側(cè)檢驗(yàn)。若左側(cè)檢驗(yàn),只需將程序中的“c1”與“c”換位,即為左側(cè)臨界值。若雙側(cè)檢驗(yàn),先求出c2=wr(m,n,alpha/2),再由c1=2*E-c2即可。三、模型的求解: 根據(jù)上述模型的分析,下面將結(jié)合本文的實(shí)際,來具體的求解: 兩配對(duì)樣本分別為:控制組: x=1,1,2,2,3,4,4,5,5,8,8,8,8,11,11,12,12,15,17,22,23;處理組: y=6,6,6,7,10,13,16,22,23,6,9,10,11,17,19,20,25,32,32,34,35; 兩個(gè)假設(shè):H0:處理組沒有明顯增加效應(yīng);H1:處理組有明顯的增加效應(yīng);將兩個(gè)樣本混合為: x,y=1,1,2,2,3,4,4,5,5,8,8,8,8,11,11,12,12,15,17,22,23,6,6,6,7,10,1 3,16,22,23,6,9,10,11,17,19,20,25,32,32,34,35;將上述混合樣本重新按照從小到大的順序排列后得:x,y=1,1,2,2,3,4,4,5,5,6,6,6,6,7,8,8,8,8,9,10,10,11,11,11,12,12,13,15,16,17,17,19,20,22,22,23,23,25,32,32,34,35;混合之后,樣本容量為: N=m+n=42,,由函數(shù)W=rsum(x,y),可求得W=rsum(x,y)=568。而=451.5,此時(shí)W明顯大于E(W)。我們給定顯著性水平值,此時(shí)P=ranksum(x,y)=0.0042482生存Survival Kaplan-Meier導(dǎo)入具體參數(shù)(具體過程詳見附錄) 圖六 spss軟件求解流程圖得到以下結(jié)果:兩組的中位生存期估計(jì): 圖七 均值、中位數(shù)結(jié)果圖 由上圖可知,處理組生存時(shí)間的均數(shù)為23.287周,中位生存時(shí)間為23.000周;控制組生存時(shí)間均數(shù)為7.211周,中位生存時(shí)間為8.000周。對(duì)比兩組不同處理方法的中位生存時(shí)間,可知處理組顯著高于控制組,而中位生存期越長(zhǎng),表示療效的的效果越好,這也就證明了處理組的生存時(shí)間顯著高于控制組。圖八 估計(jì)值置信區(qū)間圖水平間的整體比較:圖九 三種檢驗(yàn)結(jié)果圖3種檢驗(yàn)方法的檢驗(yàn)統(tǒng)計(jì)量P(對(duì)應(yīng)上圖中的Sig)均遠(yuǎn)小于0.05,證明兩種療法的生存率的差異有統(tǒng)計(jì)學(xué)意義。習(xí)慣取log-rank統(tǒng)計(jì)量。所以,本例2=16.793,P0.05,按a=0.05水準(zhǔn),拒絕H0,接受H1,可認(rèn)為2種療法的生存率的差異有統(tǒng)計(jì)學(xué)意義,處理組生存率明顯高于控制組。生存曲線: 圖十 兩樣本組生存曲線圖從生存曲線來看,處理組的生存率也是明顯高于控制組,而且處理組整體處在一個(gè)較高的生存率水平,控制組的生存率水平分布叫均勻,但總體處在較低水平。結(jié)論:我們從中位生存時(shí)間、假設(shè)檢驗(yàn)、生存曲線等三個(gè)方面,綜合比較了處理組與控制組的生存時(shí)間,得出的結(jié)論都是處理組顯著高于控制組,處理組的生存率顯著高于控制組的生存率。而模型二(秩和檢驗(yàn))中,通過均值差異的檢驗(yàn)得到的結(jié)論也是處理組顯著高于控制組,前后一致,從多個(gè)方面分析檢驗(yàn)了兩樣本總體的差異,基于此,我們認(rèn)為,6-MP能夠顯著延長(zhǎng)緩解的持續(xù)時(shí)間。5.3針對(duì)問題二的模型建立與求解5.3.1模型的建立:預(yù)測(cè)以后的病人在使用6-MP后的緩解持續(xù)時(shí)間的有關(guān)參數(shù),我們考慮到以下三點(diǎn):(1) 未來病人使用6MP后的期望緩解持續(xù)時(shí)間;(2) 未來病人使用6MP后的緩解持續(xù)時(shí)間超過半年(26周)的概率;(3) 未來病人使用6MP后有80%的可能性緩解持續(xù)時(shí)間不短于某個(gè)下限。首先,我們進(jìn)行以下的分析:對(duì)于完全數(shù)據(jù)x1,x2,xn,似然函數(shù)(26)而刪失數(shù)據(jù)zi表示的是,死亡發(fā)生在zi之后,所以它提供的信息不是密度函數(shù)值,而是概率值。因此,當(dāng)存在刪失數(shù)據(jù)時(shí),記死亡數(shù)據(jù)為y1,y2,,yD,刪失數(shù)據(jù)為z1,z2,,zC,(都允許重復(fù)),則似然函數(shù)為:(27)對(duì)于指數(shù)分布,可以算出對(duì)數(shù)似然函數(shù)為:(28)的極大似然估計(jì)為: (29) 接下來用X表示未來病人使用6MP后的緩解持續(xù)時(shí)間。對(duì)上述考慮到的三點(diǎn)分別對(duì)應(yīng)三個(gè)統(tǒng)計(jì)推斷問題:(1) 估計(jì)EX;(2) 估計(jì);(3) 估計(jì)分位數(shù),滿足上述三個(gè)統(tǒng)計(jì)量的值求解式子如下:(30)(31)(32) 理想的結(jié)果應(yīng)該是為真實(shí)的參數(shù)提供一個(gè)可能的范圍,以相當(dāng)大的概率保證真實(shí)的參數(shù)在這個(gè)范圍內(nèi),即在一定的置信度下給出置信區(qū)間或置信下限(上限)。所以與上面對(duì)應(yīng)的就應(yīng)該考慮三點(diǎn):(1) 估計(jì)EX的95%的置信區(qū)間;(2) 估計(jì)的95%置信下限;(3) 估計(jì)分位數(shù)x0.2的95%置信下限。首先估計(jì)的95%置信區(qū)間,最大似然估計(jì)的一個(gè)重要性質(zhì)是:記,則近似服從正態(tài)分布。對(duì)于指數(shù)分布,利用上述性質(zhì)得到:(33)因此,EX的95%置信區(qū)間為:(34)注意到和x0.2都是的單增函數(shù),且的95%置信下限為:所以,的95%置信下限為:;的95%置信下限為:5.3.2模型的求解: 處理組死亡數(shù)據(jù)為:6,6,6,7,10,13,16,22,23;刪失數(shù)據(jù)為:6+,9+,10+,11+,17+,19+,20+,25+,32+,32+,34+,35+。 利用式(29)可以得到: 以后的病人在使用6-MP后的緩解持續(xù)時(shí)間的有關(guān)參數(shù)為:未來病人使用6MP后的期望緩解持續(xù)時(shí)間:未來病人使用6MP后的緩解持續(xù)時(shí)間超過半年(26周)的概率:;未來病人使用6MP后有80%的可能性緩解持續(xù)時(shí)間不短于某個(gè)下限,這個(gè)下限為:下面是對(duì)6-MP的效果給出有足夠置信度的量化評(píng)估:未來病人使用6MP后的期望緩解持續(xù)時(shí)間EX的95%置信區(qū)間為:的95%置信下限為:未來病人使用6MP后的緩解持續(xù)時(shí)間超過半年(26周)的概率的95%置信下限為:;未來病人使用6MP后有80%的可能性緩解持續(xù)時(shí)間不短于某個(gè)下限,這個(gè)下限的95%置信下限為: 六、模型評(píng)價(jià)與推廣基于秩和檢驗(yàn)的兩配對(duì)樣本均值差異性檢驗(yàn)?zāi)P偷膬?yōu)缺點(diǎn): 優(yōu)點(diǎn):不受總體分布的限定、適用范圍廣。對(duì)數(shù)據(jù)的要求不像參數(shù)檢驗(yàn)?zāi)菢訃?yán)格,不論研究的是何種類型的變量,包括那些難以準(zhǔn)確測(cè)量、只能以嚴(yán)重程度、優(yōu)劣等級(jí)、次序先后等表示的資料;或有的數(shù)據(jù)一端或兩端是不確定數(shù)值等,均可用秩和參數(shù)檢驗(yàn)。特別對(duì)于不符合正態(tài)分布的兩配對(duì)樣本,效果很好。缺點(diǎn):符合作參數(shù)檢驗(yàn)的資料(如兩樣本均數(shù)比較的檢驗(yàn)),如用非參數(shù)的秩和檢驗(yàn),因沒有充分利用資料提供的信息,檢驗(yàn)效率低于參數(shù)檢驗(yàn)。一般犯第二類錯(cuò)誤的概率()比參數(shù)檢驗(yàn)大,若要使()相同、非參數(shù)秩和檢驗(yàn)要比參數(shù)檢驗(yàn)需要更大的樣本含量。故適合參數(shù)檢驗(yàn)條件的資料,應(yīng)首選參數(shù)檢驗(yàn)。本模型的分析中,直接將刪失數(shù)據(jù)的截尾去掉,對(duì)結(jié)果會(huì)有一定的影響。 因此對(duì)適合參數(shù)統(tǒng)計(jì)資料或經(jīng)變量變換后適合參數(shù)統(tǒng)計(jì)的資料,應(yīng)最好用參數(shù)統(tǒng)計(jì)。當(dāng)資料不具備參數(shù)統(tǒng)計(jì)條件時(shí),用非參數(shù)統(tǒng)計(jì)分析方法?;诔朔e極限估計(jì)法的生存分析模型的優(yōu)缺點(diǎn):優(yōu)點(diǎn):能同時(shí)分析有結(jié)局的完全數(shù)據(jù)和沒有結(jié)局的刪失數(shù)據(jù),能充分利用信息。七、參考文獻(xiàn)1盛驟,謝式千,潘承毅,概率論與數(shù)理統(tǒng)計(jì),北京:高等教育出版社,20082郜艷暉,生存分析,http:/wenku.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 工作中的團(tuán)隊(duì)協(xié)作與創(chuàng)新思維培養(yǎng)
- 工業(yè)風(fēng)住宅的設(shè)計(jì)美學(xué)
- 工業(yè)風(fēng)空間設(shè)計(jì)與裝修元素
- 工作流程自動(dòng)化及智能辦公應(yīng)用
- 工作效率提升的方法論
- 工作場(chǎng)所安全管理與改進(jìn)措施
- 工程施工人員安全教育培訓(xùn)
- 工程機(jī)械的節(jié)能減排結(jié)構(gòu)設(shè)計(jì)
- 工程設(shè)計(jì)與創(chuàng)新的案例研究
- 工程項(xiàng)目管理與數(shù)據(jù)決策支持
- 崗位練兵中藥專業(yè)前一百題測(cè)試(一)測(cè)試題
- 土地項(xiàng)目測(cè)算表_模板
- 中華傳統(tǒng)文化教育學(xué)生學(xué)習(xí)能力評(píng)價(jià)量化表
- 服裝色彩設(shè)計(jì)(PPT57頁)課件
- DLT 596-2021 電力設(shè)備預(yù)防性試驗(yàn)規(guī)程
- 內(nèi)分泌系統(tǒng)疾病病例分析
- 鋁箔軋制油過濾技術(shù)
- 專項(xiàng)審計(jì)報(bào)告模板(青島市高新技術(shù)企業(yè)認(rèn)定專用)
- 成都市所有的藥房.doc
- 基于BIM模型技術(shù)交底應(yīng)用
- 產(chǎn)品設(shè)計(jì)和開發(fā)控制程序
評(píng)論
0/150
提交評(píng)論