第十四章生存分析的SAS實現(xiàn)_第1頁
第十四章生存分析的SAS實現(xiàn)_第2頁
第十四章生存分析的SAS實現(xiàn)_第3頁
第十四章生存分析的SAS實現(xiàn)_第4頁
第十四章生存分析的SAS實現(xiàn)_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第十四章 生存分析的SAS實現(xiàn)例14-2 McKelvey et al(1976)收集了3期的某型淋巴瘤患者的生存時間(天)。分別是6,19,32,42,42,43+,94,126+,169+,207,211+,227+,253,255+,270+,310+,316+,335+,346+。SAS分析程序data ch14_2; 定義數(shù)據(jù)集名input t c; 輸入生存時間變量t和截尾情況變量ccards; 開始輸入數(shù)據(jù)6 1 19 1 32 1 42 1 42 1 43 0 94 1 126 0 169 0 207 1 211 0 227 0 253 1 255 0 270 0 310 0

2、316 0 335 0 346 0;proc lifetest plots=(s); 利用lifetest過程進(jìn)行生存分析并作生存函數(shù)圖time t*c(0); 指定時間變量和截尾變量并指出數(shù)據(jù)截尾時截尾變量的取值run;SAS軟件輸出結(jié)果Product-Limit Survival Estimates Survival Standard Number Number t Survival Failure Error Failed Left 0.000 1.0000 0 0 0 19 6.000 0.9474 0.0526 0.0512 1 18 19.000 0.8947 0.1053 0.0

3、704 2 17 32.000 0.8421 0.1579 0.0837 3 16 42.000 . . . 4 15 42.000 0.7368 0.2632 0.1010 5 14 43.000* . . . 5 13 94.000 0.6802 0.3198 0.1080 6 12 126.000* . . . 6 11 169.000* . . . 6 10 207.000 0.6121 0.3879 0.1167 7 9 211.000* . . . 7 8 227.000* . . . 7 7 253.000 0.5247 0.4753 0.1287 8 6 255.000* .

4、. . 8 5 270.000* . . . 8 4 310.000* . . . 8 3 316.000* . . . 8 2 335.000* . . . 8 1 346.000* . . . 8 0 NOTE: The marked survival times are censored observations. Summary Statistics for Time Variable t Quartile Estimates Point 95% Confidence Interval Percent Estimate Lower Upper) 75 . . . 50 . 94.000

5、 . 25 42.000 32.000 . Mean Standard Error 181.701 24.497 NOTE: The mean survival time and its standard error were underestimated because the largest observation was censored and the estimation was restricted to the largest event timeSummary of the Number of Censored and Uncensored Values Percent Tot

6、al Failed Censored Censored 19 8 11 57.89SAS軟件輸出結(jié)果解釋該結(jié)果包含四個部分:第一部分用乘積極限法估計了生存率(Survival), 死亡率(Failure),生存率的標(biāo)準(zhǔn)誤(Survival Standard Error),死亡例數(shù)(Number Failed)和該時間點(diǎn)前的生存例數(shù)(Number Left)。其中帶有*號的表示截尾;第二部分給出了關(guān)于生存時間的描述性統(tǒng)計量,包括75%,50%和25%分位數(shù)以及相應(yīng)的95%的可信區(qū)間(95% Confidence Interval),還有均數(shù)(Mean)和標(biāo)準(zhǔn)誤(Standard Error)從結(jié)

7、果可以看出平均生存時間為181.701天;第三部分列出了完全數(shù)據(jù)(Failed),截尾數(shù)據(jù)(Censored)的例數(shù),以及截尾數(shù)據(jù)占全部數(shù)據(jù)的百分比(Percent Censored)。最后是生存曲線圖。教材中的說明現(xiàn)用Kaplan-Meier法計算生存率,步驟如下:(1)將所有生存時間按從小到大順序排列(見表14-2第(2)列)并標(biāo)上序號(第(1)列)。(2)列出各t時點(diǎn)前的存活病例數(shù)n(第(3)列)、各個時間點(diǎn)的死亡人數(shù)d(第(4)列)和截尾人數(shù)c(第(5)列)。(3)計算各t時刻的死亡概率(第(6)列)。例如生存時間為32天時,死亡概率為。(4)計算各t時刻的生存概率(第(7)列)。例如

8、生存時間為32天時,生存概率為。(5)計算各t時刻的生存率(第(8)列)。例如生存時間為32天時,生存率為,由此驗證了在沒有截尾數(shù)據(jù)的情況下,式(14-4)與式(14-5)是相同的。(6)以時間t為橫指標(biāo),生存率為縱指標(biāo),作生存曲線圖(圖141)。表14-2 Kaplan-Meier法計算生存率的計算用表 (1)(2)(3)(4)(5)(6)(7)(8)序號生存天數(shù)t時刻前的例數(shù)nt時刻死亡數(shù)dt時刻后截尾人數(shù)c死亡概率q生存概率p生存率S(t)1619100.0526320.9473680.94736821918100.0555560.9444440.89473733217100.05882

9、40.9411760.84210544216200.1250000.8750000.73684264314010.0000001.0000000.73684279413100.0769230.9230770.680162812612010.0000001.0000000.680162916911010.0000001.0000000.6801621020710100.1000000.9000000.612146112119010.0000001.0000000.612146122278010.0000001.0000000.612146132537100.1428570.8571430.524

10、696142556010.0000001.0000000.524696152705010.0000001.0000000.524696163104010.0000001.0000000.524696173163010.0000001.0000000.524696183352010.0000001.0000000.524696193461010.0000001.0000000.524696圖14-1 例14-2的生存曲線圖例143 下面是來自于Berkson & Gage(1950)的一個研究隊列。為了敘述方便,把原來的出院后的生存時間改稱為某惡性腫瘤術(shù)后生存時間。共有374名患者進(jìn)入研究隊列。

11、表143 壽命表法計算生存率的計算用表(1)(2)(3)(4)(5)(6)(7)(8)(9)序號術(shù)后生存年數(shù)期初觀察例數(shù)期內(nèi)死亡期內(nèi)截尾人數(shù)校正期初人數(shù)死亡概率生存概率生存率tndcnc=n-c/2q=d/ncp=1-qS(t)103749003740.2406 0.7594 0.7594 212847602840.2676 0.7324 0.5561 322085102080.2452 0.7548 0.4198 4315725121510.1656 0.8344 0.3503 54120205117.50.1702 0.8298 0.2907 65957990.50.0773 0.9227

12、 0.2682 76794974.50.0537 0.9463 0.2538 87661364.50.0155 0.9845 0.2498 98623559.50.0504 0.9496 0.2372 109542551.50.0388 0.9612 0.2280 1110472126340.6176 0.3824 0.0872 SAS分析程序data ch14_3; 定義數(shù)據(jù)集名do c=0 to 1; 定義截尾變量do i=1 to 11;input t f; 輸入時間變量和頻數(shù)變量output;end;end;cards;0 90 1 76 2 51 3 25 4 20 5 7 6 4

13、7 1 8 3 9 2 10 210 0 1 0 2 0 3 12 4 5 5 9 6 9 7 3 8 5 9 5 10 26 ;proc lifetest data=ch14_3 利用lifetest過程進(jìn)行生存分析method =life width=1 plots=(s); 采用壽命表法并作生存函數(shù)圖time t*c(1); 指定時間變量和截尾變量并指出數(shù)據(jù)截尾時截尾變量的取值freq f; 指定頻數(shù)變量run;SAS軟件輸出結(jié)果The LIFETEST Procedure Life Table Survival Estimates Conditional Effective Condi

14、tional Probability Interval Number Number Sample Probability Standard Lower, Upper) Failed Censored Size of Failure Error Survival Failure 0 1 90 0 374.0 0.2406 0.0221 1.0000 0 1 2 76 0 284.0 0.2676 0.0263 0.7594 0.2406 2 3 51 0 208.0 0.2452 0.0298 0.5561 0.4439 3 4 25 12 151.0 0.1656 0.0302 0.4198

15、0.5802 4 5 20 5 117.5 0.1702 0.0347 0.3503 0.6497 5 6 7 9 90.5 0.0773 0.0281 0.2907 0.7093 6 7 4 9 74.5 0.0537 0.0261 0.2682 0.7318 7 8 1 3 64.5 0.0155 0.0154 0.2538 0.7462 8 9 3 5 59.5 0.0504 0.0284 0.2498 0.7502 9 10 2 5 51.5 0.0388 0.0269 0.2372 0.7628 10 . 21 26 34.0 0.6176 0.0833 0.2280 0.7720

16、Evaluated at the Midpoint of the Interval Survival Median Median PDF Hazard Interval Standard Residual Standard Standard Standard Lower, Upper) Error Lifetime Error PDF Error Hazard Error 0 1 0 2.4118 0.1896 0.2406 0.0221 0.273556 0.028564 1 2 0.0221 2.5771 0.3242 0.2032 0.0208 0.308943 0.035013 2 3

17、 0.0257 3.5599 0.8576 0.1364 0.0177 0.279452 0.038747 3 4 0.0255 . . 0.0695 0.0134 0.180505 0.035954 4 5 0.0248 . . 0.0596 0.0129 0.186047 0.041421 5 6 0.0239 . . 0.0225 0.00837 0.08046 0.030386 6 7 0.0235 . . 0.0144 0.00712 0.055172 0.027576 7 8 0.0233 . . 0.00393 0.00392 0.015625 0.015625 8 9 0.02

18、33 . . 0.0126 0.00718 0.051724 0.029853 9 10 0.0232 . . 0.00921 0.00645 0.039604 0.027999 10 . 0.0232 . . . . . . Summary of the Number of Censored and Uncensored Values Percent Total Failed Censored Censored 374 300 74 19.79 NOTE: There were 3 observations with missing values, negative time values

19、or frequency values less than 1.SAS軟件輸出結(jié)果解釋本例結(jié)果主要包含三個部分:第一部分給出了時間區(qū)間的下限和上限,死亡例數(shù)(Number Failed),截尾例數(shù)(Number Censored),期初觀察人數(shù)(Effective Sample Size),生存率(Survival), 死亡率(Failure),生存率的標(biāo)準(zhǔn)誤(Survival Standard Error)等;第二部分列出了完整數(shù)據(jù)(Failed),截尾數(shù)據(jù)(Censored)的例數(shù),以及截尾數(shù)據(jù)占全部數(shù)據(jù)的百分比(Percent Censored)。最后是生存曲線圖。教材中的說明根據(jù)表14

20、3的生存率估計,則以生存時間為橫坐標(biāo),生存率為縱坐標(biāo),各個點(diǎn)的生存率用折線連接,構(gòu)成壽命表法的生存率曲線(圖14-2)。圖142 例14-3的生存曲線圖生存率估計同樣存在抽樣誤差,往往需要估計標(biāo)準(zhǔn)誤和95%可信區(qū)間。對于上述兩種生存率計算方法均可以用Greenwood(1926)提出方法計算標(biāo)準(zhǔn)誤 (14-6)例如34年這一段的生存率的標(biāo)準(zhǔn)誤為:Kalbfleisch & Prentice,1980提出對生存率進(jìn)行轉(zhuǎn)換后估計生存率的95%可信區(qū)間可以保證可信區(qū)間的范圍在(0,1)內(nèi),所以被廣泛使用,具體計算公式如下: ,其中 (14-7)例如對于34年這一組段的95%可信區(qū)間計算為 ,則95%

21、可信區(qū)間為 。 兩種方法的比較:壽命表法適用于大樣本或無法準(zhǔn)確得知研究結(jié)果出現(xiàn)時間的資料,Kaplan-Meier法可以用于小樣本,也可以用于大樣本,但要求每個觀察對象都有確切的死亡時間和截尾時間。壽命表法是按照指定的時段來分段,估計的是時間區(qū)間右端點(diǎn)上的生存率;Kaplan-Meier法是根據(jù)死亡時點(diǎn)分段,逐個估計死亡時點(diǎn)的生存率。壽命表法沒有確切的死亡時間和失訪時間,假定在每個時間段中的“死亡發(fā)生時間”和“失訪發(fā)生的時間”分別呈均勻分布,因此在每個時間段中的生存率呈線性變化,故各個組段間的生存率用直線相連接,Kaplan-Meier法的生存曲線是右連續(xù)的階梯型曲線。當(dāng)樣本量較大及死亡時點(diǎn)較

22、多時,階梯形就不明顯了。例144 在例143中介紹了McKelvey et al收集了19名3期淋巴瘤病人的生存資料,該研究者還同時收集了4期淋巴瘤病人的生存數(shù)據(jù)共61例:4,6,10,11,11,11,13,17,20,20,21,22,24,24,29,30,30,31,33,34,35,39,40,41+,43+,45,46,50,56,61+,61+,63,68,82,85,88,89,90,93,104,110,134,137,160+,169,171,173,175,184,201,222,235+,247+,260+,284+,290+,291+,302+,304+,341+,3

23、45+。要比較3期淋巴瘤患者和4期淋巴瘤患者的生存率是否有差異。SAS分析程序data ch14_4; 定義數(shù)據(jù)集名do c=1 to 2; 定義分組變量input n; 輸入每組觀察次數(shù)do i=1 to n;input time censor ; 輸入時間變量和截尾變量output;end;end;cards;196 1 19 1 32 1 42 1 42 1 43 0 94 1 126 0 169 0 207 1 211 0 227 0 253 1 255 0 270 0 310 0 316 0 335 0 346 0614 1 6 1 10 1 11 1 11 1 11 1 13 1

24、17 1 20 1 20 1 21 1 22 1 24 1 24 1 29 1 30 1 30 1 31 1 33 1 34 1 35 1 39 1 40 1 41 0 43 0 45 1 46 1 50 1 56 1 61 0 61 0 63 1 68 1 82 1 85 1 88 1 89 1 90 1 93 1 104 1 110 1 134 1 137 1 160 0 169 1 171 1 173 1 175 1 184 1 201 1 222 1 235 0 247 0 260 0 284 0 290 0 291 0 302 0 304 0 341 0 345 0;proc lif

25、etest plots=(s); 利用lifetest過程進(jìn)行生存分析time time*censor(0); 指定時間變量和截尾變量strata c; 指定分層變量run;SAS軟件輸出結(jié)果解釋The LIFETEST Procedure Testing Homogeneity of Survival Curves for time over Strata Rank Statistics c Log-Rank Wilcoxon 1 -8.6870 -396.00 2 8.6870 396.00 Covariance Matrix for the Log-Rank Statistics c 1 2 1 11.2471 -11.2471 2 -11.2471 11.2471 Covariance Matrix for the Wilcoxon Statistics c 1 2 1 30749.5 -30749.5 2 -30749.5 30749.5 Test of Equality over Strata Pr Test Chi-Square DF Chi-Square Log-R

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論