


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、醫(yī)學(xué)研究中Logistic回歸與其他方法的結(jié)合應(yīng)用 【關(guān)鍵詞】 Logistic回歸Logistic回歸(logistic regression)屬于概率型非線性回歸,是分析反應(yīng)變量為獨(dú)立分類資料的常用統(tǒng)計(jì)分析方法,由于對(duì)資料的正態(tài)性和方差齊性不做要求、對(duì)自變量類型也不做要求等,使得近年來Logistic回歸模型在醫(yī)學(xué)研究各個(gè)領(lǐng)域被廣泛用,如流行病學(xué)、病因?qū)W的隊(duì)列研究、病例對(duì)照研究,臨床診斷的判別模型,治療效果評(píng)價(jià)等。 同時(shí)與其他傳統(tǒng)的統(tǒng)計(jì)學(xué)方法一樣,Logistic回歸也有許多的應(yīng)用條件:當(dāng)自變量為連續(xù)型變量時(shí),Logitp與自變量成線性,對(duì)多元共線性敏感,以及參數(shù)估計(jì)條件等17,使Logi
2、stic回歸在單獨(dú)面對(duì)醫(yī)學(xué)領(lǐng)域日益龐大和復(fù)雜多變的數(shù)據(jù)信息時(shí),往往受到一定的限制,無法使數(shù)據(jù)信息得到充分利用,應(yīng)用不當(dāng)還會(huì)得出錯(cuò)誤結(jié)論。因此隨著統(tǒng)計(jì)學(xué)方法的不斷發(fā)展和新的統(tǒng)計(jì)學(xué)方法的出現(xiàn),Logistic回歸在越來越多的醫(yī)學(xué)研究的文獻(xiàn)資料中常常不再獨(dú)自出現(xiàn),而是與其他方法相互結(jié)合取長補(bǔ)短,充分利用資料中的信息,從而得出相對(duì)正確的結(jié)論。本研究將對(duì)近幾年Logistic回歸在醫(yī)學(xué)研究中與其他方法相互結(jié)合及比較應(yīng)用作簡要介紹。1 主成分Logistic回歸分析 Logistic回歸模型與多元線性回歸一樣,對(duì)自變量中存在的多元共線性很敏感。自變量之間的任何相關(guān)都表示存在多元共線性。在多元共線性程度較高
3、時(shí), 可能導(dǎo)致模型參數(shù)的不精確估計(jì), 使變量的單獨(dú)影響不易分解出來, 從而把一些本應(yīng)對(duì)應(yīng)變量有顯著影響的變量排除在模型之外。解決共線性的方法一般有:刪除冗余的自變量,但在實(shí)際中往往會(huì)因?yàn)闊o法區(qū)別有意義的變量與冗余變量而誤刪,從而造成模型誤設(shè);增加樣本含量,使標(biāo)準(zhǔn)誤減少,抵消多重共線性的影響。但這種方法只有在多重共線性是由測(cè)量誤差引起或偶然存在于原始樣本而不存在于總體時(shí)才適用;用逐步Logistic回歸,尋求建立一種最佳回歸方程,這種方法容易損失一些信息;用主成分Logistic回歸,通過主成分變換,將高度相關(guān)的幾個(gè)變量的信息綜合起來參與回歸8,主成分分析能夠用少數(shù)變量對(duì)相關(guān)變量進(jìn)行綜合,既能降
4、低指標(biāo)的維數(shù),又能充分反映指標(biāo)的信息,從而將變量間共線性問題減弱,對(duì)結(jié)果不產(chǎn)生影響,這是目前我們最常用的解決共線性的方法。但總的來說,主成分Logistic回歸也沒有從根本上克服Logistic回歸的共線性問題,仍然需要我們尋找更為有效的方法9,10。2 Logistic回歸在ROC分析中的應(yīng)用 ROC是受試者工作特征(Receiver Operating Characteristic)或相對(duì)工作特征(Relative Operating Characteristic)的縮寫, 目前已廣泛應(yīng)用于臨床診斷性能的評(píng)價(jià), ROC曲線是以試驗(yàn)結(jié)果的每一個(gè)值作為可能的診斷界值,由此計(jì)算得到相應(yīng)的靈敏度和
5、特異度,以假陽性率即特異度為橫坐標(biāo),以真陽性率即靈敏度為縱坐標(biāo)繪制而成的曲線即為ROC曲線,其曲線下面積的大小可作為診斷試驗(yàn)準(zhǔn)確度的衡量指標(biāo),其取值范圍為0.51。ROC曲線下面積估計(jì)可分為參數(shù)和非參數(shù)兩種方法,在實(shí)際應(yīng)用中可根據(jù)樣本量大小來選擇使用11。ROC曲線下面積指標(biāo)因其不受患病率和診斷界值的影響,以及可對(duì)兩個(gè)診斷試驗(yàn)的準(zhǔn)確度進(jìn)行綜合比較,因而成為目前公認(rèn)的最佳評(píng)價(jià)指標(biāo)12。ROC 分析中結(jié)合Logistic回歸模型簡單有效,尤其適用于有協(xié)變量或多指標(biāo)聯(lián)合診斷試驗(yàn)的分析評(píng)價(jià)。在一項(xiàng)診斷試驗(yàn)中,由于變異的存在,必然有很多混雜因素(或協(xié)變量) 對(duì)試驗(yàn)的評(píng)價(jià)產(chǎn)生影響,它們可能對(duì)疾病的狀態(tài)產(chǎn)生
6、影響,也可能對(duì)測(cè)量結(jié)果產(chǎn)生影響。其中可以識(shí)別的因素,一般在試驗(yàn)設(shè)計(jì)階段應(yīng)加以控制。但在實(shí)際工作中,由于病例來源問題,在設(shè)計(jì)階段進(jìn)行控制非常困難,因此在統(tǒng)計(jì)分析階段,盡可能地識(shí)別、控制混雜因素(或協(xié)變量) 顯得尤為重要。Logistic回歸模型能夠納入診斷指標(biāo)之外的影響因素,有效控制混雜因素,使ROC分析更接近于總體實(shí)際情況13。3 Logistic回歸與數(shù)據(jù)挖掘技術(shù)的結(jié)合應(yīng)用 數(shù)據(jù)挖掘(Data Mining)是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識(shí)的過程14。數(shù)據(jù)挖掘技術(shù)是近幾年興起來的一個(gè)新的研究領(lǐng)域,其與傳統(tǒng)數(shù)據(jù)分析
7、的本質(zhì)區(qū)別在于:數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí)。目前與Logistic回歸的結(jié)合使用多見于以下形式: 分類樹模型:分類樹模型屬于決策樹(decision tree)15的一種形式。在應(yīng)用回歸模型分析因變量與自變量之間的回歸關(guān)系時(shí),常常需要考慮各自變量之間對(duì)因變量可能存在的交互作用。當(dāng)模型中的自變量數(shù)量較多,需要考慮的交互作用就會(huì)比較復(fù)雜,操作起來有一定的困難。而分類樹模型作為一種人工智能分析方法,能夠快速尋找并發(fā)現(xiàn)對(duì)因變量的主要影響因素,并在展示自變量間交互作用上有著獨(dú)到的優(yōu)勢(shì),但它無法分析自變量的線性疊加效應(yīng),并且往往把一些自變量之間的線性疊加效應(yīng)的關(guān)系錯(cuò)誤地用分層關(guān)系
8、進(jìn)行表達(dá),而回歸模型不僅可以較方便地表達(dá)自變量之間的線性疊加效應(yīng),而且在已知樹模型結(jié)果的情況下,可以對(duì)應(yīng)構(gòu)造相應(yīng)的回歸模型表達(dá)分層的情況和實(shí)現(xiàn)分層統(tǒng)計(jì)分析。將這兩種模型的優(yōu)勢(shì)在分析層次數(shù)據(jù)時(shí)結(jié)合起來加以利用,將會(huì)大大方便研究工作16,17。 BP (Back propagation)神經(jīng)網(wǎng)絡(luò)18:BP神經(jīng)網(wǎng)絡(luò)是一種非傳統(tǒng)的多元非線性模型,自變量可以是連續(xù)的也可以是離散的,對(duì)變量不要求滿足正態(tài)性和獨(dú)立性等條件,可以識(shí)別變量間復(fù)雜的非線性關(guān)系,尤其是用現(xiàn)有統(tǒng)計(jì)方法無法達(dá)到目的或效果不好時(shí),采用此模型往往收到很好的效果。當(dāng)然BP神經(jīng)網(wǎng)絡(luò)在使用過程中尚有些問題需要解決,如權(quán)重系數(shù)的假設(shè)檢驗(yàn),計(jì)算權(quán)重系數(shù)的可信區(qū)間,含隱含層時(shí)權(quán)重系數(shù)的醫(yī)學(xué)解釋,判斷輸入變量的判別能力,輸入變量的選擇等19,20。因此目前的很多文章中,都是將BP神經(jīng)網(wǎng)絡(luò)與Logistic回歸比較使用,來判斷其判別效果。 目前數(shù)據(jù)挖掘技術(shù)在醫(yī)學(xué)領(lǐng)域的應(yīng)用特別是與傳統(tǒng)統(tǒng)計(jì)方法的結(jié)合應(yīng)用還處于起步階段,隨著該方法的逐步普及,其與傳統(tǒng)統(tǒng)計(jì)方法優(yōu)勢(shì)互補(bǔ)的特點(diǎn)將會(huì)不斷顯現(xiàn),使用前景是十分廣闊的。 綜上幾個(gè)方面可以看出,在醫(yī)學(xué)研究中,無論是做為分析還是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 安徽省阜陽市潁州區(qū)2025屆數(shù)學(xué)三年級(jí)第一學(xué)期期末質(zhì)量跟蹤監(jiān)視模擬試題含解析
- 2025屆西藏山南地區(qū)扎囊縣數(shù)學(xué)三年級(jí)第一學(xué)期期末模擬試題含解析
- 行政管理的公共關(guān)系學(xué)備考試題及答案
- 2022 年中級(jí)會(huì)計(jì)師考試《中級(jí)經(jīng)濟(jì)法》真題及解析(9月5日)
- 劇組協(xié)調(diào)員助理場(chǎng)記聘用合同
- 長期公寓租賃合同
- 中級(jí)經(jīng)濟(jì)師考試對(duì)行業(yè)發(fā)展的影響與試題及答案
- 農(nóng)民信息技術(shù)應(yīng)用服務(wù)合同
- 知識(shí)產(chǎn)權(quán)轉(zhuǎn)讓與保密協(xié)議細(xì)節(jié)展開說明文檔
- 心理學(xué)應(yīng)用知識(shí)練習(xí)題
- 2025屆北京市東城區(qū)高三二模 政治試題(含答案)
- 公共組織績效評(píng)估-形考任務(wù)一(占10%)-國開(ZJ)-參考資料
- 《慢性阻塞性肺疾病》課件
- 家校共育 靜待花開 課件高二下學(xué)期學(xué)考動(dòng)員家長會(huì)
- 2025陜西氫能產(chǎn)業(yè)發(fā)展有限公司所屬單位招聘(101人)筆試參考題庫附帶答案詳解
- 2025安全生產(chǎn)月安全生產(chǎn)知識(shí)競賽題庫及答案(共1418題)
- 2024年內(nèi)蒙古師范大學(xué)招聘事業(yè)編制人員考試真題
- 切割鋼絲企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級(jí)戰(zhàn)略研究報(bào)告
- 企業(yè)融資的多樣選擇試題及答案
- 郵輪概論考試題及答案
- 2024年春八年級(jí)生物下冊(cè) 25.1 發(fā)酵技術(shù)教學(xué)設(shè)計(jì) (新版)北師大版
評(píng)論
0/150
提交評(píng)論