第七屆全國研究生數(shù)學(xué)建模比賽A題及格式要求_第1頁
第七屆全國研究生數(shù)學(xué)建模比賽A題及格式要求_第2頁
第七屆全國研究生數(shù)學(xué)建模比賽A題及格式要求_第3頁
第七屆全國研究生數(shù)學(xué)建模比賽A題及格式要求_第4頁
第七屆全國研究生數(shù)學(xué)建模比賽A題及格式要求_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、2010年全國研究生數(shù)學(xué)建模競賽A題確定腫瘤的重要基因信息     提取基因圖譜信息方法的研究癌癥起源于正常組織在物理或化學(xué)致癌物的誘導(dǎo)下,基因組發(fā)生的突變,即基因在結(jié)構(gòu)上發(fā)生堿基對的組成或排列順序的改變,因而改變了基因原來的正常分布(即所包含基因的種類和各類基因以該基因轉(zhuǎn)錄的mRNA的多少來衡量的表達(dá)水平)。所以探討基因分布的改變與癌癥發(fā)生之間的關(guān)系具有深遠(yuǎn)的意義。DNA微陣列(DNA microarray),也叫基因芯片,是最近數(shù)年發(fā)展起來的一種能快速、高效檢測DNA片段序列、基因表達(dá)水平的新技術(shù)。它將數(shù)目從幾百個(gè)到上百萬個(gè)不等的稱之為探針的核苷酸序

2、列固定在小的(約1)玻璃或硅片等固體基片或膜上,該固定有探針的基片就稱之為DNA微陣列。根據(jù)核苷酸分子在形成雙鏈時(shí)遵循堿基互補(bǔ)原則,就可以檢測出樣本中與探針陣列中互補(bǔ)的核苷酸片段,從而得到樣本中關(guān)于基因表達(dá)的信息,這就是基因表達(dá)譜,因此基因表達(dá)譜可以用一個(gè)矩陣或一個(gè)向量來表示,矩陣或向量元素的數(shù)值大小即該基因的表達(dá)水平(見附件)。隨著大規(guī)?;虮磉_(dá)譜 ( Gene expression profile ,或稱為基因表達(dá)分布圖)  技術(shù)的發(fā)展,人類各種組織的正常的基因表達(dá)已經(jīng)獲得,各類病人的基因表達(dá)分布圖都有了參考的基準(zhǔn),因此基因表達(dá)數(shù)據(jù)的分析與建模已經(jīng)成

3、為生物信息學(xué)研究領(lǐng)域中的重要課題。如果可以在分子水平上利用基因表達(dá)分布圖準(zhǔn)確地進(jìn)行腫瘤亞型的識別,對診斷和治療腫瘤具有重要意義。因?yàn)槊恳环N腫瘤都有其基因的特征表達(dá)譜(見附圖)。從DNA 芯片所測量的成千上萬個(gè)基因中,找出決定樣本類別的一組基因“標(biāo)簽”,即“信息基因” (informative genes )是正確識別腫瘤類型、給出可靠診斷和簡化實(shí)驗(yàn)分析的關(guān)鍵所在,同時(shí)也為抗癌藥物的研制提供了捷徑。通常由于基因數(shù)目很大,在判斷腫瘤基因標(biāo)簽的過程中,需要剔除掉大量“無關(guān)基因”,從而大大縮小需要搜索的致癌基因范圍。事實(shí)上,在基因表達(dá)譜中,一些基因的表達(dá)水平在所有樣本中都非常接近。

4、例如,不少基因在急性白血病亞型(ALL,AML)兩個(gè)類別中的分布無論其均值還是方差均無明顯差別,可以認(rèn)為這些基因與樣本類別無關(guān),沒有對樣本類型的判別提供有用信息,反而增加信息基因搜索的計(jì)算復(fù)雜度。因此,必須對這些“無關(guān)基因”進(jìn)行剔除。1999 年Science發(fā)表了Golub 等針對上述急性白血病亞型識別與信息基因選取問題的研究結(jié)果1 。Golub 等以“信噪比”(Signal to noise ratio) 指標(biāo)作為衡量基因?qū)颖痉诸愗暙I(xiàn)大小的量度,采用加權(quán)投票的方法進(jìn)行亞型的識別,僅根據(jù)72個(gè)樣本就從7 129 個(gè)基因中選出了50 個(gè)可能與亞型分類相關(guān)的信息基因。Golub 的工作大大縮小

5、了決定急性白血病亞型差異的基因范圍,給出了亞型識別的基因依據(jù),富有創(chuàng)造性。Guyon 等則利用支持向量機(jī)的方法再從中選出了8個(gè)可能的信息基因2。但信噪比肯定不是衡量基因?qū)颖痉诸愗暙I(xiàn)大小的唯一標(biāo)準(zhǔn),腫瘤是致癌基因、抑癌基因、促癌基因和蛋白質(zhì)通過多種方式作用的結(jié)果,在確定某種腫瘤的基因標(biāo)簽時(shí),應(yīng)該設(shè)法充分利用其他有價(jià)值的信息。有專家認(rèn)為3在基因分類研究中忽略基因低水平表達(dá)、差異不大的表達(dá)的傾向應(yīng)該被糾正,與臨床問題相關(guān)的主要生理學(xué)信息(見問題4)應(yīng)該融合到基因分類研究中。 面對提取基因圖譜信息這樣前沿性課題,命題人根據(jù)自己科學(xué)研究的經(jīng)歷和思考,猜測以下幾點(diǎn)是解決前沿性課題的有價(jià)值的工作。這種猜測

6、是科學(xué)研究中的重要環(huán)節(jié),當(dāng)然猜測不會(huì)總是可行的,更不一定總是正確的。但不探索就不能前進(jìn),如果能夠通過數(shù)學(xué)建模,得到的部分結(jié)果可以佐證你們的猜測或?yàn)樾绿剿魈峁┤舾梢罁?jù),就很有價(jià)值。我們的目的只是給研究生以啟發(fā),鼓勵(lì)研究生培養(yǎng)這樣的創(chuàng)造性發(fā)現(xiàn)的能力。所以研究生完全可以獨(dú)立設(shè)計(jì)自己的技術(shù)路線,只要能夠有效提取附件的基因圖譜信息就行。(1) 由于基因表示之間存在著很強(qiáng)的相關(guān)性,所以對于某種特定的腫瘤,似乎會(huì)有大量的基因都與該腫瘤類型識別相關(guān),但一般認(rèn)為與一種腫瘤直接相關(guān)的突變基因數(shù)目很少。對于給定的數(shù)據(jù)(見附件),如何從上述觀點(diǎn)出發(fā),選擇最好的分類因素?(2) 相對于基因數(shù)目,樣本往往很小,如果直接用

7、于分類會(huì)造成小樣本的學(xué)習(xí)問題,如何減少用于分類識別的基因特征是分類問題的核心,事實(shí)上只有當(dāng)這種特征較少時(shí),分類的效果才更好些。對于給定的結(jié)腸癌數(shù)據(jù)如何從分類的角度確定相應(yīng)的基因“標(biāo)簽”? (3) 基因表達(dá)譜中不可避免地含有噪聲(見1999 年Golub在Science發(fā)表的文章),有的噪聲強(qiáng)度甚至較大,對含有噪聲的基因表達(dá)譜提取信息時(shí)會(huì)產(chǎn)生偏差。通過建立噪聲模型,分析給定數(shù)據(jù)中的噪聲能否對確定基因標(biāo)簽產(chǎn)生有利的影響?(4) 在腫瘤研究領(lǐng)域通常會(huì)已知若干個(gè)信息基因與某種癌癥的關(guān)系密切,建立融入了這些有助于診斷腫瘤信息的確定基因“標(biāo)簽”的數(shù)學(xué)模型。比如臨床有下面的生理學(xué)信息:大約90%結(jié)腸癌在早期

8、有5號染色體長臂APC基因的失活,而只有40%50%的ras相關(guān)基因突變。1.參考文獻(xiàn):1T. R. Golub, et al. Monitoring and Class Prediction by Gene Expression,Science, Vol. 286, pp.531-537 (1999);2Guyon I , Weston J , Barnhill S , et al . Gene selection for cancer classification using support vector machines J . Machine Learning ,2000 ,46(13) :389 - 422.3 Z. Sun, P. Yang, Gene expression profiling on lung cancer Outcome Prediction: Present Clinical Value and Future Premise, Cancer Epidemiology Biomarkers & Prevention, 2006, 15(11): 2063-20684李穎新,劉全金,阮曉鋼,急性白血病的基因表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論