高通量測(cè)序:第二代測(cè)序技術(shù)詳細(xì)介紹.doc_第1頁
高通量測(cè)序:第二代測(cè)序技術(shù)詳細(xì)介紹.doc_第2頁
高通量測(cè)序:第二代測(cè)序技術(shù)詳細(xì)介紹.doc_第3頁
高通量測(cè)序:第二代測(cè)序技術(shù)詳細(xì)介紹.doc_第4頁
高通量測(cè)序:第二代測(cè)序技術(shù)詳細(xì)介紹.doc_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

在過去幾年里,新一代DNA 測(cè)序技術(shù)平臺(tái)在那些大型測(cè)序?qū)嶒?yàn)室中迅猛發(fā)展,各種新技術(shù) 猶如雨后春筍般涌現(xiàn)。之所以將它們稱之為新一代測(cè)序技術(shù)(next-generation sequencing), 是相對(duì)于傳統(tǒng)Sanger 測(cè)序而言的。Sanger 測(cè)序法一直以來因可靠、準(zhǔn)確,可以產(chǎn)生長(zhǎng)的 讀長(zhǎng)而被廣泛應(yīng)用,但是它的致命缺陷是相當(dāng)慢。十三年,一個(gè)人類基因組,這顯然不是理 想的速度,我們需要更高通量的測(cè)序平臺(tái)。此時(shí),新一代測(cè)序技術(shù)應(yīng)運(yùn)而生,它們利用大量 并行處理的能力讀取多個(gè)短DNA 片段,然后拼接成一幅完整的圖畫。 Sanger 測(cè)序大家都比較了解,是先將基因組DNA 片斷 化,然后克隆到質(zhì)粒載體上,再轉(zhuǎn)化大腸桿菌。對(duì)于每個(gè)測(cè)序反應(yīng),挑出單克隆,并純化質(zhì) 粒DNA。每個(gè)循環(huán)測(cè)序反應(yīng)產(chǎn)生以ddNTP 終止的,熒光標(biāo)記的產(chǎn)物梯度,在測(cè)序儀的96 或384 毛細(xì)管中進(jìn)行高分辨率的電泳分離。當(dāng)不同分子量的熒光標(biāo)記片斷通過檢測(cè)器時(shí), 四通道發(fā)射光譜就構(gòu)成了測(cè)序軌跡。 在新一代測(cè)序技術(shù)中,片斷化的基因組DNA 兩側(cè)連上接頭,隨后運(yùn)用不同的步驟來產(chǎn)生幾 百萬個(gè)空間固定的PCR 克隆陣列(polony)。每個(gè)克隆由單個(gè)文庫片段的多個(gè)拷貝組成。之后進(jìn)行引物雜交和酶延伸反應(yīng)。由于所有的克隆都是系在同一平面上,這些反應(yīng)就能夠大 規(guī)模平行進(jìn)行。同樣地,每個(gè)延伸所摻入的熒光標(biāo)記的成像檢測(cè)也能同時(shí)進(jìn)行,來獲取測(cè)序 數(shù)據(jù)。酶拷問和成像的持續(xù)反復(fù)構(gòu)成了相鄰的測(cè)序閱讀片段。 Solexa 高通量測(cè)序原理 -采用大規(guī)模并行合成測(cè)序法(SBS, Sequencing-By-Synthesis)和可逆性末端終結(jié)技術(shù)(Reversible Terminator Chemistry)-可減少因二級(jí)結(jié)構(gòu)造成的一段區(qū)域的缺失。-具有高精確度、高通量、高靈敏度和低成本等突出優(yōu)勢(shì)-可以同時(shí)完成傳統(tǒng)基因組學(xué)研究(測(cè)序和注釋)以及功能基因組學(xué)(基因表達(dá)及調(diào)控,基因功能,蛋白/核酸相互作用)研究-將接頭連接到片段上,經(jīng) PCR 擴(kuò)增后制成 Library 。-隨后在含有接頭(單鏈引物)的芯片( flow cell )上將已加入接頭的 DNA 片段變成單鏈后通過與單鏈引物互補(bǔ)配對(duì)綁定在芯片上,另一端和附近的另外一個(gè)引物互補(bǔ)也被固定,形成“橋”-經(jīng)30倫擴(kuò)增反應(yīng),形成單克隆DNA簇-邊合成邊測(cè)序(Sequencing By Synthesis)的原理,加入改造過的DNA 聚合酶和帶有4 種熒光標(biāo)記的dNTP。 這些dNTP是“可逆終止子”,其3羥基末端帶有可化學(xué)切割的基團(tuán),使得每個(gè)循環(huán)只能摻入單個(gè)堿基。此時(shí),用激光掃描反應(yīng)板表面,讀取每條模板序列第一輪反應(yīng)所聚合上去的核苷酸種類。之后,將這些基團(tuán)化學(xué)切割,恢復(fù)3端粘性,繼續(xù)聚合第二個(gè)核苷酸。如此繼續(xù)下去,直到每條模板序列都完全被聚合為雙鏈。這樣,統(tǒng)計(jì)每輪收集到的熒光信號(hào)結(jié)果,就可以得知每個(gè)模板DNA 片段的序列。目前的配對(duì)末端讀長(zhǎng)可達(dá)到250 bp,更長(zhǎng)的讀長(zhǎng)也能實(shí)現(xiàn),但錯(cuò)誤率會(huì)增高。讀長(zhǎng)會(huì)受到多個(gè)引起信號(hào)衰減的因素所影響,如熒光標(biāo)記的不完全切割。Roche 454 測(cè)序技術(shù)“一個(gè)片段 = 一個(gè)磁珠 = 一條讀長(zhǎng)(One fragment =One bead = One read)”1)樣品輸入并片段化:GS FLX 系統(tǒng)支持各種不同來源的樣品,包括基因組DNA、PCR產(chǎn)物、BAC、cDNA、小分子RNA 等等。大的樣品例如基因組DNA 或者BAC 等被打斷成300800 bp 的片段;對(duì)于小分子的非編碼RNA 或者PCR 擴(kuò)增產(chǎn)物,這一步則不需要。短的PCR 產(chǎn)物則可以直接跳到步驟3)。2)文庫制備:借助一系列標(biāo)準(zhǔn)的分子生物學(xué)技術(shù),將A 和B 接頭(3和5端具有特異性)連接到DNA 片段上。接頭也將用于后續(xù)的純化,擴(kuò)增和測(cè)序步驟。具有A、B 接頭的單鏈DNA 片段組成了樣品文庫。3)一個(gè)DNA 片段一個(gè)磁珠:?jiǎn)捂淒NA 文庫被固定在特別設(shè)計(jì)的DNA 捕獲磁珠上。每一個(gè)磁珠攜帶了一個(gè)獨(dú)特的單鏈DNA 片段。磁珠結(jié)合的文庫被擴(kuò)增試劑乳化,形成油包水的混合物,這樣就形成了只包含一個(gè)磁珠和一個(gè)獨(dú)特片段的微反應(yīng)器。4)乳液PCR 擴(kuò)增:每個(gè)獨(dú)特的片段在自己的微反應(yīng)器里進(jìn)行獨(dú)立的擴(kuò)增,而沒有其他的競(jìng)爭(zhēng)性或者污染性序列的影響。整個(gè)片段文庫的擴(kuò)增平行進(jìn)行。對(duì)于每一個(gè)片段而言,擴(kuò)增后產(chǎn)生了幾百萬個(gè)相同的拷貝。隨后,乳液混合物被打破,擴(kuò)增的片段仍然結(jié)合在磁珠上。5)一個(gè)磁珠一條讀長(zhǎng):攜帶DNA 的捕獲磁珠隨后放入PTP 板中進(jìn)行后繼的測(cè)序。PTP 孔的直徑(29um)只能容納一個(gè)磁珠(20um)。然后將PTP 板放置在GS FLX 中,測(cè)序 開始。放置在四個(gè)單獨(dú)的試劑瓶里的四種堿基,依照T、A、C、G 的順序依次循環(huán)進(jìn)入PTP 板,每次只進(jìn)入一個(gè)堿基。如果發(fā)生堿基配對(duì),就會(huì)釋放一個(gè)焦磷酸。這個(gè)焦磷酸在ATP 硫酸化酶和螢光素酶的作用下,經(jīng)過一個(gè)合成反應(yīng)和一個(gè)化學(xué)發(fā)光反應(yīng),最終將螢光素氧化 成氧化螢光素,同時(shí)釋放出光信號(hào)。此反應(yīng)釋放出的光信號(hào)實(shí)時(shí)被儀器配置的高靈敏度CCD 捕獲到。有一個(gè)堿基和測(cè)序模板進(jìn)行配對(duì),就會(huì)捕獲到一分子的光信號(hào);由此一一對(duì)應(yīng),就 可以準(zhǔn)確、快速地確定待測(cè)模板的堿基序列。這也就是大名鼎鼎的焦磷酸測(cè)序。 6)數(shù)據(jù)分析:GS FLX 系統(tǒng)在10 小時(shí)的運(yùn)行當(dāng)中可獲得100 多萬個(gè)讀長(zhǎng),讀取超過4-6 億個(gè)堿基信息。GS FLX 系統(tǒng)提供兩種不同的生物信息學(xué)工具對(duì)測(cè)序數(shù)據(jù)進(jìn)行分析,適用 于不同的應(yīng)用:達(dá)400 MB 的從頭拼接和任何大小基因組的重測(cè)序。 GS FLX 系統(tǒng)的準(zhǔn)確率在99%以上。其主要限制來自同聚物,也就是相同堿基的連續(xù)摻入, 如AAA 或GGG。由于沒有終止元件來阻止單個(gè)循環(huán)的連續(xù)摻入,同聚物的長(zhǎng)度就需要從 信號(hào)強(qiáng)度中推斷出來。這個(gè)過程就可能產(chǎn)生誤差。因此,454 測(cè)序平臺(tái)的主要錯(cuò)誤類型是插 入-缺失,而不是替換。 ABI SOLID 測(cè)序技術(shù)a. 文庫制備 SOLiD 系統(tǒng)能支持兩種測(cè)序模板:片段文庫(fragment library)或配對(duì)末端文庫(mate-paired library)。使用哪一種文庫取決于你的應(yīng)用及需要的信息。片段文庫就是將基因組DNA 打斷, 兩頭加上接頭,制成文庫。如果你想要做轉(zhuǎn)錄組測(cè)序、RNA 定量、miRNA 探索、重測(cè)序、 3, 5-RACE、甲基化分析、ChIP 測(cè)序等,就可以用它。如果你的應(yīng)用是全基因組測(cè)序、SNP 分析、結(jié)構(gòu)重排/拷貝數(shù),則需要用配對(duì)末端文庫。配對(duì)末端文庫是將基因組DNA 打斷后, 與中間接頭連接,再環(huán)化,然后用EcoP15 酶切,使中間接頭兩端各有27bp 的堿基,再加 上兩端的接頭,形成文庫。 b. 乳液PCR/微珠富集 在微反應(yīng)器中加入測(cè)序模板、PCR 反應(yīng)元件、微珠和引物,進(jìn)行乳液PCR(Emulsion PCR)。 PCR 完成之后,變性模板,富集帶有延伸模板的微珠,去除多余的微珠。微珠上的模板經(jīng) 過3修飾,可以與玻片共價(jià)結(jié)合??吹竭@里,是不是有一種似曾相識(shí)的感覺呢?那就對(duì)了, 此步驟與454 的GS FLX 基本相同。不過SOLiD 系統(tǒng)的微珠要小得多,只有1 um。 乳液PCR 最大的特點(diǎn)是可以形成數(shù)目龐大的獨(dú)立反應(yīng)空間以進(jìn)行DNA 擴(kuò)增。其關(guān)鍵技術(shù) 是“注水到油”,基本過程是在PCR 反應(yīng)前,將包含PCR 所有反應(yīng)成分的水溶液注入到高速 旋轉(zhuǎn)的礦物油表面,水溶液瞬間形成無數(shù)個(gè)被礦物油包裹的小水滴。這些小水滴就構(gòu)成了獨(dú) 立的PCR 反應(yīng)空間。理想狀態(tài)下,每個(gè)小水滴只含一個(gè)DNA 模板和一個(gè)P1 磁珠,由于水 相中的P2 引物和磁珠表面的P1 引物所介導(dǎo)的PCR 反應(yīng),這個(gè)DNA 模板的拷貝數(shù)量呈指 數(shù)級(jí)增加,PCR 反應(yīng)結(jié)束后,P1 磁珠表面就固定有拷貝數(shù)目巨大的同來源DNA 模板擴(kuò)增 產(chǎn)物。 c. 微珠沉積 3修飾的微珠沉積在一塊玻片上。在微珠上樣的過程中,沉積小室將每張玻片分成1 個(gè)、4 個(gè)或8 個(gè)測(cè)序區(qū)域。SOLiD 系統(tǒng)最大的優(yōu)點(diǎn)就是每張玻片能容納更高密度的微珠,在同一 系統(tǒng)中輕松實(shí)現(xiàn)更高的通量。 d. 連接測(cè)序 這一步可就是SOLiD 的獨(dú)門秘笈了。它的獨(dú)特之處在于沒有采用慣常的聚合酶,而用了連 接酶。SOLiD 連接反應(yīng)的底物是8 堿基單鏈熒光探針混合物。連接反應(yīng)中,這些探針按照 堿基互補(bǔ)規(guī)則與單鏈DNA 模板鏈配對(duì)。探針的5末端分別標(biāo)記了CY5、Texas Red、CY3、 6-FAM 這4 種顏色的熒光染料。探針3端15 位為隨機(jī)堿基,可以是ATCG四種堿基中 的任何一種堿基,其中第1、2 位構(gòu)成的堿基對(duì)是表征探針染料類型的編碼區(qū),下圖的雙堿基編碼矩陣規(guī)定了該編碼區(qū)16 種堿基對(duì)和4 種探針顏色的對(duì)應(yīng)關(guān)系,而35 位的“n”表示隨機(jī)堿基,68 位的“z”指的是可以和任何堿基配對(duì)的特殊堿基。 單向SOLiD 測(cè)序包括五輪測(cè)序反應(yīng),每輪測(cè)序反應(yīng)含有多次連接反應(yīng)。第一輪測(cè)序的第一 次連接反應(yīng)由連接引物“n”介導(dǎo),由于每個(gè)磁珠只含有均質(zhì)單鏈DNA 模板,所以這次連接反 應(yīng)摻入一種8 堿基熒光探針,SOLiD 測(cè)序儀記錄下探針第1、2 位編碼區(qū)顏色信息,隨后的 化學(xué)處理斷裂探針3端第5、6 位堿基間的化學(xué)鍵,并除去68 位堿基及5末端熒光基團(tuán), 暴露探針第5 位堿基5磷酸,為下一次連接反應(yīng)作準(zhǔn)備。因?yàn)榈谝淮芜B接反應(yīng)使合成鏈多 了5 個(gè)堿基,所以第二次連接反應(yīng)得到模板上第6、7 位堿基序列的顏色信息,而第三次連 接反應(yīng)得到的是第11、12 位堿基序列的顏色信息 幾個(gè)循環(huán)之后,引物重置,開始第二輪的測(cè)序。由于第二輪連接引物n-1 比第一輪錯(cuò)開一位, 所以第二輪得到以0,1 位起始的若干堿基對(duì)的顏色信息。五輪測(cè)序反應(yīng)反應(yīng)后,按照第0、 1 位,第1、2 位. 的順序把對(duì)應(yīng)于模板序列的顏色信息連起來,就得到由“0,1,2,3” 組成的SOLiD 原始顏色序列。 e. 數(shù)據(jù)分析SOLiD 測(cè)序完成后,獲得了由顏色編碼組成的SOLiD 原始序列。理論上來說,按照“雙堿基 編碼矩陣”,只要知道所測(cè)DNA 序列中任何一個(gè)位置的堿基類型,就可以將SOLiD 原始顏 色序列“解碼”成堿基序列。但由于雙堿基編碼規(guī)則中雙堿基與顏色信息的簡(jiǎn)并特性(一種顏 色對(duì)應(yīng)4 種堿基對(duì)),前面堿基的顏色編碼直接影響緊跟其后堿基的解碼,所以一個(gè)錯(cuò)誤 顏色編碼就會(huì)引起“連鎖解碼錯(cuò)誤”,改變錯(cuò)誤顏色編碼之后的所有堿基。 和其它所有測(cè)序儀一樣,測(cè)序錯(cuò)誤在所難免,關(guān)鍵是對(duì)測(cè)序錯(cuò)誤的評(píng)價(jià)和后續(xù)處理。由于 SOLiD 系統(tǒng)采用了雙堿基編碼技術(shù),在測(cè)序過程中對(duì)每個(gè)堿基判讀兩遍,從而減少原始數(shù) 據(jù)錯(cuò)誤,提供內(nèi)在的校對(duì)功能。這樣,雙保險(xiǎn)確保了SOLiD 系統(tǒng)原始?jí)A基數(shù)據(jù)的準(zhǔn)確度大 于99.94%,而在15X 覆蓋率時(shí)的準(zhǔn)確度可以達(dá)到99.999%,是目前新一代基因分析技術(shù) 中準(zhǔn)確度最高的。 為避免“連鎖解碼錯(cuò)誤”的發(fā)生,SOLiD 數(shù)據(jù)分析軟件不直接將SOLiD 原始顏色序列解碼成 堿基序列,而是依靠reference 序列進(jìn)行后續(xù)數(shù)據(jù)分析。SOLiD 序列分析軟件首先根據(jù)“雙 堿基編碼矩陣”把reference 堿基序列轉(zhuǎn)換成顏色編碼序列,然后與SOLiD 原始顏色序列進(jìn) 行比較,來獲得SOLiD 原始顏色序列在reference

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論