




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
高通量測序技術(shù)在基因組學(xué)研究中的應(yīng)用
第二個序列研究技術(shù),也稱為第二個序列研究,它被稱為以第一階段的測量方法為代表的第一個過程研究。在第二個過程中,三種主要的序列測量技術(shù)是roch-454焦磷酸測序(2005年)、illumina-solfa聚合酶合成測序(2006年)和abi-solid連接酶測序(2007年)。與之前的三個常規(guī)序列技術(shù)相比,這三種新型預(yù)測技術(shù)的共同特點(diǎn)是,單個過程(rando)的輸出序列數(shù)據(jù)量都很大,因此也被稱為先進(jìn)的序列測量技術(shù)。高通量測序技術(shù)一般由模板準(zhǔn)備、測序和成像、序列組裝和比對等部分組成.3種二代測序技術(shù)的原理各不相同,其數(shù)據(jù)量產(chǎn)出、數(shù)據(jù)質(zhì)量和單Run運(yùn)行成本也不一樣.Roche/454測序序列讀長(reads)在3種測序技術(shù)中最長(600~1000bp),但其通量最低(0.5~1Gb/run);Illumina/Solexa測序通量大,其新機(jī)型Hiseq2000產(chǎn)出量為600G/run,但讀長比454測序短(通常為100bp);ABI/SOLiD讀長最短(50bp),但其創(chuàng)新之處在于雙堿基編碼的應(yīng)用,降低了測序的錯誤率,而且由于其雙堿基編碼和校正系統(tǒng)的原理與重測序相似,所以SOLiD特別適用于具有高質(zhì)量參考基因組序列物種的重測序.高通量測序技術(shù)的出現(xiàn),使得獲得核酸序列數(shù)據(jù)的單堿基測序費(fèi)用相對于Sanger測序急劇下降,隨之也給基因組學(xué)研究帶來了更多的新方法和新方案.目前,高通量測序技術(shù)已廣泛應(yīng)用于動植物全基因組測序、基因組重測序、轉(zhuǎn)錄組測序、小RNAs測序和表觀基因組測序等方面.本文分別對高通量測序技術(shù)在多研究水平的具體應(yīng)用和最新發(fā)表的文獻(xiàn)進(jìn)行了綜述.1全基因組測序計劃通過對物種基因組序列進(jìn)行系統(tǒng)的研究,可以獲得該物種的基因組和重要功能基因的序列信息,闡述該物種的進(jìn)化史,了解該物種生長發(fā)育和適應(yīng)環(huán)境的分子機(jī)制.全基因組denovo測序也稱為從頭測序,它不依賴任何現(xiàn)有的序列資料,而直接對某個物種的基因組進(jìn)行測序,然后利用生物信息學(xué)分析手段對序列進(jìn)行拼接、組裝,從而獲得該物種的基因組序列圖譜.1990年人類基因組計劃的啟動,標(biāo)志著生命科學(xué)研究向基因組學(xué)領(lǐng)域邁出了重要一步;多種實(shí)驗(yàn)室研究常用的模式生物物種如線蟲(Caenorhabditiselegans)、擬南芥(Arabidopsisthaliana)、小鼠(Musmusculus)、水稻(Oryzasativa)等全基因組測序計劃也得以實(shí)施;伴隨著利用Sanger測序技術(shù)進(jìn)行全基因組測序的熱潮,人類基因組計劃與多種重要模式動植物基因組計劃相繼順利完成[3~7].在這些重要物種基因組計劃順利完成后,科學(xué)家們發(fā)現(xiàn)對于全面解析眾多具有重要科研和經(jīng)濟(jì)價值的動植物物種的基因組序列信息來說,速度慢、通量低和成本高的第一代測序技術(shù)遠(yuǎn)遠(yuǎn)滿足不了需求,這也使得全新測序技術(shù)的開發(fā)顯得更為緊迫和必要.第二代測序技術(shù)出現(xiàn)后,科學(xué)家們開始選擇使用新一代測序技術(shù)來進(jìn)行全基因組denovo測序,Li等人發(fā)表在Nature上的熊貓(Ailuropodamelanoleura)基因組文章,是第一次完全采用新一代測序技術(shù)完成大型物種的全基因組denovo測序.如表1所示,黃瓜(Cucumissativus)、蘋果(MalusdomesticaBorkh)、金小蜂(Nasoniavitripennis,N.giraulti,N.Longicornis)、螞蟻(弓背蟻Camponotusfloridanus,印度跳蟻Harpegnathossaltator)、森林草莓(Fragariavesca)、可可樹(Theobromacacao)等多種物種基因組序列密碼解析過程中都采用了新一代測序的序列數(shù)據(jù).如今,應(yīng)用第二代測序技術(shù)發(fā)表的基因組文章也越來越多,僅2011年就有20多篇關(guān)于不同動植物物種全基因組denovo測序的文章報道[17~38].隨著新一代測序技術(shù)的飛速發(fā)展,基因組測序所需的成本較傳統(tǒng)技術(shù)大大降低,時間周期也大大縮短,大規(guī)模地物種全基因組denovo測序漸入佳境,基因組學(xué)研究也迎來新的發(fā)展契機(jī)和革命性突破.2基因組重測序的應(yīng)用全基因組重測序是對基因組序列已知物種的個體進(jìn)行基因組測序,并進(jìn)行差異信息分析的方法.基于全基因組重測序,研究人員能夠快速的進(jìn)行資源普查篩選,尋找到大量的遺傳差異,實(shí)現(xiàn)遺傳進(jìn)化分析及重要性狀候選基因的預(yù)測.隨著測序成本降低和擁有參考基因組序列的物種增多,基因組重測序也成為育種研究中迅速有效的方法之一,在全基因組水平掃描并檢測出與動植物重要性狀相關(guān)的變異位點(diǎn),具有重大的科研價值和產(chǎn)業(yè)價值.2.1全基因組測序核心種質(zhì)是種質(zhì)資源的核心子集,它們最大限度地保存了整個資源群體的遺傳多樣性,同時代表了整個群體的地理分布.對核心種質(zhì)資源進(jìn)行重測序,可以深入了解其基因與基因型最大范圍的遺傳多樣性,同時對于促進(jìn)種質(zhì)交流、利用和管理具有重要的學(xué)術(shù)和實(shí)用意義.Lai等人對6個玉米(Zeamays)骨干自交系(Zheng58,5003,478,178,Chang7-2和Mo17)進(jìn)行了全基因組重測序.平均每個品系產(chǎn)出5.4X的數(shù)據(jù),共發(fā)現(xiàn)1273124個單核苷酸多態(tài)性位點(diǎn)(singlenucleotidepolymorphisms,SNPs),得到30178個1~6bp的插入缺失位點(diǎn)(insertionanddeletion,InDels).新發(fā)現(xiàn)的這些SNPs和InDels提供了1個高密度的全基因組標(biāo)記信息.同時鑒定出數(shù)百個基因獲得與丟失變異(presence/absencevariations,PAVs),其中296個B73的基因在6個品系中的至少1個品系中發(fā)生丟失,而6個玉米品系中也有數(shù)百個基因在B73中不存在.推測這些骨干親本組合基因組的組合可以彌補(bǔ)另一方功能元件的缺失,這種PAVs的多態(tài)變化和其他無義突變的互補(bǔ)作用可能與雜種優(yōu)勢有關(guān).Zheng等人對3個高粱(Sorghumbicolor)品系(1個美國甜高粱、1個中國甜高粱和1個中國籽實(shí)高粱)品系進(jìn)行了全基因組重測序,每株測序深度為12X,以已測的美國籽實(shí)高粱基因組序列為參考進(jìn)行信息分析;發(fā)掘出1057018個SNPs,99948個1~10bp長的InDels,16487個PAVs和17111個拷貝數(shù)變異(copynumbervariations,CNVs).同時,在甜高粱和籽實(shí)高粱序列中鑒定出近1500個序列結(jié)構(gòu)差異基因,這些基因參與糖與淀粉代謝、木質(zhì)素和香豆素合成、核酸代謝、脅迫應(yīng)答和DNA修復(fù)等生物學(xué)過程.2.2通過群體標(biāo)記的遺傳多樣性檢測在已知物種基因組的情況下,對種內(nèi)群體中的不同個體進(jìn)行基因組重測序,可以在全基因組水平上發(fā)現(xiàn)群體內(nèi)個體之間的差異.通過這種方法,可以尋找出大量的SNPs,InDels,結(jié)構(gòu)變異(structurevariations,SVs)等變異信息,從而獲得生物群體的遺傳特征.這對在群體水平上研究物種的進(jìn)化歷史、環(huán)境適應(yīng)性等方面具有重大意義.利用全基因組重測序有助于快速發(fā)現(xiàn)與動植物重要性狀相關(guān)的遺傳變異,縮短分子育種的實(shí)驗(yàn)周期.Xia等人運(yùn)用新一代測序技術(shù)對29種家蠶(Bombyxmori)和11種野蠶(Bombyxmandarina)進(jìn)行了基因組重測序,構(gòu)建了一個單堿基分辨率的家蠶遺傳變異圖譜.每個個體測序約3X,覆蓋基因組序列的99.88%,鑒定出1600多萬個SNPs,InDels和SVs.分析結(jié)果表明,馴化家蠶確實(shí)由野生蠶分化而來,但它們也保持了很高水平的遺傳變異性,這表明了一個較短馴化事件的發(fā)生.在馴養(yǎng)過程中,人為選擇優(yōu)良品種,性狀相對單一,而自然環(huán)境選擇能夠適應(yīng)環(huán)境、生存能力強(qiáng)的個體,選擇性狀多樣化,由此導(dǎo)致野蠶LD(linkagedisequilibrium)衰減比家蠶更快.同時該工作還發(fā)現(xiàn)354個受到馴化和人工選擇壓力影響的蛋白編碼基因,它們主要參與調(diào)控蠶的絲蛋白合成、能量代謝、生殖特性和飛行能力.Lam等人對17株野生大豆(Glycinesoja)和14株栽培大豆(Glycinemax)進(jìn)行了全基因組重測序,鑒定出630多萬個SNPs,建立了大豆高密度分子標(biāo)記圖譜.通過生物信息軟件分別對野生大豆和栽培大豆序列數(shù)據(jù)進(jìn)行組裝,鑒定出了18萬多個PAVs,得到了在栽培大豆中獲得以及丟失的基因.與栽培大豆相比,野生大豆有著更高水平的遺傳多樣性,這表明人類的選擇導(dǎo)致了栽培大豆狹窄的生物多樣性.此研究還發(fā)現(xiàn)了大豆基因組不同于其他作物的2個顯著特點(diǎn):存在較高程度的基因連鎖不平衡和較高的單核苷酸非同義替換/同義替換比例.這表明,在大豆育種方面,分子標(biāo)記育種比基因圖位克隆可能更具優(yōu)勢.通過核心種質(zhì)資源品系基因組重測序或進(jìn)行群體基因組重測序分析,可對所研究物種的遺傳變異信息進(jìn)行全基因組范圍地鑒定,所獲得的高密度SNPs和InDels標(biāo)記,可為該物種的遺傳學(xué)研究以及分子育種提供重要的多態(tài)性標(biāo)記,也有助于將來在該物種中開展基因與表型關(guān)聯(lián)研究.同時,群體遺傳學(xué)分析所找回的丟失基因?qū)ξ锓N基因集也是很好的補(bǔ)充,可為該物種進(jìn)一步開展功能基因組學(xué)研究提供大量的寶貴數(shù)據(jù).2.3水稻重組自交系的snps分析在過去的20多年,大量的科研工作聚焦于通過數(shù)量性狀位點(diǎn)(quantitativetraitloci,QTLs)分析來探索不同農(nóng)作物的復(fù)雜農(nóng)藝性狀(如產(chǎn)量)的遺傳基礎(chǔ).然而,幾乎所有研究都基于低通量的分子標(biāo)記(如RFLPs和SSRs)所構(gòu)建的連鎖遺傳圖譜,這些圖譜大都因分子標(biāo)記密度較低而不能提供準(zhǔn)確和完全的控制性狀QTLs的數(shù)目和座位信息.新一代測序技術(shù)的應(yīng)用帶來基因組序列數(shù)據(jù)的大幅增長,為更有效進(jìn)行基因作圖和全基因組范圍分析的基因分型策略提供了機(jī)遇,并可在此基礎(chǔ)之上構(gòu)建出超高密度的遺傳圖譜.Huang等人開發(fā)了一種通過基因組重測序?qū)χ亟M群體進(jìn)行基因分型的新方法.該工作對9311與日本晴雜交后自交11代得到的150個RILs進(jìn)行測序,每個RIL測得0.02X數(shù)據(jù),并將所得數(shù)據(jù)與2個親本基因組數(shù)據(jù)相對比,從而找出SNPs.在150個RILs中,共鑒定出1493461個SNPs,平均每個RIL的SNPs密度是1個SNP/40kb.通過滑動窗口方法,進(jìn)行基因分型和重組斷裂點(diǎn)的鑒定,隨之構(gòu)建出含有高密度SNPs和高準(zhǔn)確性重組斷裂位點(diǎn)的重組圖譜.這個水稻重組自交系的遺傳圖譜,基因分型準(zhǔn)確度為99.94%,重組斷點(diǎn)分辨率平均為40kb.根據(jù)這一基于測序的遺傳圖譜,可將一個株高主效QTL位點(diǎn)定位在100kb的區(qū)域內(nèi),而該區(qū)域含有已知的水稻“綠色革命”基因.Huang等人對一個水稻RILs群體進(jìn)行測序,群體親本是珍汕97和明恢63.該研究利用RIL個體的基因組數(shù)據(jù)來反推親本的基因型,得到了高質(zhì)量高密度的遺傳圖譜.第一,所有可能的SNPs被鑒定出來,使用最大簡約法在參考數(shù)據(jù)下,獲得親本的基因型草圖.第二,通過使用SNPs“滑動窗”重采樣和貝葉斯推論過濾掉低質(zhì)量SNPs而鑒定出高質(zhì)量的SNPs.第三,使用高質(zhì)量的SNPs并借助HMM算法對群體中株系完成基因分型.如此構(gòu)建出一個超高密度的連鎖圖譜,使用該圖譜,一個水稻粒寬的QTL被定位在一個200kb大小的bin中,該區(qū)域含有已知的GW5基因,這也反映了該圖譜的高質(zhì)量和高準(zhǔn)確性.Yu等人對一個水稻的RILs群體個體低覆蓋(0.06X)測序得到SNPs數(shù)據(jù)庫,并基于此構(gòu)建出超高密度的遺傳圖譜.用于該研究的水稻重組自交系群體的兩個親本為珍汕97和明恢63,這2個骨干秈稻亞種品系,通過單粒傳的方法構(gòu)建的群體.為了評估遺傳圖譜的質(zhì)量,對一些已克隆基因的位置進(jìn)行了驗(yàn)證,包括了GS3和GW5/qSW5這2個分別控制谷粒長度和寬度的主效QTLs位點(diǎn),以及OsC1這一控制色澤的質(zhì)量性狀位點(diǎn).在所有被選擇用于驗(yàn)證的案例中,目標(biāo)位點(diǎn)都被精確地定位在基因?qū)嶋H所在的bins中,這表明本研究所得圖譜具有很高的質(zhì)量和精確性.這個SNP圖譜結(jié)合多年大田調(diào)查數(shù)據(jù),對水稻的產(chǎn)量和3個產(chǎn)量組成性狀(分蘗數(shù)、穗粒數(shù)、千粒重)進(jìn)行QTL分析,并與基于RFLPs/SSRs的QTL定位進(jìn)行了對比分析.結(jié)果顯示,SNP圖譜可以檢測出更多的和更精確定位的QTLs位點(diǎn),這也證實(shí)了與RFLPs/SSRs圖譜相比,SNP圖譜在檢測限和分辨率上所具有的優(yōu)勢.全基因組重測序檢測得到SNPs信息進(jìn)而基因分型的方法,可適用于具有參考基因組序列質(zhì)量不一的物種的不同類型的作圖群體,并可用于大基因組和低多態(tài)性物種.隨著測序技術(shù)的持續(xù)革新,采用測序構(gòu)建遺傳圖譜的技術(shù)可能會替代傳統(tǒng)的作圖方法,為大范圍發(fā)掘基因和探索更廣泛的生物學(xué)問題提供更有力的工具.2.4突變體的基因組重測序和snps位點(diǎn)正向遺傳突變、適應(yīng)進(jìn)化和表型篩選是創(chuàng)造出帶有希望性狀的新變異有機(jī)體的有力工具和途徑,而這些突變往往不能輕易地用傳統(tǒng)遺傳學(xué)技術(shù)鑒定出來.新一代高通量大規(guī)模平行測序技術(shù),在突變體的親本株系擁有參考基因組的情況下,可以快速和準(zhǔn)確地得到這一個突變體的基因組信息,有利于突變位點(diǎn)的初定位和鑒定.Sarin等人使用傳統(tǒng)研究手段將一個經(jīng)EMS(甲基磺酸乙酯)誘導(dǎo)所得突變體線蟲的突變位點(diǎn)定位于5號染色體上的4Mb區(qū)域內(nèi).隨后使用illumina深度測序技術(shù)得到該線蟲突變體的基因組序列,發(fā)現(xiàn)在初定位的4Mb區(qū)域中,突變體基因組和線蟲參考基因組存在80個變異,其中有4個突變位點(diǎn)處于外顯子區(qū),而唯一的無義突變則存在于R07B5.9基因中,該基因在隨后的驗(yàn)證實(shí)驗(yàn)中得以證實(shí)是目標(biāo)基因.Cuperus等人將EMS誘導(dǎo)的col-0型擬南芥隱型突變體與Ler型野生擬南芥構(gòu)建了F2群體,鑒定出93個突變體純合系,對93個樣本進(jìn)行DNA提取,混合后進(jìn)行高通量測序,數(shù)據(jù)經(jīng)生物信息學(xué)分析發(fā)現(xiàn)在2號染色體上存在一個大小為1.52Mb富含col-0的SNPs的峰(peak).經(jīng)進(jìn)一步研究,他們在該區(qū)域成功找到了目標(biāo)突變位點(diǎn).Ashelford等人對一個擬南芥突變體ebi-1的回交系進(jìn)行基因組重測序,隨后又通過對突變體的表達(dá)數(shù)據(jù)進(jìn)行了調(diào)查使得候選SNPs數(shù)目得以有效地縮小.最終成功鑒定出1個在AtNFXL-2基因中引起ebi-1突變表型的SNPs位點(diǎn).該研究證實(shí)利用回交系材料可以降低遺傳背景噪音,對其進(jìn)行測序分析可有效減少候選SNPs數(shù)目.2.5基于測序的gws方法的應(yīng)用近年來出現(xiàn)的全基因關(guān)聯(lián)分析(genome-wideassociationstudy,GWAS)是一種在醫(yī)學(xué)研究中被廣泛使用于鑒定復(fù)雜疾病的關(guān)鍵易感基因的新技術(shù),但該技術(shù)未能夠廣泛應(yīng)用于作物復(fù)雜性狀的研究,其主要原因是植物中基因分型技術(shù)的不完善,以及各作物中缺少類似人類單體型圖的高密度單體型圖譜.2010年,Huang等人從近50000份的中國起源的水稻品種中,挑選517個具有全面表型調(diào)查數(shù)據(jù)的水稻地方品種進(jìn)行基因分型工作(基因組重測序).通過高通量測序總計得到27億條序列讀長,每個品種約測得1X基因組數(shù)據(jù).重測序鑒定出了約3.6M的SNPs,通過對SNPs的遺傳圖距計算,能夠把群體分成3個的亞群:粳稻、秈稻以及混合品種.利用一種新的數(shù)據(jù)填補(bǔ)方法(k-nearestneighboralgorithm)構(gòu)建了一個高密度的水稻單體型圖譜,并在373個秈稻地方品種中對14個重要農(nóng)藝性狀進(jìn)行GWAS分析,找到了各性狀的相關(guān)關(guān)鍵位點(diǎn),其中有6個位點(diǎn)的信號峰與先前用突變體或重組群體研究定位的基因緊密連鎖,而用GWAS所鑒定的位點(diǎn)平均來看,大約可以解釋36%的表型變異.最近,Zheng等人繼續(xù)采用這種基于測序的GWAS方法,對一個更大、多樣性更高的950份世界范圍內(nèi)水稻栽培種(包括粳稻和秈稻亞種),再次進(jìn)行GWAS分析.總計鑒定出32個與開花期和十粒重相關(guān)聯(lián)的新位點(diǎn),這表明更大的樣本量可以有效提高GWAS檢測性狀相關(guān)變異的能力.同時,通過詳細(xì)注釋,鑒定出18個關(guān)聯(lián)位點(diǎn)的候選基因.這一研究表明,基于測序的GWAS和功能基因組注釋的聯(lián)合應(yīng)用,可以在水稻中找出復(fù)雜性狀與相應(yīng)遺傳多態(tài)性因素一一匹配的相應(yīng)關(guān)系.上述研究表明,GWAS技術(shù)可在水稻中應(yīng)用以鑒定重要農(nóng)藝性狀的相關(guān)基因.而基于測序的GWAS分析方法來鑒定關(guān)鍵基因位點(diǎn),是與傳統(tǒng)的構(gòu)建作圖群體分析復(fù)雜性狀方法互為補(bǔ)充的研究策略.2.6外顯子組測序技術(shù)外顯子組(exome)是一個物種基因組中全部外顯子區(qū)域的總和,它是基因行使其功能最直接的體現(xiàn).通過高通量測序技術(shù)進(jìn)行外顯子組測序,能夠直接發(fā)現(xiàn)與蛋白質(zhì)功能變異相關(guān)的遺傳突變.目標(biāo)區(qū)域深度測序是指對感興趣的特定基因組區(qū)域進(jìn)行高通量測序,因此外顯子組測序也屬于目標(biāo)區(qū)域測序的一種類型.可以將感興趣的基因組區(qū)域定制成特異性的探針,通過這些特異性探針與基因組DNA進(jìn)行雜交,富集基因組目標(biāo)區(qū)域,最后將捕獲到的基因組DNA進(jìn)行高通量測序.相比于全基因組重測序,外顯子組和目標(biāo)區(qū)域測序更加經(jīng)濟(jì)、高效.目前,在醫(yī)學(xué)基因組學(xué)研究領(lǐng)域,外顯子組和目標(biāo)區(qū)域測序技術(shù)已經(jīng)應(yīng)用到尋找人類各種疾病相關(guān)的致病基因和易感基因的研究中,而在動植物研究中已有報道主要集中在小鼠中,在大豆、牛(Bostaurus)、果蠅(Drosophilamelanogaster)等物種中也有部分報道.3群體遺傳標(biāo)記和snps標(biāo)記的應(yīng)用隨著新一代大規(guī)模平行基因分型技術(shù)的發(fā)展,對重要和復(fù)雜性狀基因的QTLs精細(xì)定位和圖位克隆變得更容易獲得成功.在特定作圖群體的QTLs區(qū)域開發(fā)高密度的遺傳標(biāo)記是對經(jīng)濟(jì)性狀重要基因精細(xì)定位和圖位克隆的基礎(chǔ).SNPs是最豐富的遺傳變異形式,存在于任何不同基因型之間,常被用于QTLs定位研究.大規(guī)模平行測序技術(shù),已經(jīng)被廣泛用于鑒定全基因組范圍內(nèi)的序列變異,然而對于復(fù)雜基因組的物種,用最經(jīng)濟(jì)實(shí)惠的方法去鑒定一些QTLs區(qū)域的SNP標(biāo)記很有必要,簡化基因組測序的研究思路也應(yīng)運(yùn)而生.3.1snps測序和分析簡化代表庫(reducedrepresentationlibraries,RRLs)的使用是在人類研究中首次提出,可以通過Sanger測序有效地發(fā)現(xiàn)SNPs.通過選擇一種內(nèi)切酶進(jìn)行酶切,然后進(jìn)行文庫片段大小的選擇,使用一定大小的酶切片段所對應(yīng)的序列作為整個基因組序列的部分代表,來降低基因組的復(fù)雜性.對群體中不同基因型的個體采用相同的內(nèi)切酶進(jìn)行酶切,回收相同大小范圍的酶切片段,建立文庫,然后進(jìn)行高通量測序.對于有參考基因組序列的物種進(jìn)行測序片段的比對,而對于沒有參考序列的物種先進(jìn)行序列組裝,然后對組裝產(chǎn)生的序列進(jìn)行序列比對.通過RRLs測序和分析,可以準(zhǔn)確地發(fā)現(xiàn)SNPs(圖1).vanTassell等人將代表3個群體的66頭牛的基因組DNA進(jìn)行混合,采用HaeⅢ酶切后建立RRLs文庫,并進(jìn)行了高通量測序.通過酶切測序獲得62042個候選的SNPs,應(yīng)用基因分型驗(yàn)證,在全基因組范圍隨機(jī)挑選23357個SNPs,驗(yàn)證率為92%.該工作建立了一種快速、高效、低成本地大規(guī)模開發(fā)SNPs的新方法.Kerstens等人將來自2種品系的6個火雞(Meleagrisgallopavo)個體的基因組DNA進(jìn)行混合,使用Sau3A酶消化后構(gòu)建了一個RRLs文庫.該文庫經(jīng)高通量測序及生物信息學(xué)分析后,鑒定出11000多個的SNPs,在一個代表性的樣本中對340個SNPs進(jìn)行基因分型發(fā)現(xiàn)SNPs的轉(zhuǎn)換率為95%.該工作是在火雞基因組數(shù)據(jù)公布之前所做的,這表明RRLs測序可以高效且低廉地在參考基因組序列未知物種中鑒定出上千個高質(zhì)量SNPs.Wu等人對一個栽培大豆作圖群體的2個親本基因組DNA進(jìn)行混合,經(jīng)CviRⅠ酶切后構(gòu)建了一個RRLs文庫并進(jìn)行了測序分析,鑒定出39022個候選SNPs.從得到的SNPs標(biāo)記中選出164個SNPs用于定位分析一個已知的QTL,可以將該區(qū)域的標(biāo)記密度加密到每42Kb一個標(biāo)記.該工作證實(shí)使用高通量測序技術(shù)和基因組復(fù)雜性簡化技術(shù)相結(jié)合的方法,可以快速地鑒定出很多用于QTL區(qū)域精細(xì)定位的SNPs標(biāo)記.3.2rad-seq、ssrs和群體遺傳分析酶切位點(diǎn)相關(guān)DNA測序(restriction-siteassociatedDNAsequencing,RAD-seq)技術(shù)是隨著高通量測序的出現(xiàn)應(yīng)運(yùn)而生的一種新技術(shù),RAD標(biāo)簽是一種以芯片雜交為基礎(chǔ)的分子標(biāo)記,而RAD-seq則是直接對RAD標(biāo)簽進(jìn)行測序分析,從而進(jìn)行SNPs的開發(fā)和分型,如圖2所示,RAD標(biāo)簽的獲得過程,簡單來說是對酶切后DNA片段加上可與酶切所得黏性末端序列互補(bǔ)的接頭1,隨機(jī)打斷后,再加上非特異性接頭2,利用識別接頭1和接頭2上的引物對進(jìn)行PCR反應(yīng),只有分別帶有接頭1和接頭2的酶切位點(diǎn)周邊的DNA片段會得到有意義的擴(kuò)增,即為RAD標(biāo)簽,對其進(jìn)行高通量測序反應(yīng),便被稱為RAD-seq技術(shù).RAD-seq技術(shù)在模式和非模式生物的遺傳分析包括基因型-表型關(guān)聯(lián)圖譜、系統(tǒng)進(jìn)化、群體遺傳等研究領(lǐng)域具有廣泛的應(yīng)用前景.Baird等人第一次報道了RAD-seq技術(shù),他們在三刺魚(Gasterosteusaculeatus)中成功應(yīng)用該技術(shù)鑒定出13000多個SNPs.同時開發(fā)了適用于樣本混合的標(biāo)簽系統(tǒng),并應(yīng)用于三刺魚F2群體中個體的重組斷點(diǎn)的鑒定,從而確定了該魚種體側(cè)骨板缺失的遺傳基礎(chǔ).標(biāo)簽系統(tǒng)也被用于另外一個性狀(弱骨盆結(jié)構(gòu)刺退化)的遺傳定位.為了進(jìn)一步證實(shí)RAD-seq技術(shù)可行性,在鏈孢霉(Neurosporacrassa)中利用該方法鑒定了多態(tài)性分子標(biāo)記并成功定位了一個該菌的誘導(dǎo)突變體.Hohenlohe等人利用RAD-seq技術(shù)對三刺魚的自然群體間核苷酸的差異進(jìn)行了基因組范圍的掃描.對來自2個海洋和3個淡水群體的100個個體,進(jìn)行RAD-seq分析,每個個體鑒定和分類出45000多個SNPs.該工作全面地對三刺魚群體間遺傳差異進(jìn)行了評估并確定了生物地理假說,表明棘魚中重復(fù)出現(xiàn)的平行類似的表型進(jìn)化,可能源自全基因組范圍內(nèi)自始至終廣泛并行發(fā)生著的遺傳進(jìn)化.一些此類基因組區(qū)域與先前實(shí)驗(yàn)室的作圖群體鑒定出來的棘魚表型差異的QTLs共定位,確認(rèn)了先前鑒定出來的適應(yīng)性相關(guān)的基因組區(qū)域.Emerson等人利用RAD-seq技術(shù)對瓶蚊草(Wyeomyiasmithii)進(jìn)行測序分析,揭示了瓶草蚊(起源于22000年到19000年前勞倫冰蓋衰退期間的阿巴拉契亞山脈南部)的遺傳結(jié)構(gòu)和進(jìn)化演變方向.該工作證實(shí)RAD-seq技術(shù)可用于確定一個物種的近期分化群體的系統(tǒng)發(fā)生關(guān)系.Baxter等人對小菜蛾(Plutellaxylostella)回交系進(jìn)行了RAD-seq分析,成功構(gòu)建了小菜娥的遺傳連鎖圖譜,并完成了小菜蛾和家蠶染色體的比較基因組學(xué)分析.Chutimanitsakun等人利用RAD-seq技術(shù)對93株大麥(Hordeumvulgare)DH(雙單倍體)作圖群體進(jìn)行研究,獲得530個SNPs,應(yīng)用其中的445個SNPs,結(jié)合之前的標(biāo)記構(gòu)建了大麥連鎖圖譜,并對生殖適度形狀進(jìn)行了QTL定位分析.Pfender等人對一個黑麥草(Loliumperenne)F1群體的193個體進(jìn)行RAD-seq,并結(jié)合SSRs和STSs分子標(biāo)記,利用雙假測交原理進(jìn)行連鎖分析,構(gòu)建了遺傳連鎖圖譜并檢測到3個黑麥草抗桿銹病QTLs.4高通量測序分析轉(zhuǎn)錄組測序,又稱RNA-seq或mRNA-seq,即從總RNA中富集出單鏈mRNA經(jīng)反轉(zhuǎn)錄得到雙鏈cDNA,而后對其進(jìn)行高通量測序分析(圖3).在已完成基因組測序的物種中,可將RNA-seq結(jié)果與基因組DNA序列數(shù)據(jù)進(jìn)行對比,從而得到基因表達(dá)、可變剪切、基因結(jié)構(gòu)優(yōu)化、新基因發(fā)現(xiàn)等分析結(jié)果.對于沒有參考基因組的物種,可以進(jìn)行denovo轉(zhuǎn)錄組測序研究,即對所得到測序讀長片段進(jìn)行denovo組裝,進(jìn)而得到該物種的單一基因序列集(unigenes)數(shù)據(jù).4.1轉(zhuǎn)錄組特征及聚類分析Zhang等人以水稻9311的愈傷組織、根尖、莖尖、葉、稻花/稻穗為材料,進(jìn)行轉(zhuǎn)錄組測序,展示了栽培水稻不同器官的轉(zhuǎn)錄組圖譜.采用高通量雙末端測序,檢測到了7232個新轉(zhuǎn)錄本,這些轉(zhuǎn)錄本表達(dá)豐度低,且具有組織特異性.共發(fā)現(xiàn)了23800個可變剪接,這些可變剪切事件發(fā)生在水稻33%的基因中.同時發(fā)現(xiàn)1356個融合基因,鑒定了234個候選嵌合轉(zhuǎn)錄本,它們可能是由反式剪切產(chǎn)生地,這表明轉(zhuǎn)錄融合事件比預(yù)期地更常見.這些數(shù)據(jù)為研究遠(yuǎn)比預(yù)期復(fù)雜的水稻轉(zhuǎn)錄調(diào)節(jié)機(jī)制提供了廣泛的依據(jù).Li等人使用高通量測序分析了玉米葉片的轉(zhuǎn)錄組.作者將玉米B73小苗的第3葉分為4個發(fā)育梯度部分(葉基區(qū)、過渡區(qū)、正在成熟區(qū)和成熟區(qū)),并從葉尖中分離出維管束鞘細(xì)胞群和葉肉細(xì)胞群,共對6個樣品進(jìn)行轉(zhuǎn)錄組測序分析.得到約120M的序列讀長去界定基因的結(jié)構(gòu)和可變剪接事件,并且在不同發(fā)育梯度的葉片中及在成熟葉片的維管束鞘和葉肉細(xì)胞中進(jìn)行轉(zhuǎn)錄本豐度的定量分析.檢測到大部分基因存在不同的mRNA加工事件,發(fā)現(xiàn)在葉片不同發(fā)育梯度中有64%的基因呈現(xiàn)差異表達(dá),而21%的基因在維管束與葉肉細(xì)胞中表達(dá)量不同.對數(shù)據(jù)聚類分析發(fā)現(xiàn)從葉基部的初生細(xì)胞壁、基本細(xì)胞代謝到過渡到葉尖的次級細(xì)胞壁生物合成、C4植物光合作用的發(fā)育的轉(zhuǎn)錄組呈現(xiàn)動態(tài)變化狀態(tài).這些工作通過對處于不同發(fā)育狀態(tài)的4個區(qū)域進(jìn)行研究,產(chǎn)生了一個高分辨率和高準(zhǔn)確性的轉(zhuǎn)錄本圖譜,建立了一個可整合生理和代謝數(shù)據(jù)集的系統(tǒng)框架,為今后開展光合作用發(fā)育相關(guān)研究提供了基礎(chǔ).4.2deol-4和deol-4和deol-4,8,7,10.Graham等人利用Roche/454測序平臺對青蒿(Artemisiaannua)的轉(zhuǎn)錄組進(jìn)行了測序分析,快速找出了大量的SNPs(1個SNP/104bp),從中選取1536個SNPs,結(jié)合其他已有marker用于遺傳連鎖圖譜的構(gòu)建.所用的2個親本品種C4與C1是兩個高度雜合且基因型差異很大的青蒿品種,構(gòu)建了F1群體.Graham使用了242個F1個體的數(shù)據(jù)對2個親本分別構(gòu)建了遺傳圖.將表型數(shù)據(jù)如青蒿素濃度、葉面積、表皮毛狀體密度、以及植株鮮重等與基因型數(shù)據(jù)相關(guān)聯(lián),找到了7個QTLs位點(diǎn).其中與青蒿素產(chǎn)量相關(guān)聯(lián)的QTLs有3個,LG1與LG9上的QTL與青蒿素產(chǎn)量正相關(guān),LG4上的QTL與青蒿素產(chǎn)量負(fù)相關(guān).這一研究結(jié)果可以有幫助于今后對青蒿進(jìn)行分子標(biāo)記輔助選育青蒿素高產(chǎn)品種.Wang等人對甘薯(Ipomoeabatatas)的塊狀根進(jìn)行高通量轉(zhuǎn)錄組測序,通過illumina雙末端測序技術(shù)產(chǎn)出了超過59M的序列.Denovo組裝出56516條單一基因序列(unigenes),平均長度為581bp.基于與已知蛋白的序列相似性搜索,總計有35051個基因被鑒定出來.KEGG分析有11056個是屬于代謝途徑,尤其以碳水化合物代謝和次生代謝物質(zhì)生物合成途徑最突出.此外,從單一基因序列集中開發(fā)出的4114個cDNASSRs(cSSRs)候選分子標(biāo)記可以豐富甘薯的分子標(biāo)記和有助于將來的分子標(biāo)記輔助育種.Chen等人報道了飛蝗(Brugiamalayi)的轉(zhuǎn)錄組情況,對測序得到的21.5Gb的測序序列進(jìn)行了組裝,得到了72977條轉(zhuǎn)錄本(N50,2275bp),并鑒定了11490個蝗蟲蛋白編碼基因,全面發(fā)現(xiàn)了具有代表性的核心基因集.與其他8種已測序昆蟲進(jìn)行比較基因組學(xué)分析,從而第一次對不完全變態(tài)和完全變態(tài)的昆蟲進(jìn)行了基因組分歧的鑒定,且發(fā)現(xiàn)了18個發(fā)育相關(guān)基因.這些研究結(jié)果表明基于高通量測序的denovo轉(zhuǎn)錄組分析可在非模式動植物物種,特別是在基因組大且復(fù)雜的物種中,有效地用于新基因的發(fā)現(xiàn)和新分子標(biāo)記的開發(fā).5差異表達(dá)標(biāo)簽的檢測數(shù)字基因表達(dá)譜(digitalgeneexpression,DGE)技術(shù)的基本原理(圖4)是利用對mRNAs經(jīng)反轉(zhuǎn)錄所得cDNAs進(jìn)行雙酶切,使得一條mRNA得到一個相對應(yīng)的標(biāo)簽,而后進(jìn)入高通量測序和分析流程,經(jīng)過生物信息均一化后比較不同樣本間各種標(biāo)簽條數(shù),找出差異表達(dá)標(biāo)簽.早在1995年誕生的基因表達(dá)系列分析(serialanalysisofgeneexpression,SAGE)技術(shù),是將酶切產(chǎn)生的標(biāo)簽,用連接酶進(jìn)行連接后,進(jìn)行Sanger測序;而基于高通量測序的DGE技術(shù),是對標(biāo)簽直接進(jìn)行測序,故而DGE又被稱為DeepSAGE.DGE得到的差異表達(dá)的標(biāo)簽,需要與數(shù)據(jù)庫進(jìn)行對比,才可以得到基因的差異表達(dá)結(jié)果,所以在具有參考基因組的物種和一些沒有參考基因組但有單一基因序列集數(shù)據(jù)庫的物種中,可以直接進(jìn)行DGE的應(yīng)用,而在既沒有參考基因組又沒有單一基因序列集數(shù)據(jù)庫的物種中,需要先采用RNA-seq技術(shù)構(gòu)建一個本物種的單一基因序列集數(shù)據(jù)庫,用作DGE所得標(biāo)簽的對比參考數(shù)據(jù)庫.5.1抗炎性植物抗炎Xiao等人第一次應(yīng)用DGE技術(shù)研究了宿主家豬(Susscrofa)在感染N-PRRSV(經(jīng)典北美型PRRSV)CH1a株病毒后轉(zhuǎn)錄水平做出的響應(yīng).該工作共取9頭6周大的健康小豬,3頭豬為對照,在感染實(shí)驗(yàn)前一天殺掉取肺;6頭豬感染病毒,分別在感染后第3天和第7天,各殺3頭豬取肺.每3頭豬混合提取RNA,進(jìn)行DGE實(shí)驗(yàn).研究發(fā)現(xiàn)受病毒誘導(dǎo)而上調(diào)表達(dá)的早期炎癥相關(guān)細(xì)胞因子、趨化因子、黏附分子、發(fā)炎相關(guān)酶蛋白、發(fā)炎細(xì)胞、抗體以及補(bǔ)體激活等等很可能導(dǎo)致了N-PRRSV感染過程中發(fā)炎響應(yīng)的發(fā)展發(fā)生.而N-PRRSV誘導(dǎo)的免疫抑制則可能介導(dǎo)了感染細(xì)胞的凋亡,這導(dǎo)致了免疫細(xì)胞的損耗,也誘導(dǎo)了抗炎細(xì)胞因子反應(yīng)從而不能有效消除初期病毒感染.Wang等人利用DGE技術(shù)分析了野生型棉花(Gossypiumhirsutum)Xuzhou142和它的flM(fuzzless/lintless)突變體的胚珠纖維起始階段和纖維伸長階段的表達(dá)譜.在開花期當(dāng)天對花做標(biāo)記,收獲-2到8DPA(開花期后天數(shù))的棉花胚珠,剝離的棉花胚珠液氮速凍后-80℃保存.從-2,-1,0,1,2,3,5和8DPA的野生型和突變體的棉花胚珠中提取總RNA.-2,-1,0和1DPA的總RNA混合作為stageⅠ(纖維起始)的樣品,野生型和突變體的分別標(biāo)記為WT1和M1;2,3,5和8DPA的總RNA混合作為stageⅡ(纖維伸長)的樣品,野生型和突變體分別標(biāo)記為WT2和M2.分別對WT1,M1,WT2和M2進(jìn)行DGE建庫測序,發(fā)現(xiàn)野生型和突變體之間表達(dá)差異水平最大的20個基因是纖維素合成酶基因、磷酸(脂)酶基因和脫氫酶基因,這些基因都參與了纖維細(xì)胞的發(fā)育進(jìn)程,從而證實(shí)了纖維早期發(fā)育中基因轉(zhuǎn)錄的高度復(fù)雜性.Wu等人使用DGE研究了葡萄(Vitisamurensis)葉片受霜霉病病原菌(Plasmoparaviticola)感染前后基因差異表達(dá)情況.該工作分別對PV感染葡萄葉片和照葉片進(jìn)行DGE測序.研究發(fā)現(xiàn)513個基因和167個基因分別在感染葉片中上調(diào)和下調(diào)表達(dá)超過5倍.KEGG富集分析發(fā)現(xiàn),差異表達(dá)基因與核糖體結(jié)構(gòu)、光合作用、氨基酸和糖代謝等代謝通路相關(guān).5.2轉(zhuǎn)錄組特征分析Wang等人從煙粉虱(Bemisiatabaci)卵與幼蟲混合樣本、蛹和成蟲中分別進(jìn)行RNA的提取,將3份RNA樣本混合后,進(jìn)行了3G數(shù)據(jù)量的RNA-seq;同時對3份RNA分別進(jìn)行DGE測序.RNA-seq所得43M條測序讀長,組裝成168900個單一基因序列(平均長度為266bp),是此前在GenBank數(shù)據(jù)庫中登錄注冊的煙粉虱的全部序列的10倍多.通過與已知蛋白的相似性搜索,27290條序列被鑒定出來.調(diào)查了白粉虱整個發(fā)育過程中轉(zhuǎn)錄組的變化情況.而DGE實(shí)驗(yàn)中,對每個樣本測序得到多于2.5M的標(biāo)簽,調(diào)查了白粉虱整個發(fā)育過程中轉(zhuǎn)錄組的變化情況,鑒定出來一大批特異發(fā)育時期和抗殺蟲劑相關(guān)基因.Mu等人用RNA-seq和DGE分析了大黃魚(Pseudosciaenacrocea)受嗜水氣單胞菌攻擊前后的轉(zhuǎn)錄組譜.對感染后大黃魚進(jìn)行轉(zhuǎn)錄組測序,經(jīng)在NCBI數(shù)據(jù)庫中注釋分析后,得到了8216條鑒定的單一基因序列.使用DGE技術(shù),對遭受嗜水氣單胞菌感染的大黃魚和對照大黃魚對比分析發(fā)現(xiàn),1996個基因呈現(xiàn)差異表達(dá),其中有727個上調(diào)表達(dá)的基因和489個下調(diào)表達(dá)的基因差異在1.5倍以上,而差異變化倍數(shù)較大的基因多是炎性反應(yīng)相關(guān)基因.Hao等人對紅豆杉(Taxusmairei)轉(zhuǎn)錄組進(jìn)行了denovo測序組裝,基于同已知蛋白的相似性搜索,23515個單一基因序列被鑒定;使用DGE調(diào)查了紅豆杉的根、莖、葉3種組織的基因差異表達(dá)情況,鑒定出一批組織特異性功能相關(guān)基因和紫杉烷生物合成途徑相關(guān)基因.同樣,Tang等人從開花后50和70d的羅漢果(Siraitiagrosvenorii)中提取RNA,等量混合后進(jìn)行轉(zhuǎn)錄組測序.組裝成43891個單一基因序列,平均長度為668bp,從這個文庫中鑒定出了所有已知參與羅漢果苷骨架合成的酶的cDNA序列.對開花3,50和70d這3個重果的果實(shí)發(fā)育時期進(jìn)行DGE分析,選出7個CYP450和5個UDP基因作為最可能參與羅漢果苷合成的候選基因.新近發(fā)展起來的RNA-seq和DGE技術(shù)是高通量的基因發(fā)現(xiàn)和表達(dá)分析的方法,是強(qiáng)大的可在轉(zhuǎn)錄組水平開展功能基因組學(xué)研究的工具.高通量測序可用于缺少基因組序列信息的物種中轉(zhuǎn)錄組的denovo組裝和基因表達(dá)分析.可預(yù)計出新一代測序技術(shù)在其他的非模式生物的轉(zhuǎn)錄組研究方面擁有巨大的應(yīng)用潛力.6mirnas分布情況MicoRNAs(miRNAs)是一類內(nèi)源小分子RNAs,通常在轉(zhuǎn)錄后水平負(fù)調(diào)節(jié)基因表達(dá)來發(fā)揮作用,控制了多種生物和代謝途徑中眾多基因的表達(dá),在植物生長和發(fā)育中扮演著重要角色.以檢測miRNAs為主要目的的小RNAs測序技術(shù)現(xiàn)已經(jīng)普遍被用于動植物表觀遺傳學(xué)研究.Wei等人對飛蝗進(jìn)行了小RNAs測序.通過與miRBase數(shù)據(jù)庫比對鑒定出50個保守的miRNA家族,并在沒有飛蝗參考基因組序列的情況下,通過生物信息分析技術(shù)發(fā)現(xiàn)了185個飛蝗特有的miRNAs家族.對飛蝗miRNAs的進(jìn)化分析表明miRNAs的產(chǎn)生主要集中在生物進(jìn)化過程的3個階段,無脊椎動物、體腔動物、蟲類.此外還發(fā)現(xiàn)了一些轉(zhuǎn)座子來源的內(nèi)源小RNAs和piRNAs,也調(diào)控了很多基因的表達(dá).對獨(dú)居型和群居型2個生活型態(tài)飛蝗的小RNAs的表達(dá)情況進(jìn)行分析,獨(dú)居型飛蝗的小RNAs表達(dá)更為豐富,找出了在兩型飛蝗中差異表達(dá)的小RNAs,并繪制出2個不同生活型態(tài)的小RNAs表達(dá)譜.Li等人采用高通量測序與計算分析相結(jié)合的方法,調(diào)查了正常條件下和過氧化氫氧化脅迫處理條件下水稻幼苗的miRNAs組.通過miRNAomes和Northernblot的分析比較,確定在氧化脅迫條件下有7個miRNAs家族呈現(xiàn)顯著的差異表達(dá).這些過氧化氫響應(yīng)的miRNAs的靶基因參與了不同的細(xì)胞反應(yīng)和代謝過程,包括轉(zhuǎn)錄調(diào)控、養(yǎng)分運(yùn)輸、生長素的動態(tài)平衡、細(xì)胞增殖和細(xì)胞程序化死亡,表明多樣化的miRNAs形成一個復(fù)雜的植物氧化應(yīng)激反應(yīng)調(diào)控網(wǎng)絡(luò).此外,在水稻幼苗中還發(fā)現(xiàn)了32個新的miRNAs,有趣的是,首次發(fā)現(xiàn)了一個植物外顯子小RNA,miR3981,其前體位于基因AK106348的最后一個外顯子中,這表明植物也可以使用一些外顯子作為一個miRNA的來源.Kwak等人分別構(gòu)建了野生型棉花Xuzhou142和它的flM突變體的胚珠小RNA文庫,并進(jìn)行高通量測序,111個保守的miRNAs被鑒定出來,此外,還鑒定出2個新的細(xì)胞特異性的候選miRNAs.研究證實(shí)了野生型棉花與fl突變體中miRNAs的表達(dá)豐度存在差異,暗示這些差異表達(dá)的miRNAs在棉花纖維發(fā)育過程中發(fā)揮調(diào)節(jié)轉(zhuǎn)錄的作用.Wang等人構(gòu)建了一個來自浸水24h后玉米種子的小RNAs文庫并使用Solexa技術(shù)對其進(jìn)行了測序分析,發(fā)現(xiàn)了115個已知玉米miRNAs和167個新的miRNAs.已知miRNAs和新發(fā)現(xiàn)miRNAs的信息被生物學(xué)重復(fù)實(shí)驗(yàn)所證實(shí).本研究成功鑒定出的新miRNAs,大大豐富了玉米miRNAs數(shù)據(jù)庫.近年來科研工作者也分別將小RNAs測序技術(shù)用于多種動植物物種,普查了許多動植物,如花生(Arachishypogaea),小麥(Triticumaestivum),地黃(Rehmanniaglutinosa),柑橘(Citrustrifoliata)和紫菜(Porphyrayezoensis),家雞,家豬,褐牙鲆(Paralichthysolivaceus),松材線蟲(Bursaphelenchusxylophilus),肝吸蟲(Clonorchissinensis),旋毛蟲(Trichinellaspiralis),海膽(Strongylocentrotusnudus)等物種的miRNAs表達(dá)譜,或者研究了這些物種在不同發(fā)育時期、不同脅迫處理等條件下體內(nèi)miRNAs的差異表達(dá)情況.7高通量測序測定鑒定miRNAs作用的靶標(biāo)mRNAs是對其功能開展研究的必要內(nèi)容之一,傳統(tǒng)的鑒定方法主要是依賴于生物信息學(xué)方法預(yù)測及隨后對預(yù)測結(jié)果進(jìn)行的實(shí)驗(yàn)驗(yàn)證.隨著高通量測序技術(shù)的問世,現(xiàn)在可以直接地對miRNAs介導(dǎo)降解mRNAs形成的3成端帶有ploy(A)的片段進(jìn)行測序,得到這種降解片段數(shù)據(jù),用于新的miRNA-mRNA配對關(guān)系的發(fā)現(xiàn),這一新方法被稱為降解組測序(degradomesequencing)(圖5).在植物體內(nèi)絕大多數(shù)的miRNAs是利用剪切作用調(diào)控靶基因的表達(dá),且剪切常發(fā)生在miRNA與mRNA互補(bǔ)區(qū)域的第10位核苷酸上.靶基因經(jīng)剪切產(chǎn)生5′剪切片段和3′剪切片段.其中3′剪切片段,含有自由的5′單磷酸和3′poly(A)尾巴,可被RNA酶連接,連接產(chǎn)物可用于下游高通量測序;而含有5′帽子結(jié)構(gòu)的完整基因,含有帽子結(jié)構(gòu)的5′剪切片段或是其他缺少5′單磷酸基團(tuán)的RNA是無法被RNA酶連接,因而無法進(jìn)入下游的測序?qū)嶒?yàn);對測序數(shù)據(jù)進(jìn)行深入地比對分析,可以直觀地發(fā)現(xiàn)在mRNA序列的某個位點(diǎn)會出現(xiàn)一個波峰(t-plots),而該處便是候選的miRNA剪切位點(diǎn).German以擬南芥的花組織(WT型和xrn4突變體)為研究對象,進(jìn)行了降解組測序,得到包括了800萬個非冗余標(biāo)簽的2.7萬個轉(zhuǎn)錄本信息,很多以前預(yù)測而未被驗(yàn)證的miRNAs靶序列在此得到了驗(yàn)證.與已驗(yàn)證的靶基因相似,大多數(shù)該研究所得miRNAs靶基因在miRNAs的剪切位點(diǎn)得到單一而豐富的標(biāo)簽,尤其是在缺少5′→3′核外切酶AtXRN4基因的xrn4突變體的文庫中.盡管擬南芥的miRNAs相關(guān)研究已有很多,該工作仍然給我們一個新的啟示,從反向思路利用降解組測序技術(shù)來對新miRNAs進(jìn)行鑒定和驗(yàn)證.Zhou等人報道了在水稻中通過使用降解組測序來鑒定miRNAs靶基因的研究.從粳稻93-11的4~6cm長的幼嫩花序中,鑒定出屬于87個miRNAs靶基因的177個轉(zhuǎn)錄本.在擬南芥和水稻中保守的miRNAs的靶基因中,轉(zhuǎn)錄因子基因占到70%(58/82),這表明,這些miRNAs在水稻的基因調(diào)節(jié)結(jié)點(diǎn)中發(fā)揮主要作用.而非保守的miRNAs則調(diào)節(jié)了影響著更復(fù)雜調(diào)節(jié)網(wǎng)絡(luò)的眾多多樣的靶基因.作為一種技術(shù)創(chuàng)新,降解組測序直接對miRNAs形成的mRNA的3′端降解片段進(jìn)行高通量測序,來尋找miRNAs作用的靶基因.該技術(shù)可廣泛應(yīng)用于植物突變體、不同組織、脅迫條件、不同基因型及不同的植物物種中,產(chǎn)生大量有價值的數(shù)據(jù),用于分析miRNAs的生物學(xué)功能、特異性調(diào)控,甚至是小RNAs、miRNAs和靶mRNAs的進(jìn)化.在動物中,miRNAs作用靶基因以翻譯抑制為主,但是也有一些miRNAs引起靶基因的剪切,用本方法可以在動物中發(fā)現(xiàn)這些稀少但重要的mRNAs剪切事件.8家蠶甲基化譜表觀遺傳學(xué)改變是指基于非基因序列改變所致基因表達(dá)水平變化,如DNA甲基化和組蛋白修飾等;表觀基因組學(xué)則是在基因組水平上對表觀遺傳學(xué)改變的研究.DNA甲基化、組蛋白修飾是表觀基因組學(xué)的重要研究內(nèi)容.亞硫酸氫鹽修飾結(jié)合測序法(bisulfitesequencing)是由Frommer等人提出的研究DNA甲基化方法,原理是亞硫酸氫鹽使基因組中未發(fā)生甲基化的胞嘧啶脫氨基轉(zhuǎn)變成尿嘧啶,而甲基化的胞嘧啶保持不變,然后在所研究的CpG位點(diǎn)兩側(cè)設(shè)計引物進(jìn)行PCR擴(kuò)增,對PCR產(chǎn)物進(jìn)行測序并且與未經(jīng)處理的序列比較,判斷CpG位點(diǎn)是否發(fā)生甲基化.目前,高通量測序技術(shù)應(yīng)用于甲基化測序帶來了全基因組甲基化測序(wholegenomebisulfitesequencing,WGBS)技術(shù),WGBS可以在全基因組范圍內(nèi)檢測每個CpG位點(diǎn)的甲基化狀態(tài)以及頻率,得到全基因組水平單堿基分辨率的甲基化圖譜,這推動了表觀基因組學(xué)的發(fā)展.Xiang等人對家蠶的Dazao品種(基因組序列測序完成的品種)的2個個體進(jìn)行了WGBS測序,測序量分別為5.9和9.9Gb,深度為7.4和9.0X,覆蓋了92%的基因組中的胞嘧啶(C).整合2組數(shù)據(jù),得到了家蠶絲腺甲基化圖譜,共鑒定17萬個mCs甲基化位點(diǎn),99.2%位于CG位點(diǎn),BS-PCR驗(yàn)證表明陽性率高于85.2%,大約0.11%的基因組胞嘧啶發(fā)生甲基化修飾.家蠶中,甲基化區(qū)域主要富集在基因內(nèi)部,與基因表達(dá)水平正相關(guān).而轉(zhuǎn)座元件,基因啟動區(qū)域以及rDNA區(qū)域甲基化程度很低,表明在動植物中發(fā)揮重要作用的啟動子區(qū)、核糖體rDNA區(qū)甲基化調(diào)控,以及轉(zhuǎn)座子區(qū)的甲基化抑制等,這些調(diào)控機(jī)制可能在昆蟲中沒有進(jìn)化出來.家蠶甲
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 籃球班安全協(xié)議書
- 維修店糾紛協(xié)議書
- 屋面做防水協(xié)議書
- 購買宅基地協(xié)議書
- 學(xué)校寒假看協(xié)議書
- 有小孩退婚協(xié)議書
- 私下購樓房協(xié)議書
- 女婿被逼簽協(xié)議書
- 解除協(xié)議收回原協(xié)議書
- 替別人賣貨協(xié)議書
- 婚禮主持人專屬新人問卷調(diào)查
- 《CAD/CAM技術(shù)基礎(chǔ)》全套教學(xué)課件
- 群藝積分制管理實(shí)施標(biāo)準(zhǔn)細(xì)則
- 業(yè)主委員會備案申請表
- 可感染人類的高致病性病原微生物菌(毒)種或樣本運(yùn)輸管理規(guī)定
- 2022年全民健康生活方式行動工作計劃
- PVDF乳液與懸浮聚合工藝
- 高三物理一輪復(fù)習(xí)策略及建議.PPT
- 光伏發(fā)電項目并網(wǎng)調(diào)試方案
- 面試考核評分表
- 地溝更換管線專項施工方案完整
評論
0/150
提交評論