




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
實(shí)驗(yàn)三:基因序列分析杜娟dujuannx@126.com基因與蛋白質(zhì)組學(xué)數(shù)據(jù)分析實(shí)驗(yàn)項(xiàng)目三:基因序列分析
一、實(shí)驗(yàn)?zāi)康暮鸵螅赫莆栈蚩勺x框的識(shí)別;掌握啟動(dòng)子區(qū)域的預(yù)測(cè)掌握CpG島的預(yù)測(cè)掌握轉(zhuǎn)錄終止信號(hào)的預(yù)測(cè)采用mRNA序列預(yù)測(cè)基因:Spidey的使用掌握各預(yù)測(cè)服務(wù)器結(jié)果的分析2原核生物基因結(jié)構(gòu)1長(zhǎng)開放閱讀框2高基因密度3簡(jiǎn)單的基因結(jié)構(gòu)4基因組中GC含量變化非常大特點(diǎn):3真核生物基因結(jié)構(gòu)特點(diǎn):1基因結(jié)構(gòu)復(fù)雜2具有復(fù)雜的基因轉(zhuǎn)錄調(diào)控方式3具有豐富的可變剪接4有明顯的CpG島、密碼子使用具有偏好性4基因組序列分析5
例:WhatisGenePrediction?
GivenanuncharacterizedDNAsequence,findout:
1.Wheredoesthegenestartsandends?
2.Whichregionscodeforaprotein?
AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCgene1gene2gene3exonintergenicregionintron678一開放讀碼框的識(shí)別開放讀碼框(openreadingframe,ORF)
是一段起始密碼子和終止密碼子之間的堿基序列ORF是潛在的蛋白質(zhì)編碼區(qū)基因預(yù)測(cè)9基因開放閱讀框/基因結(jié)構(gòu)分析識(shí)別工具Getorfhttp://bioweb.pasteur.fr/seqanal/interfaces/getorf.htmlEMBOSS通用Plotorfhttp://bioweb.pasteur.fr/seqanal/interfaces/plotorf.htmlEMBOSS通用ORFFinder/gorf/gorf.htmlNCBI通用BestORF/all.htmSoftberry真核GENSCAN/GENSCAN.htmlMIT脊椎、擬南芥、玉米GeneFinder/tools/genefinder/Zhanglab人、小鼠、擬南芥、酵母FGENESH/all.htmSoftberry真核GeneMark/GeneMark/GIT原核GLIMMER/genomes/MICROBES/glimmer_3.cgi/software/glimmer
Maryland原核FgeneSB/all.htmSoftberry細(xì)菌FgeneSV/all.htmSoftberry病毒Generation/generation/ORNL原核FGENESH+/all.htmSoftberry原核GenomeScan
/genomescan.html
MIT脊椎、擬南芥、玉米GeneWise
http://www.ebi.ac.uk/Wise2/EBI人、蠕蟲GRAIL/grailexp/ORNL人、小鼠、擬南芥、果蠅101.ORFFinder的使用及結(jié)果分析111.ORFFinder的使用及結(jié)果分析121.ORFFinder的使用及結(jié)果分析131.ORFFinder的使用及結(jié)果分析141.ORFFinder的使用及結(jié)果分析151.ORFFinder的使用及結(jié)果分析Blast比對(duì)結(jié)果搜索到多個(gè)顯著相似的序列,故所預(yù)測(cè)的ORF的可信度較高。如果要獲取該ORF所編碼的蛋白質(zhì)序列,可以點(diǎn)擊“Accept”按鈕后,在“1GenBank”的下拉框中選擇“3Fasta”,并點(diǎn)擊“view”,即可獲取該ORF所編碼的蛋白質(zhì)序列。161.ORFFinder的使用及結(jié)果分析171.ORFFinder的使用及結(jié)果分析181.ORFFinder的使用及結(jié)果分析191.ORFFinder的使用及結(jié)果分析20提交序列提交序列文件運(yùn)行GENSCAN選擇物種顯示氨基酸或CDS序列序列名稱(可選)是否顯示非最優(yōu)外顯子2.Genscan的使用及結(jié)果分析21基因、外顯子及類型正鏈、負(fù)鏈預(yù)測(cè)單元起始、終止及長(zhǎng)度相位編碼區(qū)打分值可信概率、得分值2.Genscan的結(jié)果分析22/berry.phtml?group=programs&subgroup=gfind&topic=fgenesh3.FGENESH的使用及結(jié)果分析輸入序列的Fasta文件233.FGENESH的使用及結(jié)果分析起始外顯子中間及末端外顯子PolyA位點(diǎn)起始?jí)A基終止堿基打分長(zhǎng)度243.FGENESH的使用及結(jié)果分析253.FGENESH的使用及結(jié)果分析26二.原核和真核生物基因轉(zhuǎn)錄起始位點(diǎn)上游區(qū)結(jié)構(gòu)
原核生物真核生物TTGACATATAATAmRNA+1-10-35PyAPyTATAATGC區(qū)CAAT區(qū)mRNA+1-40-25-110增強(qiáng)子上游啟動(dòng)子元件,UPE核心啟動(dòng)子元件轉(zhuǎn)錄起始位點(diǎn)27原核生物真核生物28二.啟動(dòng)子預(yù)測(cè)輸入序列的Fasta文件29啟動(dòng)子預(yù)測(cè)結(jié)果從預(yù)測(cè)結(jié)果可知,預(yù)測(cè)的啟動(dòng)子區(qū)在32564至32783之間,啟動(dòng)子閾值系統(tǒng)默認(rèn)為53.00,預(yù)測(cè)的啟動(dòng)子分值為84.69,高于閾值,分值越高,說(shuō)明預(yù)測(cè)的準(zhǔn)確性大。與該啟動(dòng)子可能結(jié)合的轉(zhuǎn)錄因子如下所示30三CpG島預(yù)測(cè)CpG島CpG島又稱為HTF島,是DNA上的一個(gè)區(qū)域,此區(qū)域富含GC,二者以磷酸酯鍵相連。位于真核生物基因轉(zhuǎn)錄起始位點(diǎn)上游,GC含>50%,長(zhǎng)度>200bpCpG島常出現(xiàn)在管家基因或頻繁表達(dá)的基因的啟動(dòng)子附近,在這些部位,CpG島具有阻止序列甲基化的作用,因此,搜索CpG島可以為基因及其啟動(dòng)子的預(yù)測(cè)提供線索。CpGIsland分析CpGIsland/cpgislands2/cpg.aspxWebCpGfinder/berry.phtml?topic=cpgfinder&group=programs&subgroup=promoterWebCpGPlot/CpGReport/Isochorehttp://www.ebi.ac.uk/emboss/cpgplot/index.htmlWeb31輸入序列的Fasta文件32從該序列的預(yù)測(cè)結(jié)果來(lái)看,找到兩個(gè)CpG島,分別位于501-727,長(zhǎng)度為227個(gè)堿基,54380-54691,長(zhǎng)度為31233四轉(zhuǎn)錄終止信號(hào)加polyA信號(hào):AAUAAA轉(zhuǎn)錄終止信號(hào):GCrich二重對(duì)稱區(qū)、UUUUUUC-GC-GG-CG-CU-AG-CG-CC-GG-CUUUUUUUUURNA5’3’AAUAAACAAAAAAAAAAAAA成熟mRNA5’3’AAUAAACAGUmRNA前體5’3’3435轉(zhuǎn)錄終止信號(hào)預(yù)測(cè)Hcpolyar.it/~webgene/wwwHC_polya.htmlWebPOLYAH/berry.phtml?topic=polyah&group=programs&subgroup=promoterWebpolyadq/tools/polyadq/polyadq_form.htmlWeb36POLYAH的使用及結(jié)果分析輸入序列的Fasta文件37POLYAH的使用及結(jié)果分析預(yù)測(cè)的POLYA位點(diǎn),LDF為權(quán)重38內(nèi)含子/外顯子剪切位點(diǎn)識(shí)別對(duì)基因組序列的讀碼框區(qū)域進(jìn)行預(yù)測(cè)內(nèi)含子5’端供體位點(diǎn)(donorsplicesite):GT內(nèi)含子3’端受體位點(diǎn)(acceptorsplicesite):AG預(yù)測(cè)工具:GENSCAN,GENEMARKNetGene2,SpliceView39mRNA剪切位點(diǎn)識(shí)別:spidey40NCBI開發(fā)的在線預(yù)測(cè)程序用于mRNA序列同基因組序列比對(duì)分析/IEB/Research/Ostell/Spidey/index.html4142序列在線提交形式:界面中有兩個(gè)窗口:上方窗口用于輸入基因組序列(直接粘貼序列或用GenbankID/AC號(hào))下方窗口用于輸入cDNA/mRNA序列(直接粘貼序列或用GenbankID/AC號(hào))可同時(shí)輸入多條cDNA/mRNA序列與同一條基因組序列進(jìn)行分析Spidey序列提交頁(yè)面輸入基因組序列或序列數(shù)據(jù)庫(kù)號(hào)AC002390.143輸入相似mRNA序列判斷用于分析的序列間的差異,并調(diào)整比對(duì)參數(shù)不受默認(rèn)內(nèi)含子長(zhǎng)度限制,默認(rèn)長(zhǎng)度:內(nèi)部?jī)?nèi)含子為35kb,末端內(nèi)含子為100kb輸出格式比對(duì)閾值選擇物種44第一條藍(lán)色序列為基因組序列,橘黃色為外顯子45外顯子對(duì)應(yīng)于基因組上的起始/結(jié)束位置外顯子對(duì)應(yīng)于mRNA/cDNA上的起始/結(jié)束位置供體、受體位點(diǎn)外顯子序號(hào)外顯子長(zhǎng)度一致性百分比錯(cuò)配和gap46序列聯(lián)配結(jié)果47使用NCBIORFFinder識(shí)別檢索號(hào)為L(zhǎng)03845的可讀框。寫下擬南芥phyA序列最長(zhǎng)的ORF的起止區(qū)間,并粘貼此ORF編碼的蛋白質(zhì)序列的Fasta文件使用Genscan對(duì)檢索號(hào)為D17291的序列進(jìn)行基因預(yù)測(cè),標(biāo)出外顯子區(qū)和PolyA位點(diǎn),用FGENESH對(duì)該序列進(jìn)行預(yù)測(cè),寫出預(yù)測(cè)為外顯子的序列區(qū)間。并比較兩個(gè)服務(wù)器預(yù)測(cè)的結(jié)果是否一致,寫出二者都預(yù)測(cè)為外顯子的區(qū)段。作業(yè)48使用CpG
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 影視文學(xué)考試試題及答案
- 青島地鐵考試試題及答案
- 石墩子公務(wù)員考試題目及答案
- 農(nóng)業(yè)創(chuàng)新考試試題及答案
- 財(cái)務(wù)分析考試試題及答案
- 婦保全科考試試題及答案
- 2025-2030中國(guó)動(dòng)物用益生菌成分行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 2025年地理高考復(fù)習(xí) 微專題 地貌演化過(guò)程(講義)(原卷版)
- 2025英大傳媒投資集團(tuán)有限公司高校畢業(yè)生招聘約5人(第二批)筆試參考題庫(kù)附帶答案詳解
- 2025遼寧沈陽(yáng)盛京資產(chǎn)管理集團(tuán)有限公司所屬子公司沈陽(yáng)盛京私募基金管理有限公司招聘2人筆試參考題庫(kù)附帶答案詳解
- 鐵碳合金的相圖解讀
- 2023年復(fù)旦大學(xué)博士研究生入學(xué)考試專家推薦信模板
- 中小學(xué)教師資格證面試課件講義
- 全國(guó)初中英語(yǔ)優(yōu)質(zhì)課大賽一等獎(jiǎng)《八年級(jí)Unit 6An old man》說(shuō)課課件
- 云南省飲用水生產(chǎn)企業(yè)名錄534家
- 湖北地區(qū)醫(yī)院詳細(xì)名單一覽表
- 麥肯錫入職培訓(xùn)第一課:讓職場(chǎng)新人一生受用的邏輯思考力新員工培訓(xùn)教材
- 蘇霍姆林斯基教育思想-PPT課件
- 脊髓損傷康復(fù)評(píng)定治療PPT課件
- 金屬壓鑄機(jī)的plc控制
- 進(jìn)制轉(zhuǎn)換(課堂PPT)
評(píng)論
0/150
提交評(píng)論