




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
蛋白質(zhì)序列分析教材Page
84~96蛋白質(zhì)序列分析教材Page
138~152生物大分子結(jié)構(gòu)數(shù)據(jù)的瀏覽(RasMol軟件)教材Page
175~184蛋白質(zhì)結(jié)構(gòu)的同源模建下次課上機(jī)實(shí)習(xí)第一頁,共196頁。蛋白質(zhì)序列分析的主要內(nèi)容蛋白質(zhì)序列檢索蛋白質(zhì)序列比對蛋白質(zhì)基本性質(zhì)分析蛋白質(zhì)功能預(yù)測蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)分子進(jìn)化分析蛋白質(zhì)分子設(shè)計(比如藥物設(shè)計)蛋白質(zhì)組學(xué)分析數(shù)據(jù)庫
+
軟件第二頁,共196頁。蛋白質(zhì)序列分析1、蛋白質(zhì)序列檢索
2、蛋白質(zhì)序列比對3、蛋白質(zhì)基本性質(zhì)分析4、蛋白質(zhì)功能預(yù)測5、蛋白質(zhì)結(jié)構(gòu)預(yù)測第三頁,共196頁。(一)、蛋白質(zhì)序列檢索蛋白質(zhì)序列分析舉例:家蠅抗菌肽(antimicrobialpeptide)研究假設(shè)核酸序列檢索沒有發(fā)現(xiàn)家蠅defensin的編碼序列。
由于家蠅屬于雙翅目(Diptera)昆蟲,我們可以通過NCBI的蛋白質(zhì)序列檢索,尋找多種昆蟲防御素的氨基酸序列,尤其是雙翅目昆蟲防御素的氨基酸序列。然后進(jìn)行氨基酸序列的多序列比對,找出昆蟲防御素的保守區(qū)域,根據(jù)保守氨基酸序列,設(shè)計簡并引物,然后嘗試從家蠅總RNA中反轉(zhuǎn)錄(RT-PCR)擴(kuò)增目的基因片段。第四頁,共196頁。Proteindefensin
diptera第五頁,共196頁。All:242點(diǎn)擊索引號的鏈接便可得到相關(guān)的蛋白序列,比如我從中選取了十條(按蚊、伊蚊、果蠅等)。第六頁,共196頁。蛋白質(zhì)序列分析1、蛋白質(zhì)序列檢索2、蛋白質(zhì)序列比對3、蛋白質(zhì)基本性質(zhì)分析4、蛋白質(zhì)功能預(yù)測5、蛋白質(zhì)結(jié)構(gòu)預(yù)測第七頁,共196頁。(二)、蛋白質(zhì)序列比對昆蟲(雙翅目)防御素多序列比對接下來,我們利用綜合性序列分析軟件(比如DNAMAN)對這10條昆蟲defensin序列進(jìn)行多序列比對,找出它們的保守氨基酸序列。第八頁,共196頁。多序列比對第九頁,共196頁。文件文件夾通道第十頁,共196頁。第十一頁,共196頁。第十二頁,共196頁。第十三頁,共196頁。第十四頁,共196頁。第十五頁,共196頁。多序列比對結(jié)果第十六頁,共196頁。第十七頁,共196頁。KRATCDKAVCVC昆蟲防御素的保守區(qū)域第十八頁,共196頁。(二)、蛋白質(zhì)序列比對至此,通過昆蟲defensin序列的多序列比對,我們找出了它們的保守氨基酸序列。下一步,我們可以根據(jù)昆蟲defensin保守氨基酸序列設(shè)計簡并引物。即,根據(jù)KRATCD序列設(shè)計上游引物,根據(jù)KAVCVC序列設(shè)計下游引物。第十九頁,共196頁。蛋白質(zhì)序列分析1、蛋白質(zhì)序列檢索2、蛋白質(zhì)序列比對
3、蛋白質(zhì)基本性質(zhì)分析4、蛋白質(zhì)功能預(yù)測5、蛋白質(zhì)結(jié)構(gòu)預(yù)測第二十頁,共196頁。(三)、蛋白質(zhì)基本性質(zhì)分析蛋白質(zhì)序列的基本性質(zhì)分析是蛋白質(zhì)序列分析的基本方面,一般包括:蛋白質(zhì)的氨基酸組成分子量等電點(diǎn)(pI)親疏水性分析跨膜區(qū)分析信號肽分析第二十一頁,共196頁。(三)、蛋白質(zhì)基本性質(zhì)分析假如,我們根據(jù)家蠅defensin基因cDNA序列設(shè)計一對特異引物,已經(jīng)成功地從家蠅總RNA中反轉(zhuǎn)錄PCR擴(kuò)增出目的基因片段并測序。下一步,我們不僅要對我們獲得的defensin核酸序列進(jìn)行生物信息學(xué)分析。也要對其推導(dǎo)的氨基酸序列進(jìn)行分析。第二十二頁,共196頁。(三)、蛋白質(zhì)基本性質(zhì)分析蛋白質(zhì)序列的基本性質(zhì)分析是蛋白質(zhì)序列分析的基本方面,一般包括:蛋白質(zhì)的氨基酸組成分子量等電點(diǎn)(pI)親疏水性分析跨膜區(qū)分析信號肽分析第二十三頁,共196頁。1、氨基酸組成、分子量、等電點(diǎn)等基本理化性質(zhì)假如我們測序得到一條家蠅defensin核酸序列。首先,我們通過NCBI的ORFFinder來確認(rèn)一下它的蛋白編碼區(qū)以及它所編碼的氨基酸序列。然后對這個理論推導(dǎo)的家蠅defensin氨基酸序列進(jìn)行分析。第二十四頁,共196頁。利用NCBI的ORFFinder來查找ORFAllResources(A-Z)第二十五頁,共196頁。第二十六頁,共196頁。ORFFinder第二十七頁,共196頁。家蠅defensincDNA序列Geneticcodes選項(xiàng):默認(rèn)為Standard另提供15種物種及線粒體的密碼子第二十八頁,共196頁。BLAST找到4個ORF其中最長的ORF為282bp(1~281)第二十九頁,共196頁。MKYFTIVAVFLAVAVCYISQSSASPAPNEEANFVHGADALKQLEPELHGRYKRATCDLLSGTGVGHSACAAHCLLRGNRGGYCNGKGVCVCRN第三十頁,共196頁。1、氨基酸組成、分子量、等電點(diǎn)等基本理化性質(zhì)可以利用綜合性序列分析軟件(如DNAMAN)來分析蛋白質(zhì)的基本理化性質(zhì)。另外也有許多在線程序可資利用。第三十一頁,共196頁。載入上述93aa的家蠅defensin氨基酸序列序列組分屬性第三十二頁,共196頁。MW=9844.4PredictedpI=8.29氨基酸組成列表第三十三頁,共196頁。1、氨基酸組成、分子量、等電點(diǎn)等基本理化性質(zhì)除了利用綜合性序列分析軟件(DNAMAN)來分析蛋白質(zhì)的基本理化性質(zhì)外,還有許多在線程序可資利用。以下我們重點(diǎn)介紹ExPASy(ExpertProteinAnalysisSystem,蛋白質(zhì)專家分析系統(tǒng))。ExPASy由瑞士生物信息學(xué)研究所(SwissInstituteofBioinformatics
,SIB)維護(hù),是研究蛋白質(zhì)的首選網(wǎng)站。第三十四頁,共196頁。第三十五頁,共196頁。第三十六頁,共196頁。第三十七頁,共196頁。Primarystructureanalysis(一級結(jié)構(gòu)分析)第三十八頁,共196頁。ComputepI/Mw計算理論等電點(diǎn)和分子量第三十九頁,共196頁。第四十頁,共196頁。復(fù)制粘貼上述93aa的家蠅defensin氨基酸序列第四十一頁,共196頁。TheoreticalpI/Mw8.53/9846.29第四十二頁,共196頁。MW=9844.4PredictedpI=8.29氨基酸組成列表!不同程序預(yù)測的結(jié)果有差別第四十三頁,共196頁。ProtParam計算蛋白質(zhì)理化參數(shù)常用的工具第四十四頁,共196頁。第四十五頁,共196頁。TheoreticalpI/Mw8.53/9846.2第四十六頁,共196頁。酸性氨基酸:6堿性氨基酸:9消光系數(shù)第四十七頁,共196頁。預(yù)測半衰期不穩(wěn)定系數(shù)不穩(wěn)定系數(shù)小于40時,表示該蛋白在試驗(yàn)中比較穩(wěn)定。第四十八頁,共196頁。(三)、蛋白質(zhì)基本性質(zhì)分析蛋白質(zhì)序列的基本性質(zhì)分析是蛋白質(zhì)序列分析的基本方面,一般包括:蛋白質(zhì)的氨基酸組成分子量等電點(diǎn)(pI)親疏水性分析跨膜區(qū)分析信號肽分析第四十九頁,共196頁。2、親疏水性分析蛋白質(zhì)親疏水性氨基酸的組成是蛋白質(zhì)折疊的主要驅(qū)動力。蛋白質(zhì)折疊時會形成疏水內(nèi)核和親水表面,而跨膜區(qū)多由疏水性氨基酸組成。可利用綜合性序列分析軟件(如DNAMAN)或ExPASy上的ProtScale來分析蛋白質(zhì)的親疏水性。第五十頁,共196頁。疏水性輪廓第五十一頁,共196頁。2~18區(qū)域,有一典型的疏水性區(qū)域第五十二頁,共196頁。Primarystructureanalysis(一級結(jié)構(gòu)分析)第五十三頁,共196頁。ProtScale程序蛋白質(zhì)疏水性分析第五十四頁,共196頁。第五十五頁,共196頁。第五十六頁,共196頁。5~20區(qū)域,有一典型的疏水性區(qū)域>0表示疏水性,<0表示親水性第五十七頁,共196頁。2~18區(qū)域,有一典型的疏水性區(qū)域第五十八頁,共196頁。(三)、蛋白質(zhì)基本性質(zhì)分析蛋白質(zhì)序列的基本性質(zhì)分析是蛋白質(zhì)序列分析的基本方面,一般包括:蛋白質(zhì)的氨基酸組成分子量等電點(diǎn)(pI)親疏水性分析跨膜區(qū)分析信號肽分析第五十九頁,共196頁。3、跨膜區(qū)分析跨膜區(qū)多由疏水性氨基酸組成,但預(yù)測得到的疏水區(qū)不一定就是跨膜區(qū)。蛋白質(zhì)序列含有跨膜區(qū)提示它可能作為膜受體起作用,也可能是定位于膜的錨定蛋白或者離子通道蛋白等。第六十頁,共196頁。3、跨膜區(qū)分析以下介紹ExPASy上的相關(guān)資源:TMHMM(跨膜區(qū)分析)TMpred(跨膜區(qū)分析)第六十一頁,共196頁。Topologyprediction(拓?fù)鋵W(xué)預(yù)測)第六十二頁,共196頁。跨膜區(qū)分析第六十三頁,共196頁。TMHMM(跨膜區(qū)分析)第六十四頁,共196頁。第六十五頁,共196頁。顯示大約在第2~27位之間有一跨膜區(qū),并且是由胞內(nèi)到胞外第六十六頁,共196頁??缒^(qū)分析第六十七頁,共196頁。TMpred(跨膜區(qū)分析)第六十八頁,共196頁。第六十九頁,共196頁。發(fā)現(xiàn)三種可能的跨膜螺旋第七十頁,共196頁。顯示跨膜螺旋的傾向性第七十一頁,共196頁。給出最可能的跨膜方式:N末端在膜內(nèi),從第3到第21位氨基酸殘基,由胞里到胞外。第七十二頁,共196頁。1(最可能的跨膜方式)2(備選的跨膜方式)第七十三頁,共196頁。2、疏水性、跨膜區(qū)分析ProtScale(疏水性分析)
第5~20位氨基酸殘基,有一典型疏水區(qū)域。TMHMM(跨膜區(qū)分析)第2~27位之間有一跨膜區(qū),由胞內(nèi)到胞外。TMpred(跨膜區(qū)分析)第3~21位之間有一跨膜區(qū),由胞內(nèi)到胞外。以上三個工具都可從
ExPASy上找到。第七十四頁,共196頁。(三)、蛋白質(zhì)基本性質(zhì)分析蛋白質(zhì)序列的基本性質(zhì)分析是蛋白質(zhì)序列分析的基本方面,一般包括:蛋白質(zhì)的氨基酸組成分子量等電點(diǎn)(pI)疏水性分析跨膜區(qū)分析信號肽分析第七十五頁,共196頁。4、信號肽與蛋白質(zhì)定位信號肽(Signalpeptide)
是分泌性蛋白質(zhì)在分泌出膜外時其肽鏈的N端所具有的一小段多肽。幾乎所有的分泌性蛋白都含有信號序列。信號序列一般有20~40氨基酸長,在跨膜運(yùn)輸過程中,最終被信號肽酶除去。第七十六頁,共196頁。protein蛋白質(zhì)定位胞膜胞外胞漿胞核或其他細(xì)胞器第七十七頁,共196頁。4、信號肽與蛋白質(zhì)定位
以下我們?nèi)匀焕肊xPASy來尋找相關(guān)工具SignalP
(信號肽分析)TargetP(蛋白質(zhì)亞細(xì)胞定位)PSORT(蛋白質(zhì)亞細(xì)胞定位)第七十八頁,共196頁。Post-translationalModificationprediction(翻譯后修飾預(yù)測)第七十九頁,共196頁。SignalP信號肽分析第八十頁,共196頁。SignalP3.0Server(信號肽分析)第八十一頁,共196頁。第八十二頁,共196頁。第八十三頁,共196頁。Sscore(綠色)Cscore(紅色)分析發(fā)現(xiàn)第1~23位為信號肽第八十四頁,共196頁。第八十五頁,共196頁。4、信號肽與蛋白質(zhì)定位
以下我們?nèi)匀焕肊xPASy來尋找相關(guān)工具SignalP
(信號肽分析)TargetP(蛋白質(zhì)亞細(xì)胞定位)PSORT(蛋白質(zhì)亞細(xì)胞定位)第八十六頁,共196頁。Topologyprediction(拓?fù)鋵W(xué)預(yù)測)第八十七頁,共196頁。TargetP蛋白質(zhì)亞細(xì)胞定位第八十八頁,共196頁。TargetP1.1Server蛋白質(zhì)亞細(xì)胞定位第八十九頁,共196頁。第九十頁,共196頁。SP(signalpeptide)LocS(Secretorypathway)RC(Reliabilityclass,from1to5)TPlen(Predictedpresequencelength)第九十一頁,共196頁。3、信號肽(前導(dǎo)肽)與蛋白質(zhì)定位
以下我們?nèi)匀焕肊xPASy來尋找相關(guān)工具SignalP
(信號肽分析)TargetP(蛋白質(zhì)亞細(xì)胞定位)PSORT(蛋白質(zhì)亞細(xì)胞定位)第九十二頁,共196頁。Topologyprediction(拓?fù)鋵W(xué)預(yù)測)第九十三頁,共196頁。PSORT蛋白質(zhì)亞細(xì)胞定位第九十四頁,共196頁。第九十五頁,共196頁。PSORT蛋白質(zhì)亞細(xì)胞定位第九十六頁,共196頁。第九十七頁,共196頁。第九十八頁,共196頁。發(fā)現(xiàn)信號肽(1~23)第九十九頁,共196頁。N端可能在膜內(nèi)第一百頁,共196頁。定位于細(xì)胞質(zhì)第一百零一頁,共196頁。蛋白質(zhì)序列分析1、蛋白質(zhì)序列檢索2、蛋白質(zhì)序列比對3、蛋白質(zhì)基本性質(zhì)分析
4、蛋白質(zhì)功能預(yù)測5、蛋白質(zhì)結(jié)構(gòu)預(yù)測第一百零二頁,共196頁。(四)、蛋白質(zhì)功能預(yù)測1、通過序列比對(如BLAST、FASTA)預(yù)測蛋白質(zhì)功能。(注意打分矩陣的選擇)近緣關(guān)系比對遠(yuǎn)緣關(guān)系比對第一百零三頁,共196頁。(四)、蛋白質(zhì)功能預(yù)測2、通過數(shù)據(jù)庫搜索蛋白質(zhì)家族、保守結(jié)構(gòu)域和
功能位點(diǎn)來預(yù)測蛋白質(zhì)功能。相關(guān)的數(shù)據(jù)庫很多,以下主要介紹兩個相對獨(dú)立的數(shù)據(jù)庫(PROSITE、SMART)和兩個綜合性數(shù)據(jù)庫(InterProScan、CDD)。均可從ExPASy找到。第一百零四頁,共196頁。相關(guān)概念模體或指紋(motif,fingerprint)屬于蛋白質(zhì)的超二級結(jié)構(gòu)范疇,由兩個或兩個以上具有二級結(jié)構(gòu)的肽段,在空間上相互接近,形成一個特殊的空間構(gòu)象,并發(fā)揮專一的功能。第一百零五頁,共196頁。相關(guān)概念超二級結(jié)構(gòu)(supersecondarystructure)超二級結(jié)構(gòu)是介于蛋白質(zhì)二級結(jié)構(gòu)和三級結(jié)構(gòu)之間的空間結(jié)構(gòu),指相鄰的二級結(jié)構(gòu)單元組合在一起,彼此相互作用,排列形成規(guī)則的、在空間結(jié)構(gòu)上能夠辨認(rèn)的二級結(jié)構(gòu)組合體,并充當(dāng)三級結(jié)構(gòu)的構(gòu)件。第一百零六頁,共196頁。相關(guān)概念結(jié)構(gòu)域(domain)結(jié)構(gòu)域是在二級結(jié)構(gòu)或超二級結(jié)構(gòu)的基礎(chǔ)上形成的三級結(jié)構(gòu)局部折疊區(qū)。其特點(diǎn)是在三維空間可以明顯區(qū)分或相對獨(dú)立,并且具有特定的生物學(xué)功能如結(jié)合小分子。模體(motif)可以看作是結(jié)構(gòu)域的亞單位。一個結(jié)構(gòu)域可包括一個或幾個模體。蛋白質(zhì)家族(family)具有一個或多個相同結(jié)構(gòu)域的一組同源蛋白質(zhì)稱為一個蛋白質(zhì)家族。第一百零七頁,共196頁。Protsite數(shù)據(jù)庫Protsite數(shù)據(jù)庫是基于對蛋白質(zhì)家族中同源序列多序列比對得到的保守性區(qū)域,這些區(qū)域通常與生物學(xué)功能有關(guān),例如酶的活性位點(diǎn)、配體或金屬結(jié)合位點(diǎn)等。因此,Prosite數(shù)據(jù)庫實(shí)際上是蛋白質(zhì)序列功能位點(diǎn)數(shù)據(jù)庫。通過對Prosite數(shù)據(jù)庫的搜索,可判斷該序列包含什么樣的功能位點(diǎn),從而推測其可能屬于哪一個蛋白質(zhì)家族。第一百零八頁,共196頁。PROSITE(Proteinfamiliesanddomains)第一百零九頁,共196頁。第一百一十頁,共196頁。第一百一十一頁,共196頁。匹配到一個目標(biāo):Invertebratedefensins(無脊椎動物防御素)第一百一十二頁,共196頁。SMART數(shù)據(jù)庫簡單模塊構(gòu)架搜索工具(simplemodulararchitectureresearchtool,SMART)一個較好的蛋白質(zhì)結(jié)構(gòu)功能域的數(shù)據(jù)庫,由EMBL建立和維護(hù)。第一百一十三頁,共196頁。Patternandprofilesearches第一百一十四頁,共196頁。SMART第一百一十五頁,共196頁。第一百一十六頁,共196頁。第一百一十七頁,共196頁。Knot1domain(Knottins打結(jié)素)Position:55to93E-value:2.11e-02第一百一十八頁,共196頁。InterPro數(shù)據(jù)庫InterPro是個集成的數(shù)據(jù)庫,目的是基于大多數(shù)普通的數(shù)據(jù)庫之上,對蛋白質(zhì)家族、結(jié)構(gòu)域、功能位點(diǎn)等進(jìn)行獨(dú)特的、無冗余的描述。Interpro
數(shù)據(jù)庫集合了PROSITE、Pfam、PRINTS、SMART等數(shù)據(jù)庫。由EBI開發(fā),維護(hù)。第一百一十九頁,共196頁。第一百二十頁,共196頁。InterProScan第一百二十一頁,共196頁。InterPro集成了14個蛋白質(zhì)數(shù)據(jù)庫,最新版含有5542個結(jié)構(gòu)域,12370個蛋白質(zhì)家族。第一百二十二頁,共196頁。(四)、蛋白質(zhì)功能預(yù)測2、通過數(shù)據(jù)庫搜索蛋白質(zhì)家族、保守結(jié)構(gòu)域和
功能位點(diǎn)來預(yù)測蛋白質(zhì)功能。相關(guān)的數(shù)據(jù)庫很多,以下主要介紹兩個相對獨(dú)立的數(shù)據(jù)庫(PROSITE、SMART)和兩個綜合性數(shù)據(jù)庫(InterProScan、CDD)。均可從ExPASy找到。第一百二十三頁,共196頁。Patternandprofilesearches第一百二十四頁,共196頁。第一百二十五頁,共196頁。InterProScanSequenceSearch第一百二十六頁,共196頁。第一百二十七頁,共196頁。第一百二十八頁,共196頁。(四)、蛋白質(zhì)功能預(yù)測2、通過數(shù)據(jù)庫搜索蛋白質(zhì)家族、保守結(jié)構(gòu)域和
功能位點(diǎn)來預(yù)測蛋白質(zhì)功能。相關(guān)的數(shù)據(jù)庫很多,以下主要介紹兩個相對獨(dú)立的數(shù)據(jù)庫(PROSITE、SMART)和兩個綜合性數(shù)據(jù)庫(InterProScan、CDD)。均可從ExPASy找到。第一百二十九頁,共196頁。第一百三十頁,共196頁。AllResources(A-Z)第一百三十一頁,共196頁。第一百三十二頁,共196頁。第一百三十三頁,共196頁。第一百三十四頁,共196頁。第一百三十五頁,共196頁。Defensin_2,4e-07(blastp會自動搜索CDD)第一百三十六頁,共196頁。第一百三十七頁,共196頁。ConservedDomainDatabase,CDD保守結(jié)構(gòu)域數(shù)據(jù)庫第一百三十八頁,共196頁。第一百三十九頁,共196頁。Defensin_2,4e-07(blastp會自動搜索CDD)第一百四十頁,共196頁。(四)、蛋白質(zhì)功能預(yù)測1、通過序列比對(比如BLAST、FASTA)預(yù)測蛋白質(zhì)功能。(注意打分矩陣的選擇)2、通過數(shù)據(jù)庫搜索蛋白質(zhì)家族、保守結(jié)構(gòu)域和
功能位點(diǎn)來預(yù)測蛋白質(zhì)功能。PROSITE、SMARTInterProScan、CDD第一百四十一頁,共196頁。蛋白質(zhì)序列分析1、蛋白質(zhì)序列檢索2、蛋白質(zhì)序列比對3、蛋白質(zhì)基本性質(zhì)分析4、蛋白質(zhì)功能預(yù)測
5、蛋白質(zhì)結(jié)構(gòu)預(yù)測第一百四十二頁,共196頁。(五)、蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)結(jié)構(gòu)預(yù)測的必要性與可能性蛋白質(zhì)結(jié)構(gòu)及相關(guān)概念蛋白質(zhì)二級結(jié)構(gòu)預(yù)測蛋白質(zhì)三級結(jié)構(gòu)預(yù)測第一百四十三頁,共196頁。1、蛋白質(zhì)結(jié)構(gòu)預(yù)測的必要性與可能性蛋白質(zhì)由氨基酸的線性序列組成,但是,它們只有折疊成特定的空間構(gòu)象才能具有相應(yīng)的活性和相應(yīng)的生物學(xué)功能。了解蛋白質(zhì)的空間結(jié)構(gòu)不僅有利于認(rèn)識蛋白質(zhì)的功能,也有利于認(rèn)識蛋白質(zhì)是如何執(zhí)行其功能的。掌握蛋白質(zhì)的空間結(jié)構(gòu)還是蛋白質(zhì)分子設(shè)計的基礎(chǔ),比如有些蛋白質(zhì)是藥物作用的靶標(biāo),聯(lián)合運(yùn)用基因和蛋白質(zhì)結(jié)構(gòu)信息,藥物設(shè)計者可以設(shè)計出小分子化合物,抑制與疾病相關(guān)的蛋白質(zhì),從而達(dá)到治療疾病的目的。第一百四十四頁,共196頁。1、蛋白質(zhì)結(jié)構(gòu)預(yù)測的必要性與可能性目前,蛋白質(zhì)序列數(shù)據(jù)庫數(shù)據(jù)積累的速度非常快,但是,已知結(jié)構(gòu)的蛋白質(zhì)相對比較少。由于用X射線晶體衍射、NMR核磁共振技術(shù)和電鏡三維重構(gòu)等實(shí)驗(yàn)方法來確定蛋白質(zhì)結(jié)構(gòu)的過程非常復(fù)雜,代價較高。因此,實(shí)驗(yàn)測定的蛋白質(zhì)結(jié)構(gòu)比已知的蛋白質(zhì)序列要少得多。第一百四十五頁,共196頁。1、蛋白質(zhì)結(jié)構(gòu)預(yù)測的必要性與可能性另一方面,隨著DNA測序技術(shù)的發(fā)展,人類基因組及更多的模式生物基因組已經(jīng)或?qū)⒁煌耆珳y序,DNA序列數(shù)量將會急增。我們可以從DNA推導(dǎo)出大量的蛋白質(zhì)序列。這意味著已知序列的蛋白質(zhì)數(shù)量和已測定結(jié)構(gòu)的蛋白質(zhì)數(shù)量的差距將會越來越大。因而,揭示每一種蛋白質(zhì)的空間結(jié)構(gòu),已成為后基因組時代的制高點(diǎn),這也就是結(jié)構(gòu)基因組學(xué)的基本任務(wù)。第一百四十六頁,共196頁。1、蛋白質(zhì)結(jié)構(gòu)預(yù)測的必要性與可能性人們希望產(chǎn)生蛋白質(zhì)結(jié)構(gòu)的速度能夠跟上產(chǎn)生蛋白質(zhì)序列的速度,或者減小兩者的差距。那么如何縮小這種差距呢?我們不能完全依賴現(xiàn)有的結(jié)構(gòu)測定技術(shù),需要發(fā)展理論分析方法,這對蛋白質(zhì)結(jié)構(gòu)預(yù)測提出了極大的挑戰(zhàn)。自從Anfinsen提出蛋白質(zhì)折疊的信息隱含在蛋白質(zhì)的一級結(jié)構(gòu)中,科學(xué)家們對蛋白質(zhì)結(jié)構(gòu)的預(yù)測進(jìn)行了大量的研究,我們可以運(yùn)用適當(dāng)?shù)乃惴ǎ瑥陌被嵝蛄谐霭l(fā)來預(yù)測蛋白質(zhì)的結(jié)構(gòu)。第一百四十七頁,共196頁。2、蛋白質(zhì)結(jié)構(gòu)及相關(guān)概念氨基酸以肽鍵連接成多肽鏈稱為蛋白質(zhì)的一級結(jié)構(gòu)。肽鏈在空間卷曲折疊成為特定的三維空間結(jié)構(gòu),包括二級結(jié)構(gòu)和三級結(jié)構(gòu)二個主要層次。有的蛋白質(zhì)由多條肽鏈組成,每條肽鏈稱為亞基,亞基之間又有特定的空間關(guān)系,稱為蛋白質(zhì)的四級結(jié)構(gòu)。所以蛋白質(zhì)分子有非常特定的復(fù)雜的空間結(jié)構(gòu)。一般認(rèn)為,蛋白質(zhì)的一級結(jié)構(gòu)決定二級結(jié)構(gòu),二級結(jié)構(gòu)決定三級結(jié)構(gòu)。第一百四十八頁,共196頁。2、蛋白質(zhì)結(jié)構(gòu)及相關(guān)概念超二級結(jié)構(gòu)(supersecondarystructure)超二級結(jié)構(gòu)是介于蛋白質(zhì)二級結(jié)構(gòu)和三級結(jié)構(gòu)之間的空間結(jié)構(gòu),指相鄰的二級結(jié)構(gòu)單元組合在一起,彼此相互作用,排列形成規(guī)則的、在空間結(jié)構(gòu)上能夠辨認(rèn)的二級結(jié)構(gòu)組合體,并充當(dāng)三級結(jié)構(gòu)的構(gòu)件。第一百四十九頁,共196頁。2、蛋白質(zhì)結(jié)構(gòu)及相關(guān)概念模體或指紋(motif,fingerprint)屬于蛋白質(zhì)的超二級結(jié)構(gòu)范疇,由兩個或兩個以上具有二級結(jié)構(gòu)的肽段,在空間上相互接近,形成一個特殊的空間構(gòu)象,并發(fā)揮專一的功能。第一百五十頁,共196頁。2、蛋白質(zhì)結(jié)構(gòu)及相關(guān)概念結(jié)構(gòu)域(domain)結(jié)構(gòu)域是在二級結(jié)構(gòu)或超二級結(jié)構(gòu)的基礎(chǔ)上形成的三級結(jié)構(gòu)局部折疊區(qū)。其特點(diǎn)是在三維空間可以明顯區(qū)分或相對獨(dú)立,并且具有特定的生物學(xué)功能如結(jié)合小分子。模體(motif)可以看作是結(jié)構(gòu)域的亞單位。一個domain可包括一個或幾個motif。蛋白質(zhì)家族(family)具有一個或多個相同結(jié)構(gòu)域的一組同源蛋白質(zhì)稱為一個蛋白質(zhì)家族。第一百五十一頁,共196頁。3、蛋白質(zhì)二級結(jié)構(gòu)的預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)是指蛋白質(zhì)分子中某一段肽鏈的局部空間結(jié)構(gòu),也就是該段肽鏈主鏈骨架原子的相對空間位置。蛋白質(zhì)二級結(jié)構(gòu)是蛋白質(zhì)分子中重要的組成“部件”,是研究蛋白質(zhì)氨基酸序列和三級結(jié)構(gòu)之間的橋梁。蛋白質(zhì)二級結(jié)構(gòu)的預(yù)測對于蛋白質(zhì)三維結(jié)構(gòu)的預(yù)測具有十分重要的意義。第一百五十二頁,共196頁。3、蛋白質(zhì)二級結(jié)構(gòu)的預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)主要有螺旋、折疊、轉(zhuǎn)角和無規(guī)卷曲等。通過對已知結(jié)構(gòu)的蛋白質(zhì)的結(jié)構(gòu)特征進(jìn)行研究,人們發(fā)現(xiàn)不同的氨基酸并不是平均地分布在各種二級結(jié)構(gòu)類型中,也就是說不同的氨基酸形成不同的二級結(jié)構(gòu)類型的傾向性不同。根據(jù)這個規(guī)律我們可以由氨基酸序列來預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)。也可以通過多序列比對來預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)。第一百五十三頁,共196頁。第一百五十四頁,共196頁。3、蛋白質(zhì)二級結(jié)構(gòu)的預(yù)測可利用綜合性序列分析軟件(如DNAMAN)或ExPASy上的SOPMA來預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)。第一百五十五頁,共196頁。載入上述93aa的家蠅defensin氨基酸序列第一百五十六頁,共196頁。使用一種DSC算法預(yù)測準(zhǔn)確率為68.58%第一百五十七頁,共196頁。第一百五十八頁,共196頁。第一百五十九頁,共196頁。Secondarystructureprediction第一百六十頁,共196頁。SOPMA第一百六十一頁,共196頁。第一百六十二頁,共196頁。第一百六十三頁,共196頁。第一百六十四頁,共196頁。4、蛋白質(zhì)三級結(jié)構(gòu)的預(yù)測尋找某種蛋白質(zhì)的三級結(jié)構(gòu),首先應(yīng)該查詢蛋白質(zhì)數(shù)據(jù)庫(如PDB),即查詢是否已經(jīng)有人做過該蛋白質(zhì)的三級結(jié)構(gòu)測定。PDB
中只存儲至今人們已知其三級結(jié)構(gòu)的蛋白質(zhì),數(shù)量占生物體中存在的各種蛋白質(zhì)的很小部分。由于資金和技術(shù)等方面的問題,人們尚不知道許多蛋白質(zhì)的三級結(jié)構(gòu)。對于這些蛋白質(zhì),可以通過結(jié)構(gòu)預(yù)測來獲得其三級結(jié)構(gòu)。第一百六十五頁,共196頁。4、蛋白質(zhì)三級結(jié)構(gòu)的預(yù)測如果已經(jīng)擁有蛋白質(zhì)一級結(jié)構(gòu)序列,無論是由蛋白質(zhì)測序儀直接測定得到氨基酸序列,或是由基因序列通過遺傳密碼翻譯推測得到氨基酸序列,都可以利用蛋白質(zhì)結(jié)構(gòu)預(yù)測軟件(在線服務(wù))對該蛋白質(zhì)的三維結(jié)構(gòu)進(jìn)行預(yù)測。盡管預(yù)測本身有一定風(fēng)險,但總比一無所知要好得多。蛋白質(zhì)結(jié)構(gòu)預(yù)測技術(shù)已經(jīng)取得了很大進(jìn)步,每種預(yù)測方法都是根據(jù)特定的規(guī)則進(jìn)行合理的預(yù)測,具有一定的可信度。第一百六十六頁,共196頁。4、蛋白質(zhì)三級結(jié)構(gòu)的預(yù)測目前預(yù)測蛋白質(zhì)結(jié)構(gòu)的方法可分為三大類同源建?!繕?biāo)序列與模板序列比較,按照模板序列的空間結(jié)構(gòu),經(jīng)過優(yōu)化,產(chǎn)生目標(biāo)序列三維結(jié)構(gòu);
折疊識別或穿針引線——預(yù)測二級結(jié)構(gòu),預(yù)測折疊方式,參考其它蛋白的空間結(jié)構(gòu),產(chǎn)生目標(biāo)序列三維結(jié)構(gòu);
從無到有——單個氨基酸形成二級結(jié)構(gòu)的傾向,加上各種作用力力場信息,直接產(chǎn)生目標(biāo)序列三維結(jié)構(gòu)。第一百六十七頁,共196頁。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 自動售貨機(jī)行業(yè)市場發(fā)展現(xiàn)狀與市場發(fā)展前景展望預(yù)測考核試卷
- 回歸測試必要性分析試題及答案
- 行政組織理論發(fā)展的影響因素及2025年試題及答案
- 帶寬管理與流量控制技術(shù)試題及答案
- 關(guān)注軟件測試工程師考試試題及答案動態(tài)
- 公路工程施工案例試題及答案探討
- 老年人日常生活照料技能考核試卷
- 嵌入式控制系統(tǒng)設(shè)計技巧試題及答案
- 嵌入式編程中的最佳實(shí)踐試題及答案
- 行政組織中的社會責(zé)任與價值觀探索試題及答案
- 接處警規(guī)范化操作培訓(xùn)體系
- 2025年中考語文作文終極押題(附范文5篇)
- 晚期胃癌護(hù)理
- 水利水電工程科技創(chuàng)新與試題及答案
- 抗凝藥術(shù)前停用的指南
- 儲能集裝箱項(xiàng)目可行性研究報告(模板)
- 廢舊電纜采購合同協(xié)議
- 《2024 3573-T-424 重大活動食品安全保障規(guī)范 第 2 部分:食材》知識培訓(xùn)
- 歐氏距離在地理信息系統(tǒng)中的應(yīng)用-全面剖析
- 新版靜療規(guī)范解讀指南
- 2024年招聘輔導(dǎo)員的責(zé)任意識與服務(wù)能力測評試題及答案
評論
0/150
提交評論