




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、.1 簡介 .2產生的背景 如何借助計算機全面地展示細胞和生物所包含的生物學信息是后基因組時代的重大挑戰(zhàn)之一??茖W家期望能夠根據基因組中的信息,用計算機計算或者預測出比較復雜的細胞中的通路或者生物的復雜行為。出于這個目的,日本京都大學生物信息學中心的Kanehisa實驗室于1995年建立了生物信息學數(shù)據庫KEGG。.3特點 KEGG是一個整合了基因組、化學和系統(tǒng)功能信息的數(shù)據庫。把從已經完整測序的基因組中得到的基因目錄與更高級別的細胞、物種和生態(tài)系統(tǒng)水平的系統(tǒng)功能關聯(lián)起來是KEGG數(shù)據庫的特色之一。 人工創(chuàng)建了一個知識庫,這個知識庫是基于使用一種可計算的形式捕捉和組織實驗得到的知識而形成的系統(tǒng)
2、功能知識庫。它是一個生物系統(tǒng)的計算機模擬。 與其他數(shù)據庫相比,KEGG 的一個顯著特點就是具有強大的圖形功能,它利用圖形而不是繁縟的文字來介紹眾多的代謝途徑以及各途徑之間的關系,這樣可以使研究者能夠對其所要研究的代謝途徑有一個直觀全面的了解。.4用途 各個數(shù)據庫中包含了大量的有用信息。基因組信息存儲在GENES數(shù)據庫里,包括完整和部分測序的基因組序列;更高級的功能信息存儲在PATHWAY數(shù)據庫里,包括圖解的細胞生化過程如代謝、膜轉運、信號傳遞、細胞周期,還包括同系保守的子通路等信息;KEGG的另一個數(shù)據庫LIGAND,包含關于化學物質、酶分子、酶反應等信息。 通過與世界上其它一些大型生物信息學
3、數(shù)據庫的連接,KEGG可以為研究者提供更為豐富的生物學信息(LinkDB)。 KEGG提供了Java的圖形工具來訪問基因組圖譜,比較基因組圖譜和操作表達圖譜,以及其它序列比較、圖形比較和通路計算的工具,可以免費獲取。.5影響及發(fā)展 KEGG建立了KEGG直系同源系統(tǒng)(the KEGG Orthology (KO) system),這個系統(tǒng)通過把分子網絡的相關信息連接到基因組中,從而發(fā)展和促進了跨物種注釋流程。 結果表明,KEGG被當做一個參考知識庫,被廣泛的用于基因組測序和其他高通量實驗技術得到的大規(guī)模數(shù)據集的整合和解釋中。除了保持對基礎研究的支持,隨著KEGG分子網絡的一些小變化,KEGG正
4、在朝著更加偏向于實際應用的方向發(fā)展,這些應用主要集中在整合人類疾病、藥物和其他與健康相關的物質。.6KEGG數(shù)據庫 KEGG是一個綜合數(shù)據庫,它們大致分為系統(tǒng)信息、基因組信息和化學信息三大類。進一步可細分為16個主要的數(shù)據庫。可以通過不同的顏色編碼來區(qū)分。.7分類分類數(shù)據庫數(shù)據庫目錄目錄顏色顏色系統(tǒng)信息KEGG PATHWAYKEGG通路圖KEGG BRITEBRITE功能層次KEGG MODULEKEGG功能單元的模塊KEGG DISEASE人類疾病KEGG DRUG藥物KEGG ENVIRON天然藥物和與健康相關的物質基因組信息KEGG ORTHOLOGYKEGG直系同源(KO)組KEGG
5、 GENOMEKEGG中帶有完整基因組的物種KEGG GENES在完整基因組中的基因目錄KEGG SSDB與基因有關的序列相似性數(shù)據庫化學信息KEGG COMPOUND代謝物及其他小分子化合物KEGG GLYCAN多糖KEGG REACTION生化反應KEGG RPAIR化學反應中的反應物對KEGG RCLASSRPAIR定義的反應級別KEGG ENZYME酶命名法.8三類數(shù)據庫的關系.9KEGG對象標識符DatabaseObjectPrefixExampleKEGG PATHWAYPathway mapmap, ko, ec, rn, (org)hsa04930KEGG BRITEFunct
6、ional hierarchybr, jp, ko, (org)ko01003KEGG MODULEKEGG moduleM, (org)_MM00010KEGG DISEASEHuman diseaseHH00004KEGG DRUGDrugDD01441KEGG ENVIRONCrude drug, etc.EE00048KEGG ORTHOLOGYKO groupKK04527KEGG GENOMEKEGG organismTT01001 (hsa)KEGG GENESGene / proteinhsa:3643KEGG COMPOUNDSmall moleculeCC00031KEGG
7、 GLYCANGlycanGG00109KEGG REACTIONReactionRR00259KEGG RPAIRReactant pairRPRP04458KEGG RCLASSReaction classRCRC00046KEGG ENZYMEEnzymeec:2.7.10.1數(shù)據庫中包含各種各樣的數(shù)據對象,這些數(shù)據對象是為了用來對生物系統(tǒng)進行計算機模擬的。因此,各個數(shù)據庫中的數(shù)據記錄都被稱為KEGG對象。這些對象可以通過KEGG對象標識符來識別,標識符由一個與數(shù)據庫相關的前綴加五個數(shù)字構成。(org) represents three-, four-, or five-letter o
8、rganism code.10當前數(shù)據庫中的記錄KEGG Database as of 2013/6/5KEGG PATHWAYPathway maps, reference (total)0 (246,368)KEGG BRITEFunctional hierarchies, reference (total)140 (78,848)KEGG MODULEKEGG modules, reference (total)566 (185,274)KEGG DISEASEHuman diseases1,301KEGG DRUGDrugs9,910KEGG ENVIRONCrude drugs an
9、d health-related substances845KEGG ORTHOLOGY KEGG Orthology (KO) groups16,748KEGG GENOMEKEGG Organisms2,697KEGG GENESGenes in high-quality genomes(190 eukaryotes, 2336 bacteria, 153 archaea)10,821,739KEGG SSDBBest hit relations within GENESBi-directional best hit relations within GENES130,947,959,95
10、72,996,848,546KEGG DGENESGenes in draft genomes (18 eukaryotes)432,488KEGG EGENESGenes as EST contigs (99 eukaryotes)3,792,883KEGG MGENESGenes in metagenomes (716 samples)90,754,418KEGG COMPOUND Metabolites and other small molecules17,012KEGG GLYCANGlycans10,985KEGG REACTIONBiochemical reactions9,32
11、0KEGG RPAIRReactant pair chemical transformations14,092KEGG RCLASSReaction class2,807KEGG ENZYMEEnzyme nomenclature5,973.11KEGG PATHWAY DatabaseKEGG PATHWAY數(shù)據庫是一個手工畫的代謝通路的集合,包含以下幾方面的分子間相互作用和反應網絡:1.新陳代謝2.遺傳信息加工3.環(huán)境信息加工4.細胞過程5.生物體系統(tǒng)6.人類疾病7.藥物開發(fā).12PATHWAY的五種類型僅僅第一種參考通路(reference pathway)圖是手動畫出來的,其他的通路圖
12、都是通過計算產生的。 pathway中的每一個框(或線)都對應一個或多個K編號、EC編號及R編號。map - Reference pathway 對于代謝相關的通路,在reference pathway中,一個點同時表示一個基因、這個基因編碼的酶及這個酶參加的反應ko - Reference pathway (KO) ko通路中的點只表示基因ec - Reference pathway (EC) ec通路中的點只表示相關的酶rn - Reference pathway (Reaction) Reaction通路中的點只表示改點參與的某個反應、反應物對及反應類型org - Organism-sp
13、ecific pathway map 對于所有的代謝和非代謝通路,K編號都被認為是基因的標識符,這個標識符在每一個物種中對應該物種中的某個基因,從而得到物種特異性的pathway。.13 map00010ko00010ec00010rn00010hsa00010.14KEGG BRITE DatabaseKEGG BRITE是一個層級分類的數(shù)據庫,包含生物系統(tǒng)各個方面的知識。相對于KEGG PATHWAY僅限于分子間相互作用和反應,KEGG BRITE包含了許多不同的關系類型。例如,可以查詢酶和底物之間的關系,也可以查詢某種酶的同源基因。.15tp53在BRITE中的查詢結果.16KEGG M
14、ODULE DatabaseKEGG MODULE是一個人工定義的功能單元的集合。被用于已測序基因組的注釋和生物學上的解釋。各個模塊使用M開頭的編號及與其對應的一系列K開頭的編號來表示。四種主要的KEGG模塊1.通路模塊:代表在KEGG代謝通路圖中的復雜功能單元,例如M00002(糖酵解,與三碳化合物相關的核心模塊)2.結構復合物:通常形成分子機械,例如M00072(寡糖轉移酶)3.功能集:基本單元的其他形式,例如M00360(氨酰基-tRNA 合酶,原核生物)4.特征模塊:作為某種表型的標記,例如M00363(腸出血性大腸桿菌致病性特征,志賀毒素).17.18KEGG ORTHOLOGY (
15、KO) DatabaseKEGG參考通路圖,BRITE功能層次以及KEGG模塊都是以一種廣泛的方式來表示,都可以用于所有物種。而KEGG直系同源系統(tǒng)(KO System)是這一表示方式的基礎。包含手動定義的直系同源組,這些直系同源組就相當于KEGG通路中的點,BRITE層級中的點以及KEGG模塊中的點。(這些點并不是某個具體物種的某一個基因,而是在許多物種中都存在的直系同源的某一個基因)。一旦基因被分配了KO標識或K編號,通過基因組注釋流程,物種特異性的通路圖、BRITE功能層次和KEGG模塊就可以自動產生了。.19直系同源與旁系同源l直系同源(orthology)是比較基因組學中最重要的定義
16、。直系同源的定義是: (1).在進化上起源于一個始祖基因并垂直傳遞的同源基因; (2).分布于兩種或兩種以上物種的基因組; (3).功能高度保守乃至于近乎相同,甚至于其在近緣物種可以相互替換; (4).結構相似; (5).組織特異性與亞細胞分布相似。 l旁系同源(paralogy)基因是指同一基因組(或同系物種的基因組)中,由于始祖基因的加倍而橫向產生的幾個同源基因。直系與旁系的共性是同源,都源于各自的始祖基因。其區(qū)別在于:在進化起源上,直系同源是強調在不同基因組中的垂直傳遞,旁系同源則是在同一基因組中的橫向加倍;在功能上,直系同源要求功能高度相似,而旁系同源在定義上對功能上沒有嚴格要求,可能
17、相似,但也可能并不相似(盡管結構上具一定程度的相似),甚至于沒有功能(如基因家族中的假基因)。.20Image depicts concepts of Orthology and paralogy. from Protein Kinase C Orthologs.21Neurotrophin(神經營養(yǎng)因子神經營養(yǎng)因子) signaling pathway(ko04722)從這個圖上可以看到基因之間的相互作用。.22ko編號表示一個通路,這個通路是不分物種的,相當于所有物種的這一通路的并集。.23Ortholog table(ko04722) .24K編號表示一個基因,是ko通路中的基本單位,某
18、一K編號代表的不是某一具體物種的基因,而是所有物種的某一同源基因的統(tǒng)稱。.25KEGG GENOME Database該數(shù)據庫中收集了2679中物種(190 eukaryotes, 2336 bacteria, 153 archaea)的基因組信息,這些物種都已經具有完整的基因組序列,并根據大量的EST數(shù)據集進行了增補。.26KEGG GENES Database KEGG GENES 是所有已知全基因組序列的基因目錄的集合。這些全基因組信息主要參考可得到的公共數(shù)據庫,尤其是NCBI RefSeq數(shù)據庫。這些基因從屬于SSDB (Sequence Similarity Database)并通過KOALA工具進行計算和KO編號的分配(基因注釋)。 KEGG DGENES中包括一些真核生物的基因組草圖, KEGG EGENES是一個包含大部分植物的EST數(shù)據集的補充基因目錄,以上數(shù)據都隨著GENES被當做一個參考數(shù)據集的使用被KAAS自動分配上KO編號。 MGENES表示通過自動注釋的宏基因組。 VGENES表示病毒基因目錄,還沒有全部整合到KEGG系統(tǒng)中。.27KEGG SSDB D
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 45512-2025紡織品定量化學分析聚苯并咪唑纖維與某些其他纖維的混合物
- GB/T 18867-2025電子氣體六氟化硫
- 高考語文社會責任試題及答案
- 高考作文情感認知的試題與答案
- 火災報警的應急預案(3篇)
- 行政法學重要案例分析及試題
- 商場高層火災應急預案范文(3篇)
- 2025年程序員考試復習秘籍試題及答案
- 2025年法學概論考試的應試準備與試題及答案
- 行政法與公共管理理論的結合剖析試題及答案
- 思想道德修養(yǎng)與法律基礎(完整版PPT)
- 全文解讀中國式現(xiàn)代化解讀學習PPT
- 動物英語俚語課件
- 幼兒園課件-神奇的中草藥
- 金壇區(qū)蘇科版六年級心理健康教育第18課《中學遐想》課件(定稿)
- 小學生民法典主題班會PPT
- 抗滑樁施工監(jiān)測監(jiān)控措施
- 甲狀腺的外科治療與病ppt課件
- 國家開放大學《課程與教學論》形考任務1-4參考答案
- 敗血癥PPT優(yōu)質課件
- 萬壽菊提取物項目運營方案【參考范文】
評論
0/150
提交評論