
一篇带你玩转KEGG数据库注释.docx
5页技术帖】一篇带你玩转KEGG数据库注释• l.home 网址:/kegg/• 2. 关 于 kegg 数 据 库 的 一 些 统 计 情 况 : /kegg/docs/statistics.html 截止 2018.4.12 该数据库总共包含:525 个代谢通路 (Pathway maps),21,952 条同源群 (KEGG Orthology (KO) groups),涉及物种442真核生物、4654细菌,268古细菌和 317 种病毒涉及到基因数目26,161,327条• 3.区分 map00010、ko00010、hsa00010口 map:参考参考代谢通路图(图1),□ko:高亮过KOs的参考代谢通路图(图2紫色表示)□单属于人的代谢通路图以绿色标注出(图3绿色)5.4.2 A| 门 1 Xi|O Olyociate-|GljJceTale-3F'1 2A :| 4.1丄】ic^unixfe-E[匚2【1 ]匚2.1巧iarcate metstoi-E121.31.1.1.2D血Epoi-D-Fructosc-SPPyiuyntB rtfetaboLsmL.2 | | AcetaMjehi/de11.】」11.2.1Staich ;ii'd sucrose2-H:tthj1.2.4.1 1^A p-£LFructose-]?6P24」.)12|:eteteA^D-GLucoEe-fiPThPF»O-Aibuiui(cstractllul^r) Solkir! (extracelluljar)Pemose phosphate jiatlwiflyDLactaie1.1.1.21Pynrvab1.155Eut(3AcetateCitKLle cycleGLYCOLYSIS / GLUCONEOGENESISC Carban fixatiari . .I in photoByiiftke:tic otg^juBitu(3-D-Gkwcse °3.1 3.11 2.31.11 2.7.1.1^6 2.7.1.90 A±iutht-6P. 1 T 1 一 I_►□)——&.L 綁27.1- —►O—22:駅SaLc'n-tF珀1丄迢4.1 :i.曲丄.0TTTiT.LH.lJII 丄工 192.72.3 * OlycEHle-l^Pa | 121.9 i|| | O5.4.2115.42.11 5.4.2 125.L33J.7.L.4flA Fhosplneitol- | pyraviale3.L.31D―0 fl^CLGLucose-l P 丄5.42.231.3.3031.3.9Glyoeioiw-P* GLycBi3JdBliyd&-3P5.3.].I \~ ► Q町 2.;L.L |2.1.1.153| 2.7„1.2 |271.147o-D-Glurcse O-Q/U.l2.7.1.63[2: L.^271.141^p-D/jlnroae-^P►O<—121.12| L .2.1 591S.1.J———F4.1丄LLipoaiiudc-E图1代谢通路图mapOOOlOGLYCOLYSIS / GLUCONEOGENESISStaich ;ii'd sucrose inetBiholi?m3.L.3.1D―O fl^CLGLucose-l P丄5.42.23.1.3.92.7.11 |2.1.1.63| 2.7.1.2 |271.147o-D-Glurcse O-A^D-GLucoee-fiP5.L33J.13.15| 5.3.19^(3-D/jlnroae-dP跖.L.l2.7.1.63[2:1.12271.141(3-D-Gkwcse °-D-Fructosc-SPAibuiiii(ertractllulsr) SEdicht'!(extracelluljar) Aibuthi-^P. TH 一 |_*O——\3:2.l 工衍:-—__|221 .貓Pemose phosphate jiatlwiflyieteteCitKLle cyclewAcetateA p-£LFrurtose-]?6P24」.11*厂CX—I 5JJ.IGlyoeiorw-P4 Glyc&iddsliydB 3P品 二一12.1J2|l L .2.1.5912.1.9 IITUTIOlycEBts-l.,:5.42.4| L2im|2.72.3P Olywiate-2?3R2|C Carban ±ati£in . .I in photoByiiftke:ticGlyreTale-lF"5.42.11 5.4.21231.3.304.1.1.324.1 14^127.111.7.111.2.4.1PyiuyntB m&taboLsmThPF»O-lS.l.d—>o——孑4.1丄LLipoaiiudc-ES-Ajcetyl- dihydiolipc^unkfe-EP也 lipoaiciide-E r| L21》|| 1.21T] AcetaMjehiTde图2高亮KO后的mapOOOlO1.2.4.141.】」1.1,1.】1 1.17A Fhosphoenol- | pyraviale3.7.L.4flDLactaiePynrvab1.1.5.51.1.1.2EutGiarcate metstoiGLYCOLYSIS f GLUCOl-IEOGEbJESIS曲 LLGharosB2/M1 2.71.6^5 12.351215||阳丄引5 3.1$»271147injetsbolisitoD-Ghros§ .(exiTKeUularremose p^sphite path^ray■1.L2.I3|(j]nceraHph7de-3P?4zlJ1.2.4.Ashiitbr.(extiaceUuiai) Salicin CeitiafielluLai')p-ELGJuraseU-aiton fbatnji加 photosynltwiK 打辱jusLipcsjiru^-E图3人的mapOOOlOj1L3.i.3.]l2.7.1 111271 '451 2 7 L M…Oj||J-D-FnKtose-lip6P2Ol-nKEih-LJFirhz^phD^lXil-2.7.Ki12.4.14.1.1.14. 特殊的代谢通路以及备注□ (1)011与012编码以011或012开头的代谢通路图为一些整合性质的代谢通路图,总共包含9个。
□ (2) 010:是化学结构图并没有新的KO扩展□ (3) 07:与药物结构相关的代谢通路图,并没有新的KO扩展□ (4 )常规基因kegg数据库注释分析,就是分析ko中去除011、 012、010以及07开头的代谢通路,总共431条目□ (5) ko与KO的区别:ko号码是KEGG中一类参考代谢通路, 而KO代表的是一类具有相似功能的基因簇5. 在kegg数据库收费的情况如何实现对基因序列的批量注释?□ (1)通过KEGG的API,首先你可以获得KEGG数据库中所有物 种简写列表:/list/organism□ (2)使用kobas软件,与koabs数据库做比对注释,kobas可 以选择对应的参考物种,如果是未知物种可以选择ko,从kobas的输出 结果中你可以获得你所注释的基因与kegg数据库中的gen eID的对应 关系□ (3)以人(hsa )为例,通过KEGG的API你可以获得你关心 物种的基因geneID所对应的代谢通路也就是ko : /link/pathway/hsa□ (4 )以人(hsa )为例,通过KEGG的API你可以获得你关心 物种的基因geneID所在的同源群也就是KO号/link/ko/hsa□ ( 5 )最后结合kobas得到的query与geneID以及kegg数据 库中得到的geneID与KO, geneID与ko之间的关系,就可以完整的到 —组未知基因的kegg数据库注释了。
END-才子撰文TC、一棵麦子整理编辑本文系欧易生物原创。
