
DAVID使用方法介绍.docx
25页DAVID使用阐明文档一、 DAVID简介DAVID (the Database for Annotation,Visualization and Integrated Discovery)的网址是 DAVID是一种生物信息数据库,整合了生物学数据和分析工具,为大规模的基因或蛋白列表(成百上千个基因ID或者蛋白ID列表)提供系统综合的生物功能注释信息,协助顾客从中提取生物学信息DAVID这个工具在发布,目前版本是v6.7和其她类似的分析工具,如GoMiner,GOstat等同样,都是将输入列表中的基因关联到生物学注释上,进而从记录的层面,在数千个关联的注释中,找出最明显富集的生物学注释最重要是功能注释和信息链接二、 分析工具:DAVID需要顾客提供感爱好的基因列表,在基因背景下,使用提供的分析工具,提取该列表中具有的生物信息这里说的基因列表和背景文献的选用对成果至关重要1. 基因列表:这个基因列表也许是上游的生物信息分析产生的基因ID列表对于富集分析而言,一般状况下,大量的基因构成的列表有更高的记录意义,对富集限度高的特殊Terms有更高的敏感度富集分析产生的p-value在相似或者数量相似的基因列表中具有可比性。
DAVID对于基因列表的格式规定为每行一种基因ID或者是基因ID用逗号分隔开基因列表的质量会直接影响到分析成果这里定性给出好的基因列表应当具有的特点,一种好的基因列表至少要满足如下的大部分的规定:(1) 涉及与研究目的有关的大部分重要的基因(如标记基因)2) 基因的数量不能太多或者太少,一般是100至10000这个数量级3) 大部分基因可以较好的通过记录筛选,例如,在控制组和对照组样品间选择明显差别体现基因时,使用的t-test原则:fold changes >=2 && P-values <=0.054) 大部分是上下调的基因都波及到特定的某毕生物过程,而不是随机的散布到所有也许的生物过程中5) 一种好的基因列表比起随机产生的一种基因列表,应当具有更丰富的生物信息6) 在同样的条件下,列表具有高度可反复性7) 高通量数据的质量可以被其她独立的实验证明以上(2),(3),(6)&(7)是来自上游的数据原则,DAVID会自动检查其他的各项规定,即(1),(4)&(7)2. 基因背景:在一项研究中,如果一种生物过程不正常,那么通过高通量筛选技术,对该过程共同作用的基因有更大的也许性被选为有关的一组。
富集分析正是以此为基本为检测富集的限度,必须选用一种背景来进行对比基因背景的选用有一种指引原则,就是必须构建一种足够大的,研究者也许波及的所有基因的集合顾客使用默认的背景文献(默觉得该物种的所有基因),或者是上传一种基因列表文献作为基因背景3. DAVID为实现各项功能分析,提供了如下4个分析内容(共6个分析工具):(1) Gene Name Batch Viewer这个工具可以实现将基因ID迅速翻译成基因名称,从而给研究者对于基因ID列表一种直观的印象,初步判断基因列表与否符合规定目的图1中显示了该工具的分析成果,具体阐明图1中标注图1 Gene Name Batch Viewer的分析成果(2) Gene Functional Classification这个工具是Gene Name Batch Viewer工具的延伸由于基因名称并不能明显体现基因的功能,因此我们需要更加有效的功能分类工具该工具基于它们共同的注释信息,而不是基因名称,采用全新的模糊聚类算法,可以实现将功能有关的基因聚到一起作为一种单元,在生物学网络水平上去研究这些基因群对聚类成果打分,分值越高,代表该组内的基因在基因列表中越重要。
同步还提供了2-D View,以热图形式呈现聚类到同一组的基因和该组内各个Term之间的关系成果见图2,将列表中的基因ID作为聚类对象,将功能有关的基因分组显示图3是以热图形式展示的gene-term关系图2 Gene Functional Classification的分析成果图3 2-D View展示gene-term关系(3)Functional Annotation该工具是DAVID最核心的分析内容,涉及了三个子工具: u Functional Annotation Chart该工具提供gene-term的富集分析相比于其她富集分析软件而言,DAVID在该功能上最明显的特点是,注释范畴的可扩展性:从最初的GO注释,扩展到目前超过40中的注释种类,涉及GO注释,KEGG注释,蛋白互相作用,蛋白功能区域,疾病有关,生物代谢通路,序列特点,异构体,基因功能总结,基因在组织里的体现和论文等顾客可以根据需要选择其中的某些或者所有种类的注释信息成果中以基因列表中富集的Terms为对象,将信息按照DAVID计算出来的p-value排列,同步链接指向更多的信息,见图4 图4 Functional Annotation Chart的分析成果u Functional Annotation Clustering该工具使用类似于Gene Functional Classification工具的模糊聚类措施,基于注释共同浮现的限度作聚类,对被注释上的Terms做聚类,即Terms被提成多组,并将给出聚类的分值。
分值越高,代表该组内的基因在基因列表中越重要同步还提供了2-D View,以热图形式呈现聚类到同一组的基因和该组内各个Term之间的关系成果中(见图5),即被注释上的Terms作为聚类对象,顾客可以根据聚类的分值找到重要的Terms图5 Functional Annotation Clustering的分析成果u Functional Annotation Table该工具实现了基因的功能注释,将输入列表中每个基因在选定数据库中的注释以表格形式呈现成果见图6图6 Functional Annotation Table的分析成果(4)Gene ID Conversion该工具实现不同数据库的基因标记间的转换涉及NCBI, PIR 和 Uniprot/SwissProt等重要数据库的基因标记信息成果如图7所示,左边的表格显示转换的状况,右边表格以列表呈现转换成果,和基因名称注释等图7 Gene ID Conversion分析成果总结:对于以上6项分析工具各有偏重点,下面给出一种批示图(见图8),协助顾客选择DAVID的各项分析工具图8 DAVID各项分析工具的选择批示图三、 使用环节:1. 向DAVID网站提交一种基因列表。
一方面登录到网站 的首页(见图9)点击页面顶端的“Start Analysis”在弹出页面的左边有一种面板“Gene List Manager”,在该面板的“upload”标签下提交基因列表(基因列表的格式为每行一种基因或者行内的多种基因以逗号分隔,可以将基因列表黏贴到输入窗口或者以文献形式上传);接着选用输入基因列表的ID类型;最后拟定列表的类型,是基因列表还是作为背景文献点击use,进入分析图9 网站首页上传的数据可以供所有的分析模块共享,而不需要反复上传基因列表文献可以选用如图10中所示的Demolist1 和 Demolist2本文中使用DAVID提供的Demolist1作为基因列表附件一是人的血瘀和正常样品之间的明显差别体现基因列表,可供使用如果你要做的是全基因组背景或者是接近全基因组背景的研究,就不需要上传那个背景文献,网站会自动根据上传的基因列表类型,选择相应物种的所有基因作为背景文献如果你要自己设定背景,也可以在“upload”标签中上传,然后在“Background”标签中选定所需的列表作为背景本文中选用默认的背景文献,即人的全基因作为背景图10 上传数据窗口在“List”标签中,可以看到所有上传的列表。
在图11所示的右侧中,选择分析项图11 Lsit标签和分析工具选择窗口(1)选择Gene Name Batch Viewer这项分析,弹出的窗口显示分析成果,即基因ID和相应的基因名称、有关基因以及所属物种顾客可以据此初步判断,列表中与否具有感爱好的基因(见图12)Species栏指向物种有关的ncbi信息网页图12 Gene Name Batch Viewer分析成果点击Related Genes栏中的 RG,将会浮现跟该行基因功能有关的基因列表,如图13所示的成果图13 功能有关基因列表(2)选择“Gene ID Conversion Tool”这项分析工具,在弹出窗口(见图14)中,选择目的标记类型,然后点击“Submit to Conversion Tool”,弹出成果窗口,具体阐明见图15参照网页)图14 Gene ID Conversion Tool窗口图15 Gene ID Conversion Tool成果阐明文献(3)选择“Gene Functional Classification”这项分析工具, 弹出的成果和具体阐明见图16(具体阐明参照网页)图16 Gene Functional Classfication(3)选择“Functional Annotation Tool”这项分析工具,会弹出图17所示窗口(具体阐明参照)。
图17 Functional Annotation Tool界面点击页面底部的三个选项“Functional Annotation Clustering”、“Functional Annotation Chart”、“Functional Annotation Table”:l 选择Functional Annotation Clustering这一项分析,可以对被注释上的Terms做聚类,弹出成果见图18,图中绿色的图标可以显示2-D view热图(详见之前提到)图18 Functional Annotation Clustering分析成果l 选择“Functional Annotation Chart“这一项分析,可以实现Terms的富集分析成果见图19(具体阐明见网页)图19 Functional Annotation Chart成果展示l 选择“Functional Annotation Table “这项分析,可以实现对基因的所有选定数据库注释具体成果见图20图20 Functional Annotation Table页面解说参照文献:Systematic and Integrative Analysis of Large Gene Lists Using DAVID Bioinformatics Resources 刊登在Nature Protocols。












