好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

人类基因组用户指南.docx

27页
  • 卖家[上传人]:ni****g
  • 文档编号:448958283
  • 上传时间:2023-06-09
  • 文档格式:DOCX
  • 文档大小:78.93KB
  • / 27 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 人类基因组用户指南编者:人类基因组计划将于2003年完成,人类基因组数据库成为人类的巨大财富它对所有公 众开放,每个人都有权免费使用这些强大的资源,从而成为生物医学研究者必不可少的工具但是, 面对日益增长的浩瀚的数据海洋,怎样有效地利用它而不至于迷失其中,是一个严峻的问题据 Wellcome Trust去年的一项调查,使用序列数据库的研究人员中,只有一半的人能够完全熟悉基因组 数据库提供的服务针对这种情况,今年9月份,Nature genetics特别出了一本“人类基因组用户指 南”,以提问的形式详细讲解了人类基因组数据库的结构和使用方法,带领我们一步步深入其中,获 取有用的信息它是我们开启人类基因组数据宝库的一把金钥匙我们将节选一些内容介绍给读者, 希望对大家有所帮助读者也可以上Nature杂志网站()看原文,这本用户 指南的电子版是免费的问题1:如何找到一个感兴趣的基因并确定其结构? 一旦基因在图谱上被定位,又如何 方便地检测到同一区域的其它基因?可借此问题介绍3个主要的基因组浏览器将利用所有3个站点对基因ADAM2 进行检测,使读者能对每个站点提供的信息之间的细微的区别有一个正确的认识。

      1.国立生物技术信息中心(NCBI)图谱浏览器(Map Viewer)可以通过NCBI主页进入NCBI的人类图谱浏览器,网址为 http://www.ncbi.nlm.nih.gov点击右栏标有"Human map viewer^的超级链接即可进入图 谱浏览器的主页页面上端的符号标明此为Build 29,或NCBI人类基因组的第29次 数据装配Build 29是以2002年4月5日的序列数据为基础而建立的在它之前的基 因组装配称为Build 28,以2001年12月24日的序列数据为基础而建立想要寻找图 谱上的任何信息,比如基因符号、基因库的登录号、标记物名称或疾病名称,只需在 “Search for窗口输入相应的术语名,然后点击“Find唧可例如,输尺ADAM2”然后 点"Find'而染色体栏"on chromosome(s)''的窗口会空出以进行基于文本的查找结果,浏览器的页面显示了所有人类染色体的示意图,并用指针指出ADAM2在第 8号染色体短臂上的位置搜寻结果表明基因存在于两种NCBI图谱上,Genes_cyto和 Genes_seqGenes_cyto指细胞遗传学图谱,而Genes_seq指序列图谱,点击任易一种 链接将打开相应的图谱。

      这方面及其它 NCBI 图谱的详细介绍可通过 http://www.ncbi.nlm.nih.gov/PMGifs/Genomes/humansearch.htm .进行查找若需要了解关 于ADAM2更多的情况包括所有可利用的图谱,点击“Map element”内相应的选项(本 例为ADAM2),将会显示ADAM2及少数8p11.2上的相邻序列三种图谱都将在本视 图显示并将在下面进行详细说明,其它例子所用的图谱可通过Maps & Options附加到 本视图最右边的图谱为主要图谱,此图谱提供了最详细的资料本例中的主要图谱即为Genes_seq (基因序列)图谱,描述了 ADAM2的内含子/外显子组成,是通过ADAM2 mRNA在基因组上的序列对齐比较(alignment)而建立的此基因有14个外显子在 ADAM2基因符号旁的箭头(粉红色区域内)显示了基因转录的方向基因符号本身与 LocusLink相链接,这是一类NCBI资源,可提供有关此基因的大量信息,包括别名、 核苷酸及蛋白质序列,并与其它资源相链接(见问题10)基因符号右侧的链接指向了 有关此基因的附加信息sv,或称序列浏览,表明基因在基因组克隆重叠群(contig)上的位置,包括核酸和 编码的蛋白质序列。

      ev给使用者提供证据浏览,显示了支持某特定基因模型的生物学证据这个视图 显示所有的标准序列模型(RefSeq)、基因库mRNAs( GenBank mRNAs)、转录子(无 论注解的、已知的或潜在的)及与基因组contig进行序列对齐比较的表达序列标签(ESTs)证据浏览更多的信息可通过点击任意证据浏览页上的Evidence Viewer Help链 接进入NCBI网页查询hm为NCBI的人-小鼠同源图谱的链接,显示人类和小鼠之间同源的基因组序列seq允许使用者以文本格式重新获取某一区域的基因组序列,序列显示的区域可很 容易地进行替换mm为Model Maker的链接,显示当GenBank mRNAs、ESTs及基因预测与基因组 序列对齐比较时的外显子随后使用者即可选择特定的外显子创建一个用户化的基因模 式有关Model Maker的更多的信息可通过点击任一 mm页上的“help”栏进入NCBI主 页获得UniG_Hs图谱显示已经与基因组进行序列对齐比较的人类UniGene簇灰色的柱 状图描述了比对的ESTs的数目,而蓝色线条显示了 UniGene簇在基因组中的定位深 蓝色线是进行序列对齐比较的区域(即外显子),浅蓝色划线则表示潜在的内含子。

      在 此例中UniGene簇Hs.177959在基因组中的定位跟随着ADAM2和所有的外显子Genes_cyto图谱显示了基因在细胞遗传学图谱中的位置,橙色条带显示基因位置 尽管ADAM2已被很好地定位,并以一条短线表现出来,其它的基因比如它后面一条长 线上成组的基因也被按照细胞遗传学定位于第8号染色体上较宽的区域点击蓝色工具条上的缩放控制区可进行缩小,利于使用者观察第8号染色体较大的 区域缩小一个水平可显示1/100的染色体区域,在此区域共有20条基因,20条基因 均可被显示ADAM2基因在所有图谱上的区域均以红色突出在Genes_seq图谱上 ADAM2 定位于 ADAM18 及 LOC206849 之间2. UCSC(University of California,Santa 基因组浏览器UCSC基因组浏览器的主页为http://genome.ucsc.edu/目前,UCSC不仅提供最新 版的小鼠和人类基因组数据,同时也提供许多较早的汇编使用基因组浏览器时,先在 窗口上方蓝色工具条的下拉式菜单中选择相应的生物体(本例为Human),然后点击标 有Browser的链接在结果页,选择相应的人类数据汇编版本进行阅读。

      2001年8月 的基因组浏览器建立于UCSC使用在当时所能获得的序列数据建立的人类基因组汇编 2001年12月的浏览器显示了对NCBI的人类基因组build 28的注解而2002年4月 的浏览器显示了对NCBI的build 29的注解因为最近的这个人类资料汇编的注解不及 2001年12月的汇编全面,所以本文所列举的例子来自较早的汇编在下拉式菜单中选 择“Dec. 2001 ”从数据库获得汇编资料查询所支持的类型列于文本输入框下面在标有“position ”处输入“ADAM2”然后点 击“Submit”项查找的结果以两种类别显示,分别为“Known Genes "和“mRNA Associated Search Results”标有“Known Genes "的部分显示了将NCBI的参考mRNA序列定位到 基因组中"mRNA Associated Search Results’则代表了 GenBank的其它mRNA序列定位 到基因组中点击“Known Genes ”与ADAM2的链接可见ADAM2 mRNA参考序列在基 因组的状况(NM_001464)放大视图显示第8号染色体基因组序列从36234934到36280132碱基的区域,位于 8p12。

      标记为Known Genes (来自RefSeq)的蓝色路径显示已知基因的内含子和外显子结 构垂直框表示外显子而水平线则为内含子ADAM2基因似乎具有14个外显子,转 录的方向由内含子上的箭头示意标记有 Acembly Gene Predictions, Ensembl Gene Predictions和Fgenesh++ Gene Predictions的路径为基因预测的结果(见问题7)其它 数据库核酸序列的对齐比较显示在GenBank的Human mRNAs、spliced EST、UniGene 和来自于GenBank路径中的Nonhuman mRNAs小鼠和Tetraodon基因序列翻译后的 序列对齐比较在小鼠和鱼BLAT路径内显示单核苷酸多态性(SNPs)、重复元件及微阵 排列数据的路径列于页面底部关于每个路径附加的细节可通过选择位于底部的Track Controls中的路径名获得查看ADAM2前后基因序列,点击位于右上角的Zoom out”框进行缩小,ADAM2 位于TEM5和ADAM18之间3. Ensemb l 网站Ensembl项目网站(http://www.ensembl.org/)为四个物种:人类、小鼠、斑马鱼 (zebrafish)和蚊子提供基因组浏览器。

      点击“Human ”以查看人类基因组的主要条目 目前人类Ensembl的版本为6.28.1,是以NCBI基因组Build 28为基础而建立的欲进 行搜索可在文本框中输入“ADAM2”并通过在下拉式菜单中选择“Gene ”以限定搜索范 围,点击上方标有“Lookup^的按钮,点击与ADAM2基因的链接可返回单独的结果点击与ADAM2的链接可重新回到GeneView窗口,此页包含四个部分的数据,第 一部份为ADAM2的概貌,包括基因登录号,蛋白质结构域和家族的相关链接链接 Ensembl查看高度同源的小鼠序列可在“ Homology Matches ”部分获得,以后的例子会在 这方面作出更详细的介绍GeneView窗的第二部份,提供有关基因转录子的信息,cDNA 序列被列出,其内含子和外显子结构以图表表示,同时在此基因前后位置附近有限数量 的基因也以图表形式表示出来外显子序列在GeneView中的第三部份显示,剪接位点 显示于第四部份如果预计基因具有不止一个转录子,则每个转录子拥有各自的转录产 物、外显子和剪接位点部分ADAM2完整的前后基因组序列内容可通过返回 GeneView的第一部份和点击 "Genomic Location ”框中的链接来查看。

      所出现的ContigView框的顶端部分描述了染色 体,其中最为关键的部分以红色标示此浏览显示了此基因的基因组前后序列,包括染 色体条带、contigs、标志和在图上靠近8p12的基因点击任意这些项目可显示相关内 容,感兴趣的部分在DNA图谱上以红色标记由Ensembl注释的ADAM2附近的基因 为 Q96KB2 和 ADAM18ContigView页的底部即Detailed View,是一个放大了的区域,标示出已经定位于此 区域的人类基因组所有特征Overview和Detailed View之间的浏览器按钮将视图从左 至右移动以及放大和缩小所显示的内容可通过选择“Features ”的下拉式菜单进行移动 以选取需要查看的内容所显示的内容为默认值,DNA(contigs)图谱将正链(上方)上的条目从反链(下方)分 开,此处反链的唯一特征为GENSCAN基因预测程序提出(见问题7)的单一的Genscan 转录子正链表现出了 5种特征从底部开始,ADAM2转录子显示为红色,提示其为 一个已知的转录子,对应于接近全长的cDNA序列、蛋白质序列或在公共数据库中两 者均可得到的转录子黑色转录子通过EST或蛋白质序列的类似性预测。

      EST Transcr” 链接于独立的ESTs序列对齐比较,而靠近顶端的UniGene路径显示了 UniGene簇正 链上的Genscan模式包含了在已知的转录子中发现的外。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.