好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

基因组常用术语解释.pdf

8页
  • 卖家[上传人]:ldj****22
  • 文档编号:46437418
  • 上传时间:2018-06-26
  • 文档格式:PDF
  • 文档大小:652.35KB
  • / 8 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 基因组拼接中常见的名词解释基因组拼接中常见的名词解释 Read:高通量测序平台产生的序列就称为 reads Contig:拼接软件基于 reads 之间的 overlap 区,拼接获得的序列称为 Contig(重叠群) Scaffold:基因组 de novo 测序,通过 reads 拼接获得 Contigs 后,往往还需要构建 454 Paired-end 库或 Illumina Mate-pair 库,以获得一定大小片段(如 3Kb、6Kb、10Kb、20Kb)两端的序列基于这些序列,可以确定一些 Contig 之间的顺序关系,这些先后顺序已知的 Contigs 组成 Scaffold Contig N50:Reads 拼接后会获得一些不同长度的 Contigs将所有的 Contig长度相加,能获得一个 Contig 总长度然后将所有的 Contigs 按照从长到短进行排序,如获得 Contig 1,Contig 2,Contig 3...………Contig 25将 Contig 按照这个顺序依次相加,当相加的长度达到 Contig 总长度的一半时,最后一个加上的 Contig 长度即为 Contig N50。

      举例:Contig 1+Contig 2+ Contig 3 +Contig 4=Contig 总长度*1/2 时,Contig 4 的长度即为 Contig N50Contig N50 可以作为基因组拼接的结果好坏的一个判断标准 Scaffold N50:Scaffold N50 与 Contig N50 的定义类似Contigs 拼接组装获得一些不同长度的 Scaffolds将所有的 Scaffold 长度相加,能获得一个 Scaffold 总长度然后将所有的 Scaffolds 按照从长到短进行排序,如获得 Scaffold 1,Scaffold 2,Scaffold 3...………Scaffold 25将 Scaffold 按照这个顺序依次相加,当相加的长度达到 Scaffold 总长度的一半时,最后一个加上的 Scaffold 长度即为 Scaffold N50举例:Scaffold 1+Scaffold 2+ Scaffold 3 +Scaffold 4 +Scaffold 5=Scaffold总长度*1/2 时,Scaffold 5 的长度即为 Scaffold N50Scaffold N50 可以作为基因组拼接的结果好坏的一个判断标准。

      测序深度和覆盖度:  测序深度是指测序得到的总碱基数与待测基因组大小的比值假设一个基因大小为 2M,测序深度为 10X,那么获得的总数据量为 20M  覆盖度是指测序获得的序列占整个基因组的比例由于基因组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装获得的序列往往无法覆盖有所的区域,这部分没有获得的区域就称为 Gap例如一个细菌基因组测序,覆盖度是 98%,那么还有 2%的序列区域是没有通过测序获得的 高通量测序技术相关的名词解释高通量测序技术相关的名词解释 高通量测序技术是对传统测序一次革命性的改变,一次对几十万到几百万条 DNA 分子进行序列测定,因此在有些文献中称其为下一代测序技术(next generation sequencing)足见其划时代的改变,同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(deep sequencing) de novo 测序 de novo 测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生物信息学分析手段对序列进行拼接,组装,从而获得该物种的基因组图谱获得一个物种的全基因组序列是加快对此物种了解的重要捷径。

      随着新一代测序技术的飞速发展,基因组测序所需的成本和时间较传统技术都大大降低,大规模基因组测序渐入佳境,基因组学研究也迎来新的发展契机和革命性突破利用新一代高通量、高效率测序技术以及强大的生物信息分析能力,可以高效、低成本地测定并分析所有生物的基因组序列 重测序 全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围通过构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价值 外显子测序 外显子组测序是指利用序列捕获技术将全基因组外显子区域 DNA 捕捉并富集后进行高通量测序的基因组分析方法 small RNA 测序 Small RNA(micro RNAs、siRNAs 和 pi RNAs)是生命活动重要的调控因子,在基因表达调控、生物个体发育、代谢及疾病的发生等生理过程中起着重要的作用Illumina 能够对细胞或者组织中的全部 Small RNA 进行深度测序及定量分析等研究。

      实验时首先将 18-30 nt 范围的 Small RNA 从总 RNA 中分离出来,两端分别加上特定接头后体外反转录做成 cDNA 再做进一步处理后,利用测序仪对 DNA 片段进行单向末端直接测序通过 Illumina 对 Small RNA 大规模测序分析,可以从中获得物种全基因组水平的 miRNA 图谱,实现包括新 miRNA 分子的挖掘,其作用靶基因的预测和鉴定、样品间差异表达分析、miRNAs 聚类和表达谱分析等科学应用 chip 测序 染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP)也称结合位点分析法,是研究体内蛋白质与 DNA 相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究将 ChIP 与第二代测序技术相结合的 ChIP-Seq 技术,能够高效地在全基因组范围内检测与组蛋白、转录因子等互作的 DNA区段 ChIP-Seq 的原理是:首先通过染色质免疫共沉淀技术(ChIP)特异性地富集目的蛋白结合的 DNA 片段,并对其进行纯化与文库构建;然后对富集得到的 DNA片段进行高通量测序研究人员通过将获得的数百万条序列标签精确定位到基因组上,从而获得全基因组范围内与组蛋白、转录因子等互作的 DNA 区段信息。

      表达谱 基因表达谱(gene expression profile):指通过构建处于某一特定状态下的细胞或组织的非偏性 cDNA 文库,大规模 cDNA 测序,收集 cDNA 序列片段、定性、定量分析其 mRNA 群体组成,从而描绘该特定细胞或组织在特定状态下的基因表达种类和丰度信息,这样编制成的数据表就称为基因表达谱 miRNA 测序 成熟的 microRNA(miRNA)是 17~24nt 的单链非编码 RNA 分子,通过与 mRNA 相互作用影响目标 mRNA 的稳定性及翻译,最终诱导基因沉默,调控着基因表达、细胞生长、发育等生物学过程基于第二代测序技术的 microRNA 测序,可以一次性获得数百万条 microRNA 序列,能够快速鉴定出不同组织、不同发育阶段、不同疾病状态下已知和未知的 microRNA 及其表达差异,为研究 microRNA 对细胞进程的作用及其生物学影响提供了有力工具 mRNA 测序 转录组学(transcriptomics)是在基因组学后新兴的一门学科,即研究特定细胞在某一功能状态下所能转录出来的所有 RNA(包括 mRNA 和非编码 RNA)的类型与拷贝数。

      Illumina 提供的 mRNA 测序技术可在整个 mRNA 领域进行各种相关研究和新的发现mRNA 测序不对引物或探针进行设计,可自由提供关于转录的客观和权威信息研究人员仅需要一次试验即可快速生成完整的 poly-A 尾的 RNA完整序列信息,并分析基因表达、cSNP、全新的转录、全新异构体、剪接位点、等位基因特异性表达和罕见转录等最全面的转录组信息简单的样品制备和数据分析软件支持在所有物种中的 mRNA 测序研究 功能基因组学 功能基因组学(Functuional genomics)又往往被称为后基因组学(Postgenomics),它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质得研究转向多个基因或蛋白质同时进行系统的研究这是在基因组静态的碱基序列弄清楚之后转入对基因组动态的生物学功能学研究研究内容包括基因功能发现、基因表达分析及突变检测基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等采用的手段包括经典的减法杂交,差示筛选,cDNA 代表差异分析以及 mRNA 差异显示等,但这些技术不能对基因进行全面系统的分析,新的技术应运而生,包括基因表达的系统分析(serial analysis of gene expression,SAGE),cDNA 微阵列(cDNA microarray),DNA 芯片(DNA chip)和序列标志片段显示(sequence tagged fragments display。

      比较基因组学 比较基因组学(Comparative Genomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科利用模式生物基因组与人类基因组之间编码顺序上和结构上的同源性,克隆人类疾病基因,揭示基因功能和疾病分子机制,阐明物种进化关系,及基因组的内在结构 表观遗传学 表观遗传学是研究基因的核苷酸序列不发生改变的情况下,基因表达了可遗传的变化的一门遗传学分支学科表观遗传的现象很多,已知的有 DNA 甲基化(DNA methylation),基因组印记(genomic impriting),母体效应(maternal effects),基因沉默(gene silencing),核仁显性,休眠转座子激活和 RNA 编辑(RNAediting)等 计算生物学 计算生物学是指开发和应用数据分析及理论的方法、数学建模、计算机仿真技术等当前,生物学数据量和复杂性不断增长,每 14 个月基因研究产生的数据就会翻一番,单单依靠观察和实验已难以应付因此,必须依靠大规模计算模拟技术,从海量信息中提取最有用的数据 基因组印记 基因组印记(又称遗传印记)是指基因根据亲代的不同而有不同的表达。

      印记基因的存在能导致细胞中两个等位基因的一个表达而另一个不表达基因组印记是一正常过程,此现象在一些低等动物和植物中已发现多年印记的基因只占人类基因组中的少数,可能不超过 5%,但在胎儿的生长和行为发育中起着至关重要的作用基因组印记病主要表现为过度生长、生长迟缓、智力障碍、行为异常目前在肿瘤的研究中认为印记缺失是引起肿瘤最常见的遗传学因素之一 基因组学 基因组学(英文 genomics),研究生物基因组和如何利用基因的一门学问用于概括涉及基因作图、测序和整个基因组功能分析的遗传学分支该学科提供基因组信息以及相关数据系统利用,试图解决生物,医学,和工业领域的重大问题 DNA 甲基化 DNA 甲基化是指在 DNA 甲基化转移酶的作用下,在基因组 CpG 二核苷酸的胞嘧啶 5'碳位共价键结合一个甲基基团正常情况下,人类基因组“垃圾”序列的 CpG 二核苷酸相对稀少,并且总是处于甲基化状态,与之相反,人类基因组中大小为 100—1000 bp 左右且富含 CpG 二核苷酸的 CpG 岛则总是处于未甲基化状态,并且与 56%的人类基因组编码基因相关人类基因组序列草图分析结果表明,人类基因组 CpG 岛约为 28890 个,大部分染色体每 1 Mb 就有 5—15 个 CpG 岛,平均值为每 Mb 含 10.5。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.