好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

简单重复序列在不同的人体1型免疫缺陷病毒全基因组序列中的分布.pdf

8页
  • 卖家[上传人]:飞***
  • 文档编号:53740390
  • 上传时间:2018-09-04
  • 文档格式:PDF
  • 文档大小:571.09KB
  • / 8 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 简单重复序列在不同的人体1 型免疫缺陷病毒全基因组序列中的分布摘要: 关于简单重复序列( SSRS )的研究在真核生物和原核生物中已经广泛被使用 然而,它在病毒尚不多见 因此,我们着手于在 1 型人类免疫缺陷病毒 (HIV- 1) 的 SSR研究,这是关于 SSR的演变和在它病毒中的作用的一个很好的系统研究 被检查的 SSRS 分布在 81 个 HIV -1 基因组全部序列, 它们来自 34 个不同的国家 或 6 大洲以上的地区 在这些调查序列中, 虽然相对丰度和相对密度表现出非常 高的相似性,但这些序列对于最常见的SSR和最长的 SSRs呈现出不同的表现 我们的研究结果表明,不同比例重复的类型,可能与基因组稳定性相关 1. 简介: 简单重复序列( SSRS ),也被称为微卫星序列,由1-6 bp 单位串联重复序列组 成的基因组随着真核生物和原核生物基因组全部序列越来越多,SSRS 在全基 因组水平已被广泛研究SSR 的许多相同的特征被发现在真核生物和原核生物 中:(1)SSRs的分布在基因组中不是随机的; (2)大多数但不是所有的SSR普 遍存在并且丰富的存在于在基因组中,SSR内容和基因组大小并不总是被证明呈 正比的关系 ; (3)SSR 存在于 30 - UTR ,50 - UTR ,外显子,内含子,即蛋白 质编码和非编码区 ;(4)SSR 是充满变数和具有不寻常的多态性,因此是被广泛 使用于遗传标记 ; (5)在不同类群或不同地区的同一类群中SSRS 的类型可能不 同;(6)SSR被认为可能会影响转录活性以及它在基因调控演变中扮演着重要角 色。

      与此相对应的是,一些假设开始解释上述现象它认为,SSR的形成可能是 由于从头起源或收养的起源, 以及 SSR的不稳定多态性主要是由于在DNA复制中 链的滑落错配的错误 托特等人,认为 SSR的固定从头生成由多种因素的相互作 用,包括重复类型SSR的基因的位置,以及生化遗传的细胞背景到现在为止, 以我们的知识, SSRS 在病毒中仍然没有对此进行了更详细的研究已经知道一 些在艾滋病毒的基因组中SSR的分布特别是,每个艾滋病毒 RNA 链的末端包括 一个 RNA序列称为长末端重复序列(LTR ),其中包含重要的监管区域,尤其是 那些转录起始和多聚腺苷酸化区域SLIP,一个 TTTTTT难以理解的位置,参与 GAG - POL阅读框移要求获取使用的POL 因此,艾滋病毒,一个慢病毒(逆转 录病毒家族的成员),它可导致获得性免疫缺陷综合症(AIDS ),是一个很好的 系统研究演变以及病毒SSR的生物功能两个艾滋病毒菌株(HIV - 1 和 HIV- 2) 已知存在,其中 HIV - 1 是更致命的,相对比较容易传染,而且是全球大流行在 这项研究中,我们调查了SSR的分布和大小的变化在同一品种(HIV- 1)的不同 序列中。

      我们目的在于解决相对丰度和相对密度在这些来源于不同的国家或地区 的序列是否相似,以及在这些调查的HIV - 1 的全部基因组中的多种重复类型的 发生频率是如何不同 我们也希望我们的数据能够在病毒中SSR的分配规则提供 见解 2. 材料和方法 共 81 个 HIV - 1的基因组全部序列,来源于34个超过 6 大洲的不同国家或地 区, 从基因库( http://www.ncbi.nlm.nih.gov)被收集基因组名单序列,其地区 和大小列见表 1使用 SSRIT对所有的基因组序列的各种SSR进行扫描,这是搜索每五种 SSR 图案(二,三,四,五,六核苷酸的重复),长度6 个 bp 或更多无单核苷酸 重复进行了调查,它在编码和非编码区域的重复发生之间并没有差异为了便 于比较大小不同的基因组序列,我们选择使用“相对丰度”,这是计算通过除以 SSRS 的数量即 公斤碱基对( KB )序列,并决定利用“相对密度”,这是一个碱基对序列的数量 通过 每个 SSR贡献的总序列分析序列计算的价值(KB ) 3. 结果与讨论 我们分析了完整的的SSR 6bP长,来源于 81 个完全测序的 HIV - 1的基因组, 排列从 8540 BP (AF042102 )至 10035 BP (AF133821 ),这些序列从 6 大洲超过 34 个不同的国家或地区(见表1)被抽取。

      使用计算机软件对HIV- 1 的序列进 行全基因组扫描, 22-48 个 SSR的发现在每个基因组序列中(补充表1)相对 丰度的二,三,四,五,六型核苷酸的重复以及SSRS 的相对密度在所选艾滋病 毒 1 基因组分别列于表2 和 3结果在这里表明了相对丰度和相对密度在这些调 查的每个序列非常相似迄今为止,一些作者报道了相关的SSR 真菌基因组和其他基因组的基因组大小在这里,类似的工作已经完成, 这表明 在不同的 HIV - 1 基因组的 SSR总数没有直接与基因组大小成正比例如,在一 个同样大小的基因组比较,相比AF193277AF063224 有五个过剩的SSR ,虽然它 们具有相同的基因组大小(8961 BP)(补充表 1) 表 1 相对丰度 =(各种类型的 SSRs 个数/整体的碱基数) *1000 为了比较不同类型的 SSRs 长度区别我们选择了用相对密度这个参数来进行比较:相对密度 =(各种类型 SSRs 的碱基数/整体的碱基数)*1000 1000:表示我们是以基因组 1000bp长度为研究单位,便于结果比较表 2 表 3 3.1.SSR 的总数和相对丰度 与原核和真核基因组相比,HIV- 1 基因组是非常小的。

      正如所料,少的SSR 被 鉴定 在这些研究的每一个基因组序列其中检查序列,SSR 的数量最高的是48 个发 现在 EU448295序列中,以及最少的是22 个在 AY169815序列中在整个基因组各重 复类型的相对丰度是相似的 例如,大多数但不是全部的每个二型核苷酸重复序 列的相对丰度为 3 或 4这使相对丰度更加明显于其他重复类型,三核苷酸重复 序列的相对丰度小于或相等于一型的相对丰度四,五和六型重复主要是0 在每个 接受调查的 HIV - 1的基因组序列中其表明,在不同的重复丰度差异HIV- 1 的基因组中, 链滑动理论不足以解释SSR的分布特点在这些调查的每一个基因 组序列,如预期图案模式的分析显示,较小的重复序列偏高 其中二型核苷酸重 复序列,AG/ GA重复占主导地位, 而 CG/ GC重复是比较少见的的 (补充图 S1- S81)这是特别有趣的,在某些染色体或人类,果蝇,拟南芥,线虫的基因组, 酵母,真菌和一些原核生物,因为CG/ GC重复的内容也非常低三型核苷酸的重复是第二个最丰富的重复, 重复的类型可能会在不同的HIV-1 全基因组中不同 (补充表 2)几乎没有四, 五,和六型核苷酸在所有的基因组中重复序列出现。

      然而,也有少数例外,例如,(GGAA )3 个四核苷酸重复,它存在于DQ396382 序列中以及一个( AAGAGG)3 个六核苷酸重复,它被展现在EU031914序列中 3.2. 相对密度的 SSR 通过 81 个 HIV - 1 的基因组全序列 SSRS 的相对密度几乎是平等的代表,无论被 选中的序列是否来自同一个国家或地区密度最高的SSR在 35 个 BP / KB 序列 DQ295195 中被发现,这是来自亚洲的韩国,密度最低的SSR是 16 个 BP / KB 的 序列的 AY169815 , 这是来自非洲的喀麦隆, 但大部分这些序列的相对密度是20 BP / KP 或以上近年来它已被证明,在一些真核和原核基因组中三核苷酸重复序 列比其他类型的重复序列有更丰富的编码区,动态偶尔与三核苷酸重复序列的突 变疾病和其他重要的功能相关在这里,我们的重点在于SSR定位的 HIV - 1 的全部基因组,并调查这些序列的SSR的密度是否是相同的我们的结果表明, 在全部序列中二型核苷酸重复序列是非常相同,相比于三核苷酸重复序列 二核 苷酸重复序列被认为每个单位长度的DNA 让滑落事件更多的可能, 因为它拥有比 三核苷酸重复序列和四核苷酸重复序列的更最高滑移率从而更不稳定。

      观察似乎 表明重复类型所占的比例不同,有可能影响HIV-1 基因组全部序列的构成和稳 定 3.3 最常见的 SSR 的图案 有证据显示, 在各种生物中最常见的SSR的图案是不同的 例如,据报道,(GT ) n 是动物和无脊椎动物中最常见的SSR ,而在植物中的重复 (AT )N是最常见的, (CT )n 是昆虫最常见的一种然而,关于是否普遍的SSR的图案在各个全部序 列同一品种中不同的报告似乎尚不多见我们的研究结果显示最常见的SSR的图 案也可能是不同在同一品种中 其中 58 个序列在这些调查研究中, 最常见的 SSR 序列图案是( GA )n 的 4 倍和 13 倍之间可以发生在单序列,而在其他序列的共 同 SSR图案可以是( AG )n(CA )n,(AT )n, (GT )n 或(TA )n(补充表 3) 此外,人们还注意到一个序列可能隐藏最常见的一个或多个SSR的图案以及最常 见的 SSR的图案总数发生可能会在各种不同序列中 3.4. 最长的 SSR 其推断,较长重复序列的突变率较高,并因此是不稳定的, 这导致随着重复序列 长度的变化 SSR的频率逐步下降根据假设,最长的SSR可能会在最不稳定的 SSR序列中。

      在这项研究中,最长的 SSR 是一个六核苷酸重复序列, 这是 (AAGAGG) 3 ,18 NT在所有分析基因组的长度中 然而,每个序列有自己的长度最长的SSR 随着长度 9 NT,10 NT 或 12 NT 等(补充表 4)除了六核苷酸重复序列类型, 二,三,四核苷酸重复序列类型还观察到最长的SSR 一般来说, 在一个序列中, 没有两个以上的 SSR长度> 10 NT 被发现粒体和叶绿体的真菌基因组中缺 少很长的 SSR ,可能是由于其基因组大小较小,相对性质稳定,有向下突变的偏 好以及存在的时间短然而,HIV - 1 的基因组极其不稳定,以及被发现有超突 变因此,缺乏很长的SSR在 HIV - 1基因组中表示参与额外的机制 鸣谢 这项工作是由中国重点资助国家科技研发项目:2006BAD08A13 附录 A补充资料 与本文相关的补充资料中可以发现,在版本,作者: 10.1016/j.febslet.2009.08.004 参考文献:[1] Kim, T.S., Booth, J.G., Gauch Jr., H.G., Sun, Q., Park, J., Lee, Y.H. and Lee, K. (2008) Simple sequence repeats in Neurospora crassa: distribution, polymorphism and evolutionary inference. BMC Genomics 9, 31. [2] Li, Y.C., Korol, A.B., Fahima, T. and Nevo, E. (2004) Microsatellites within genes: structure, function, and evolution. Mol. Biol. Evol. 21, 991–1007. [3] Rajendrakumar, P., Biswal, A.K., Balachandran, S.M., Srinivasarao, K. and Sundaram, R.M. (2007) Simple sequence repeats in organellar genomes of rice: frequency and distribution in genic and intercoding regions. Bioinformatic。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.