
顶复门基因组学纵览-疟原虫的进化.pdf
7页顶复门顶复门基因基因组组学纵览学纵览——疟原虫的进化 水平有限,纰漏难免!仅供参考! 摘摘 要要 顶复门基因组与普通的真核基因组有很大不同:基因组小(8.5-63 Mb) ,简 洁紧凑,几乎没有转位因子,也无明显的属以上的基因组同线性,某些情况下, 存在一定的家族化作为寄生生物一种,它们的细胞核基因组也经历过基因丢失 的过程多种基因通过重新组装进入核基因组中(重组、累积突变、基因重复和 重排) 细胞内基因来源于细胞器或者藻类同生体的基因组,而外源性基因 (Lateral gene)来源于细菌或者其它 顶复门生物目前已有隐孢子虫属( Cryptosporidium) 、肉孢子虫属 (Sarcocystis) 、新孢子虫属(Neospora) ,艾美球虫属(Eimeria) 、弓形虫属 (Toxoplasma) 、 巴贝虫属 (Babesia) 、 泰勒虫属 (theileria) 、 疟原虫属 (Plasmodium) 共 8 属的 18 个物种的基因组数据分析显示,它们的动态基因组,由占 11-23% 核心基因(core genes) ,加上大量的谱系保守基因和物种特有的基因构成根据 染色体的变化,整个门的染色体数量和基因结构以及其他基因组特征也不同。
疟 疾的致病源——疟原虫属, 是一个典型, 属内物种间的基因组具有很高的同线性, 但是在端粒区大多具有家族和种间特异基因 疟原虫以及顶复门基因组学比较分 析的工具可以在 EuPathDB.org 等网站找到 顶复门基因组特征: 1、小(8.5-63 Mb) ; 2、紧凑,几乎无转位因子; 3、同线性:属以上几乎无; 4、家族化; 5、基因丢失; 6、外源基因:细菌、共生类藻类等 7、从新组装:重组、累积突变、重复与重排; 引引 言言 著名生物学家、新达尔文主义者杜布赞斯基(Theodosius Dobzhansky)1973 年宣布的“生物学的全部意义在于进化” 当我们比较基因组及其组成时,我们 会发现一个基因组和其姊妹基因组在基因、生物过程、基因组特征水平上是保守 的 借助于比较分析方法,我们能够寻找顶复门原虫和那些特定家族共享的基因 和生物过程我们能够寻求相关生物过程的基因,如嘌呤合成,在原虫进化过程 已丧失我们也能够寻求基因组中的新基因的起源,它们是来源于内共生体还是 其它? 利用大量各种物种的分子和基因的数据进行比较分析,不仅可行,而且成果显著相关物种的调研,无论对比分析还是离散分析,都能对我们理解生物个体 的生物学意义有重大作用,特别是在对病原体的相关研究中。
理解宿主范围、组 织偏好、生活史、入侵、躲避宿主的进攻以及生态位分化对我们战胜疾病至关重 要 当我们聚焦于单一种属时,而未意识到相关的物种的重大进展能够促进我们 理解我们关注的物种及其生物意义生物的进化并不是凭空发生的,与其进化上 最近一个祖先分化而来的物种间有很大关系 这些支持它们不同的生活方式的必 须改变不仅体现出随机性,还有自适应策略 由于个体间的基因的相似性及差异性,在我们看来,病原体有多种途径理 解进化中变化及生物现象的历史可以提高我们研究和解释生物现象的能力 特别 是,它有利于确定某些代谢途径或基因的出现、缺失的原因,以及基因组重构情 况 现在可用的数据不再局限于恶性疟,还有不断增长的顶复门及囊泡总门其它 门的数据 顶 复 门 有 很 多 医 学 、 兽 医 的 病 原 体 , 特 别 是 疟 原 虫 、 隐 孢 子 虫 (cryptosporidium parvum) (更像是昆虫,而非球虫) 、原始的球虫(coccidian) 、 艾美球虫属(Eimeria) 、弓形虫属(Toxoplasma) 、新孢子虫属(Neospora)以及 虱传播牛寄生虫(梨形虫 Piroplasmida, 泰勒虫 Theileria,巴倍虫 Babesia) 。
顶 复门的许多物种由于是病原体,基因组已得到测序我们现在有部分或者完整基 因组数据的12个顶复门物种列在表2.1a中, 还有P.reichenowi, P. ovale, Sarcocystis neurona ,Neospora caninum, Eimeria tenella,and E. maxima. 顶复门比常见真核 生物的基因组小很多, 大概只有 8.5-63 MB; 最大的是肉孢子虫神经元的基因组, 至少 122MB.由于基因组小,顶复门一个特征是大量的基因(核基因、细胞器基 因均有) 丢失 基因总量从 3700 (巴倍虫, B. bovis) 到 8000 (泰勒虫, T. gondii) 不等Cryptosporidium parvum 的基因缺失现象很有意思:核苷酸从头合成的必 需基因包括嘌呤、嘧啶合成的基因缺失了,但是其获得了核酸补救合成途径 顶复门内的种属内,也存在很大不同,他们不仅在宿主和致病性的不同,在 基因组水平也不是不同的并不是所有的顶复门生物都有 14 条染色体,疟原虫 属将近 50%的基因在其它顶复门中找不到对应的同源基因已知的顶复门原虫 都有免疫逃逸相关的基因,但大部分并不是像已知的几乎全部疟原虫一样,在端 粒区有个大的基因家族。
通过比较研究,可以发现多种的变化如染色体数目、染 色体结构、以及保守基因通过比较,我们可以在多种水平上更好的理解疟原虫 以及其它顶复门生物的生命现象 Fig. 2.1a Phylogenetic distribution of orthologous gene clusters. Fig. 2.1a 同源基因簇的系统发育树分布 进化树展现 12 个顶复门物种进化关系 2 种纤毛虫 (嗜热四膜虫 Tetrahymena thermophila,草履虫 Paramecium tetraurelia)作为对照种(outgroups) ; 物种名称及缩写、基因组大小(Mb) 、染色体数目(Chr#)在图中已标明 Protein#,表示每个物种已注释的编码蛋白的基因数目; 嗜热四膜虫 T. thermophila 的大核基因组约 225 个,草履虫 P. tetraurelia 大核 基因组约 50 多个; 线上的数字和标有+号的数字表示,分支以下的所有谱系中存在的编码同源 蛋白的基因数目; 线下的数字和标有-的数字表示,分支以下的所有谱系中缺失的编码同源蛋 白的基因数目; 节点指示的是谱系特异性的水平;节点 1 的基因是进化树中所有物种共有 的,节点 5 基因只是疟原虫属独有的。
进化关系进化关系 顶复门大约有 5000 个物种,几乎全部是寄生非寄生的是 Nephromyces, 它与一种海鞘类的背囊动物共生 顶复门的寄生, 是源自纤毛虫和甲藻 顶复门, 除了隐孢子虫属,都有一个非叶绿体的藻类来源的质粒,即顶质体这种质粒起 源于一种红藻和另一个真核细胞次级共生关系 但对于这种顶质体的最初起源还 不清楚但是数据比对分析发现,与具有光合作用的 Chromera velia 有很高的相 关性由此,对比分析的方法可以帮助我们理解顶复门的进化 顶复门最近的共同祖先生活于大约 3.5-8.24 亿年前,又有报道为约 4.2 亿年 前表 2.1a 中的 12 个物种并不是一致出现的,高度不同的门可分为 4 大类:血 孢子目(haemosporidia,疟原虫) ,梨形虫目(piroplasmida,Theileria/Babesia),球虫目 (coccidia, toxoplasma/Neospora/Sarcocystis/Eimeria) 以及可能为昆虫的隐 孢子虫疟原虫与梨形虫的分化估计发生在大约 3 亿前 顶复门具有复杂的生活史,一般有 1 个或 2 个宿主以及几个时期:入侵的单 倍体子孢子,在细胞内有一定区域,有性的配子体,双倍体的动合子以及含有单 倍体的卵囊。
在这些时期里,其宿主,入侵机制,入侵的细胞类型以及复制策略 都显著不同疟原虫和梨形虫依靠 2 个宿主,最初的为昆虫宿主,分别为蚊子、 扁虱(ticks) ,脊椎动物宿主细胞根据物种不同有很多 感染人的疟原虫,一般入侵肝细胞,然后侵入红细胞,而泰勒虫感染红细胞 和白细胞,巴倍虫入侵红细胞表 2.1a 中的球虫 coccidians 和隐孢子虫 Cryptosporidium,不利用昆虫作为入侵载体,而是通过卵囊入侵,Coccidian T. gondii 能够入侵多种细胞,而隐孢子虫只入侵肠细胞每个谱系在于宿主相互作 用以及免疫逃逸方面都有特别策略 这些局限性和能力都是由它们的基因决定的 我们面临的挑战是,我们能否解密这些复杂过程的机制比较分析是一种策略 核基因组的基因组成核基因组的基因组成 哪些基因是物种特异的?属特异的?门共有的?有多种方法鉴定基因是否 来源一个祖先直系同源基因的出现和物种的分化一致,如此在各个分化出的物 种间存在某个特定的基因它们的是这个给定基因的复制,拥有相同的祖先,但 现在却在不同的物种中直系同源的计算采用“clusters” ,是一种研究一组物种 比如顶复门的基因获得与丢失有力工具。
我们可以问什么基因是所有物种共有的 基因, 什么基因是物种间特有的基因的?在一个物种家族中丢失了什么基因,又 获得了什么基因?;例如,疟原虫的哪些基因在顶复门组具有同源基因?结果非 常出人意料的少, 只有 837 个同源基因簇包含的基因在已测序的顶复门基因组中 出现 根据全部的编码蛋白的基因,只有 11-23%的顶复门保守基因,如表 2.1a; 这些基因代表了 601 个囊泡虫(纤毛虫和顶复门虫)共有的直系同源基因(node 1 in Fig.2.1a)和 236 个顶复门共有的,但是纤毛虫丢失的直系同源基因其它的 基因是家族基因或者物种特有基因以及物种或者谱系改编的基因等 表 2.1a 中的每个节点,用来评估直系同源的基因数量,这些直系同源的基 因是从节点到进化树末端所有子物种共有的,用+号表示内部节点的-号后的数 字表示,进化分枝图上所有物种直系同源基因数目,除了这些物种的基因数目 这些基因暗示顶复门谱系的基因的丢失、变化及保守情况也有许多更复杂的基 因丢失和共有模式,但未列出(Kuo and Kissinge,2008) 837 个顶复门共有的 直系同源基因,可以认为是所有物种需要的“core set(核心集合) ” ,无须惊讶, 这些基因主要是和基本的代谢过程有关如转录和翻译。
在这些对所用顶复门必需的基因核心集合中, 有一个决定其成为顶复门生物 的基因的内核集合当靠近进化分枝图顶端时、表示每个谱系差异化的保守、获 得的以及与其它谱系比较丢失的多组基因 某种程度上, 基因群组的数目可以作为某些生物因素的指示 例如, T.gondii 物种特有基因数量最大(Fig.2.1a,+1467) ,也是宿主最多的,很有可能与其比其 它物种具有更多的代谢途径和过程有关 同样地,疟原虫属有很多物种特有的基因,大部分和抗原变化有关而其它 与生活史或谱系特殊的生活方式有关的基因是共有的, 比如糖能量来源 (海藻糖、甘露醇)分别存在于隐孢子虫属、艾美球虫属(Eimeria)卵囊,以及与不同顶复 门原虫入侵不同组织有关的一些保守的和一些特别的蛋白家族 分析完共有的基因, 我们可以开始回答谱系以及物种特有的基因有关的疑问 了哪些基因是疟原虫(或其它任何顶复门谱系)有,而其它物种没有的? 除了所有顶复门原虫共有的核心集合基因外, 还有一些基因是谱系或物种特 有的在疟原虫中,只有 85%基因是直系同源的,其它是疟原虫物种特有的和在 进化、适应环境和生活方式中出现了变化的基因谱系特有的、物种特有的基因 基因以及多拷贝基因在于宿主相互作用中需是完整的。
那么这些谱系、物种特有 的以及多拷贝基因的起源是什么?多数通过横向转移或者重头创造(如下) 。












