转座元件transposable elements能够在基因组中进行自我拷贝,并可以转移其他基因区域。即使没有给宿主细胞带来很多好处,这些转座元件仍然能够长期在群体中维系。转座元件是在上世纪40年代末期,研究玉米的时候发现的。随后的大量研究证实,转座元件几乎存在于所有真核生物中。在玉米中,转座元件可以占全基因组的80%,有些元件可以长达20Kb,而且还会含有编码区,基因调节区等。转座元件不仅十分显著的影响了染色体结构、基因组大小等,还会影响到个体的适应性。

果蝇是常用来研究转座元件的对象。整个果蝇属含有数千种果蝇物种,它们的共同祖先源于2500万-4000万前。其中,最著名的黑腹果蝇。黑腹果蝇起源于非洲,随后遍布了除南极洲以外的世界各个大洲,与人类共栖生活。在1万5千年-2万年前,黑腹果蝇就已经从非洲扩展到了欧洲和亚洲,大概在200年之前,由扩展到了澳大利亚和美洲。因为其世代时间短,易于繁殖,所以成为 了广泛应用的模式生物。此外,黑腹果蝇基因组较小,有利于转座元件的研究。除了黑腹果蝇,另一种拟果蝇D. simulans(拟果蝇)也是常用果蝇物种之一,它和黑腹果蝇分化于150万前,分布同样很广泛,不过拟果蝇常常在森林环境中,离人居环境比较远。

转座元件多样性

分类

对转座元件的分类一直备受争议,比如如何分类能够反映转座元件的系统进化关系?一般来说,根据进化关系分类是最好的分类方式,但是对于转座元件,这么一种分类方法却很难实现。首先,转座元件的进化关系通常和物种关系并不一样,所以很难通过物种关系建立转座元件的进化关系。其次,一些转座元件不含有编码区,而另一些转座元件可能会含有多个编码区,而且有些转座元件会在基因组中有上千份的拷贝,所以,通过常规方法建立转座元件的进化关系很困难。

目前,通用的对转座元件的分类不是依据其进化关系,而是依据转座机制、序列相似度和结构关系。首先根据转座机制,可以将转座元件分为RNA介导的转座非RNA介导的转座

  1. 逆转座子

逆转座子的转座依赖于RNA的介导。首先是基因组DNA转录为RNA中介,然后通过TE编码的逆转录酶将此RNA逆转录成DNA。每完成这么一个循环就产生一个新的转座序列。

逆转座子可以进一步分为5类:长末端重复序列逆转座子(LTR),DIRS样元件、PLEs、长散布核元件(LINEs)和短散布核元件(SINEs)。其中LTR和LINEs是最常见的

在果蝇中,LTR通常较长,可以达到5-7Kb大小,因其两端含有长末端重复序列(300-400bp)而得名。LTR上通常含有两个基因:gagpol。其中gag编码衣壳,pol编码一个蛋白酶Prot、一个整合酶Int和一个含有RNA酶结构域的逆转录酶RT。经过转录之后,一些转录下来的序列会被翻译成上述几种蛋白,另一些序列不会被翻译。Gag蛋白会组合成衣壳,并包裹那些未被翻译的序列、整合酶、逆转录酶和tRNA,进而形成一个核糖核蛋白复合体,该过程也称之为顺式核糖核蛋白组装。使用其中的tRNA作为引物,逆转录酶将复合体中的未被翻译的序列逆转录成双链DNA。逆转录完成之后,复合体会分解,其中的整合酶将合成的双链DNA插入到宿主基因组中。在整合的时候,LTR转座子会产生一个4-6bp的目标靶点重复序列。

LTR可以进一步分为5个超家族:Copia、Gypsy、Bel-Pao、Retrovirus(逆转录病毒)和Endogenous RetroVirus(内生性逆转录病毒,ERV)。其中,逆转录病毒和内生性逆转录病毒还含有一个env基因,该基因表达的蛋白可以使得病毒感染其他细胞。

和LTR相比,LINEs通常短一些,大概在3-5Kb大小,通常含有2个开放阅读框。第一个开放阅读框含有一个RNA结合位点,第二个开放阅读框编码含有两个结构域的蛋白:核酸内切酶结构域和逆转录酶结构域。和LTR不同,LINE转录翻译之后形成的蛋白会和自身mRNA组合(而非其他未翻译的mRNA序列),在细胞质中形成核糖核蛋白复合体,该过程也称之为反式核糖核蛋白组装。该复合体随后会返回细胞核中,其中的核酸内切酶会将宿主DNA的一条单链切断,并以此作为插入点。随后进行逆转录过程,新合成的DNA的序列插入到宿主基因组中。

LTR和LINEs在果蝇中非常常见,DIRS和SINEs至今尚未在果蝇中观察到,PLEs在D. virilis果蝇中有过发现,其转座机制和LINEs有些相似。

果蝇中的转座元件_java


  1. DNA转座子

DNA转座子的转座不需要RNA介导,可以分为4类:末端倒置重复转座(TIR)、Crypton、Helitron和Maverick

在黑腹果蝇中,TIR转座元件在1.5-3Kb大小,只编码一个蛋白:转座酶Tase。两个转座酶识别并结合TIR序列,然后两个转座酶切开TIR序列,组合成二聚体,形成一个可以自由移动的转座复合体。其后,该复合体会结合到靶标DNA位点,并将其含有的转座序列整合到宿主DNA上。虽然在整过程只是一个序列的转移,没有序列的扩增,但是TIR仍然可以通过以下两种方式来实现扩增的目的:染色体复制期间的转座,从已经复制完成的染色体上转移到正在复制的染色体上,借助宿主基因组的复制来达到扩增的目的;转座时在供体DNA上留下的剪切缺口可以复制出一个新的拷贝。

Hilitron是另一类常见的DNA转座子,通常较小,在果蝇中<1Kb,只编码一个含有解旋酶和复制子结构域的蛋白。由于Helitron发现时间较晚(2001年),所以目前对Helitron的转座机制还不明确。有人认为,Helitron表达的蛋白会结合到Helitron上,然后在正链DNA上剪开一个切口,进而进行DNA复制,并形成一个双链Helitron转座子,该转座子可以结合靶标DNA,将其含有的序列整合到宿主DNA中。

转座元件的丰度

  1. 黑腹果蝇基因组

使用RepeatMasker对果蝇基因组的片段和RepBase数据库中的转座元件序列进行了比对。结果发现,在黑腹果蝇基因组中有20%的序列是转座元件。当然,由于组装基因组质量差异等原因,不同的研究得到的数据有一定的差异。有研究估计果蝇基因组中的转座序列约占基因组的2%-8%。虽然这一估计有差异,但是各类转座元件的丰度在不同的果蝇中的分布很相似,逆转座子(LTRs和LINEs)占了转座元件的很大一部分;而DNA转座子的占比相对较小。DNA转座子大概只有逆转座子丰度额1/10,一个可能的原因是逆转座子比DNA转座子大。

果蝇中的转座元件_java_02

  1. 丰富的种间差异

转座元件的种间比较存在很多不确定因素,比如基因组质量、使用的测序库、检测方法等都会影响对转座元件的识别。此外,相比于一代和三代测序,二代短读长测序往往会造成对转座元件的低估。在果蝇中对转座元件丰度的研究发现,有些方法检测结果在1%-9%,而有些方法的检测结果在3%-30%。其中,D. ananassae果蝇中的转座元件丰度最高。在研究的果蝇物种中,一般是LTRs > LINEs > TIRs > OTHERs,但是很多研究也发现例外情况。总之,对果蝇物种转座元件的研究得到的结果差异很大。

为了进行种间比较,本研究选取了黑腹果蝇、拟果蝇和D.virilis三种,使用同样的检测方法对各种转座元件的含量进行了比较,结果见上图。

  1. 丰度的种内差异

转座元件在物种内也存在很大差异,比如含有不同转座元件(比如I元件,P元件,Hobo等)丰度的亲代果蝇交配产生的后代有的可育,有的不育。如下图:

果蝇中的转座元件_java_03

有研究估计黑腹果蝇中的P元件来自于D. willistoni果蝇的水平传播,并在1950-1990年期间逐步扩散到全世界。同样的,拟果蝇中的P元件来自黑腹果蝇的水平传播。对黑腹果蝇、拟果蝇和D. yakuba果蝇的研究显示它们基因组中有1/3的转座元件是由于近期水平传播造成的。

对不同拟果蝇群体转座元件的研究,发现各个群体之间转座元件含量差异很大,其中至少有14类转座元件只出现在一个果蝇群体中。此外,还有一个转座元件含量在拟果蝇群体中表现出梯度变化,从南非的1-10个逐渐增加到在欧洲的23个。

在D. subobscura果蝇中,Bilbo和Gypsy两类转座元件在果蝇的新迁入地比起源地有更多的拷贝数。在D. buzzatii果蝇中,Bilbo和Osvaldo两类转座元件表现出了同样的拷贝数差异。这可能是由于种群迁入造成的的建立者效应,同时伴随着遗传漂变,造成了转座元件含量在迁入地和起源地之间的差异。

转座元件活性

  1. 转座率

通过150代果蝇在实验室中累积突变的研究发现,在果蝇中转座的发生率比点突变率略低果蝇中的转座元件_java_04【点突变率是果蝇中的转座元件_java_05】。其中插入率比删减率要高,对于整个基因组,每代大概发生0.57个插入,0.037个删减。

  1. 转座爆发

除了正常的转座发生外,很多研究发现在果蝇中存在转座爆发情况,即在较短的进化时间内,有大量的转座事件发生。虽然发生的具体原因还不明确,但是常常伴有外界压力,比如极端气温条件、射线、化学暴露和病毒感染等。研究发现,伽马射线的照射可以将412转座元件的发生率增加到5.6个/每代。但是有些研究发现,外界压力条件也可能会抑制转座的发生。

面对外界压力,转座元件可能会表现出压力特异性转录激活子的结合位点(比如像某些转录因子)。Mariner和Copia两种转座元件在面对外界温度变化时会表现出热休克蛋白扩增子的同源序列。通过转录组学的研究,发现温度依赖的转座元件的表达具有家族特异性和遗传背景特异性,也就是说转座元件转录的发生受到家族特性调节序列和宿主顺式反应因子的交互作用。不过,上述这些研究都是在实验室条件下进行的,在自然条件下上述结论是否还能够成立还不得而知。但是在自然条件下确实观察到了转座发生和外界环境压力的相关性。

此外,当正在分化的基因组发生杂合的时候,也可能会影响到转座的发生。很多研究发现杂合之后通常会提高转座的发生。并且导致包括不育在内的性状的产生。导致这种现象的原因可能是杂合宿主对转座元件的抵抗力下降造成的。

  1. 转座元件活性的种间差异

在2011年有研究比较了黑腹果蝇、拟果蝇、D. sechellia和D. yakuba四种果蝇的转座元件情况,发现相比于黑腹果蝇,其他三种果蝇中转座元件有大量的降解,也就是说黑腹果蝇中的转座是近期发生的。下图比较了黑腹果蝇和拟果蝇中各种转座元件大小(纵坐标)和分化时间(横坐标,即转座发生的时间)之间的关系:

果蝇中的转座元件_java_06

转座发生时间越久,转座元件因为降解而变得越小。其中黑腹果蝇的转座事件大多是近期发生的。

另一个对黑腹果蝇和拟果蝇的比较发现,两种果蝇中有超过58个转座元件家族处于高度活跃的状态,其中逆转座子在黑腹果蝇中更活跃,而DNA转座子在拟果蝇中更活跃。

转座元件带来的影响

  1. 对基因组的影响

转座元件能够形成导致各种变异,对基因组的结构进化有重要的意义。这些变异包括:染色体重排、基因结构改变和基因表达改变

造成染色体重排最主要的原因就是异位重组。根据转座元件位置和方向的不同,异位重组可能导致4种染色体结构变异:重复、缺失、插入和异位。当一个转座元件插入一个基因或者基因的调控序列时,会改变基因的表达。比如,在伯克利果蝇基因组研究中,研究者就是使用P元件的插入来改变一个基因的表达,从而推测该基因作用。转座元件通常通过两种方式来改变受其影响基因的表达:携带调控序列插入可以改变相应基因的表达;针对转座元件的抑制性表观遗传标记能够抑制邻近基因的表达。其中第二种改变基因表达的方式更为普遍,并且其影响的距离可以长达20Kb。

  1. 对个体的影响

在果蝇中,转座元件导致了高达80%的表型自发变异,其中很多对个体是有害的。比如有5%-10%P元件插入会导致果蝇隐形致死。在拟果蝇中,Mariner转座元件会导致个体寿命的缩短。在2004年对两个果蝇种群的研究发现,转座元件拷贝数的不同会导致果蝇适应性差异和卵的孵化率差异:含有更多转座元件的果蝇适应性减低,卵孵化率也降低。一般转座元件的插入对宿主基因组是有害或者中性的,很少是有利的。在2005年有研究认为自从黑腹果蝇和拟果蝇分化以来,只有200个插入在黑腹果蝇物种中固定了下来,也就是说大概每1万年会有1.4个插入在种群中固定。这是一个上限估计值,很多插入固定发生在选择作用很弱的基因区域,所以这些插入受到的遗传漂变的作用可能会比自然选择的作用更大,因而固定发生会更慢一些。

不过,在黑腹果蝇基因组中,却存在很多转座元件(尤其是插入)介导的适应事件的发生,这些转座元件通常邻近某些基因,或者位于某些基因内部,而这些受影响的基因通常是和应激反应、行为、发育等生物行为相关。比如,在黑腹果蝇和拟果蝇中,一个发生在cyp6g1基因上的插入就导致了果蝇氧化应激水平的改变。

  1. 端粒

在果蝇基因组中,少数转座元件进化出了一些新的功能。众多周知,由于DNA复制机制的原因,每次复制会导致染色体末端损失70-80个碱基,这会威胁到染色体内部基因的完整性,并且还可能与个体的衰老有关。真核生物通常有端粒酶来弥补染色体末端的碱基丢失。在果蝇中,有三个转座元件家族,HeT-A , TART和TAHRE转座到染色体末端,从而避免了染色体缩短。在其他很多物种中,也发现了和端粒相关的逆转座子,这些逆转座子多属于jockey超家族。而且这些逆转座子的进化关系和物种的进化关系是一致的,转座子和宿主基因组可以说是一种共生关系。

宿主防御

因为插入等转座事件往往对宿主造成有害的影响,所以宿主也会进化出一些防御机制来抵抗转座带来的害处。比如在哺乳动物和植物中,插入往往伴随着DNA甲基化和组蛋白修饰。但是在果蝇中,DNA的甲基化很少发生,而与微小RNA相关的机制在抵抗转座元件中发挥了重要的作用。其中涉及到的微小RNA主要是:piRNA和siRNA

  1. piRNA通路

piRNA通路能够产生微小的单链RNA,通常只有23-30nt长,然后和Piwi亚家族的Argonaute蛋白结合,形成piRNA。在生殖细胞中,piRNA能够抑制转座元件的活性,以此来保持生殖细胞基因组的完整性,避免转座元件造成的新突变对子代产生不利影响。在卵子形成的相关细胞中,也存在piRNA通路,阻止Gypsy等内源性逆转录病毒感染邻近卵细胞。

piRNA源于基因组中很多散布的位点,也称之为piRNA簇,这些基因簇含有存在缺陷的转座元件。这些基因簇可以转录出很长的piRNA前体。在黑腹果蝇中,已经发现了150个piRNA基因簇,占果蝇基因组的3.5%,它们的大小差别很大,其中较大的可以长达240Kb,前15个最大的piRNA簇产生的piRNA占总体的70%。piRNA对转座元件的抑制有两个途径,一个是ping-pong途径,另一个是phased piRNA途径。具体过程如下图所示:

果蝇中的转座元件_java_07

  1. siRNA通路

内源性小干扰RNA(endo-siRNA)是宿主细胞抵抗转座元件的另一种方式。这些小RNA不仅存在于生殖细胞中,也存在于体细胞中。通过三种方式产生一个长双链RNA(上图),Dcr-2将该双链RNA剪切成短双链RNA,然后和Ago2结合,Ago2将双链RNA的辅助链去掉,仅保留引导链。这样就形成了一个成熟的RISC复合体,该复合体可以与转座元件mRNA结合,并通过Ago2的RNA酶域将转座元件RNA降解。

  1. 进化

有不少研究发现果蝇中抗转座元件的RNAi基因正在经历快速进化过程。这些基因通常表现出正向选择信号。我们知道,宿主-病原体之间的作用是很多基因受到正向选择的原因,同样的,转座元件和抗转座元件之间的相互作用,相互竞争也是相关基因快速进化的原因。

对于piRNA通路,有研究认为正向选择会倾向于选择那些对转座元件敏感且特异的基因变异类型,从而导致相关基因的进化。如果只是敏感,而不特性,可能会导致piRNA通路不仅抑制了转座元件,也会影响到邻近正常基因的表达,也就是“基因组的自身免疫”问题。

对20余种节肢动物的研究发现,piRNA通路可能在5亿年以前的共同祖先中就已经存在了,而且在D. virilis果蝇的体细胞中也存在该通路。而黑腹果蝇中,只有生殖细胞中才能观察到piRNA通路,说明在进化过程中,黑腹果蝇的体细胞丢失了piRNA通路。

群体基因组

  1. 对转座元件的负向选择

通过原位杂交技术,有研究发现果蝇中转座插入在群体中大量低频出现,比如在黑腹果蝇和拟果蝇中,有超过80%的插入频率<0.2。究其原因,可能是由于长期对插入负向选择purifying selection的结果

首先,基因表达异常是插入经常导致的结果,不管是插入发生在基因内部还是基因表达调控区,都可能会给个体带来不利的影响。大量的研究也证实,在基因外显子区域的插入要远远比其他基因区域少,说明负向选择对插入有重要作用。

其次,转座元件导致的异位重组也是负向选择的重要靶标。转座元件的大小、拷贝数、重组率等都和异位重组率呈正相关关系,进而也应该和负向选择的强度呈正相关性。转座元件越长,受到的负向选择压力应该越大。很多研究发现转座元件大小和其在群体中的频率成负相关性,进而证实了上述假设。拷贝数越多,发生异位重组的可能性越大。此外,异位重组和局部基因组重组率紧密相关,低重组区会富集更多的转座元件。不过对X染色体的研究却发现相反的结果。X染色体的重组率很高,理论上应该会有较少的转座元件,但是果蝇中X染色体上转座元件的密度并不比常染色体低,甚至还要高一些。有人认为这可能是转座事件在X上的发生率要比常染色体高的原因造成的,因为研究显示X染色体上的插入率是常染色体的1.86倍。

最后,转座元件的表达产物可能对细胞不利,因而造成负向选择。转座元件转录和翻译的过程会消耗细胞资源,干扰正常的细胞生物过程。

  1. 转座元件动态模型

转座元件在群体中动态变化模型有两个:转座-选择平衡模型转座爆发模型

转座-选择平衡模型认为群体中的转座元件的丰度受到转座发生情况和负向选择两种事件的共同作用,前者增加转座元件的丰度,后者倾向于清除群体中的转座元件。

转座爆发模型认为群体中的转座元件主要是由于转座短时间内大量发生导致的。群体中观测到的大量低频转座元件并不是由于负向选择作用造成的,而是由于转座事件大量出现造成的,而且这些转座尚处于早期,所以频率比较低。

从实验数据来看,转座-选择平衡模型似乎更接近实际情况

此外,还有一种“陷阱”模型,主要是针对piRNA通路,有些逆转座子入侵宿主基因组后会不停的扩增,直到有逆转座子不幸插入到piRNA序列中,这时piRNA的通路会抑制该逆转座子家族的活性,进而减少逆转座子对宿主基因组带来的伤害,减少受到的负向选择压力。在拟果蝇中,P元件的入侵过程就可以用“陷阱”模型来描述:首先P元件插入宿主基因组;其次出现插入到piRNA中的P元件,但是此时尚不足以导致P元件停止扩增;插入piRNA中的P元件在群体中达到很高的频率,甚至固定下来,此时P元件的扩增被终止。这一模型准确预测了黑腹果蝇生殖细胞中转座元件的动态变化。而且还发现,转座发生率和群体数量大小是影响这一过程持续时间长短的关键因素。

总结

虽然转座元件在各个物种中的含量有很大差异,但是它的确占了基因组的不小的一部分。转座元件按照转座机制,可以分为逆转座子和DNA转座子,前者最常见的是LTR和LINEs,后者最常见的是TIR、Helitron等。转座元件可以长达数Kb大小。转座发生率比点突变的发生率略多,有些研究认为转座发生存在爆发期,当群体受到较大的外界环境压力时,也更容易发生转座。转座元件的水平转移是很常见的现象,对转座元件的扩散有重要作用。转座发生时,往往会改变宿主基因的结构或者表达,有时还会造成异位重组,给宿主基因组带来的弊远远大于利,所以转座子常常受到负向选择作用。同时宿主细胞也进化出了一些机制来抵抗转座元件,比如通过piRNA和siRNA通路等防御,相关的基因有时表现出正向选择信号。

【谢谢阅读,欢迎转发分享】


资料来源:Mérel, V., Boulesteix, M., Fablet, M., & Vieira, C. (2020). Transposable elements in Drosophila. Mobile DNA, 11(1), 1-20.

果蝇中的转座元件_java_08