我们DNA中的每个基因都有开始和结束。正确定义基因的四肢对于产生功能性蛋白质至关重要。已经进行了大量研究,以确定是什么决定了基因在DNA上“开始”的时间,地点和哪个位点。但基因的终点是另一回事——转录终止位点的选择被认为取决于下游元素和外在因素。
在他们最近发表在《细胞》杂志上的研究中,马克斯普朗克免疫生物学和表观遗传学研究所的研究人员做出了令人惊讶的发现,对于我们的大多数基因来说,转录开始的位点决定了转录结束的位点。这种现象在物种之间非常保守,并且在转录的最初阶段就预先决定了mRNA末端位点,并且在细胞身份和功能中起着至关重要的作用。
生物体中的所有细胞都包含相同的DNA序列。决定单个细胞和组织的身份和功能的是一组在给定时间在特定地点活跃的基因。这些活性基因从DNA模板转录成不同的信使RNA(mRNA)分子,并将编码细胞发挥作用所需的蛋白质。
在称为启动子的特定位置,复杂的分子机器开始将DNA序列转录成mRNA。有趣的是,大多数基因包含多个可能的位点,转录可以开始或结束。这意味着对于每个基因,根据起始位点或终止位点,mRNA可能不同。在不同的变异中表达一个基因可以多次扩展基因组的多样性和功能。同时,它为基因组研究增加了另一层复杂性。
从头到尾的RNA快照
弗莱堡马克斯普朗克免疫生物学和表观遗传学研究所的科学家想知道每个基因使用多少个不同的起始位点和终点位点,在哪种组合中,以及这些组合在不同条件下是否不同。“回答这个问题的技术问题是,我们必须从头到尾读取所有基因的每一个mRNA分子。这是一项以前从未承担过的巨大任务,“MPI-IE的研究小组负责人Valérie Hilgers说。
科学家们使用经过调整的下一代测序技术来读出单个mRNA。对于传统的短读长测序,每个mRNA被分解成较短的片段,这些片段被扩增,然后测序以产生读段。然后使用生物信息学技术将读数像拼图一样拼凑成一个连续的序列。
对于包括大脑在内的几种果蝇组织中整个基因组的全长mRNA信息,Hilgers与MPI的深度测序设施合作,以优化特定的长读长测序技术。“长读长测序允许检索比广泛使用的标准测序更长的测序读段。然而,我们甚至不得不优化这项技术,并将典型的读取长度增加几倍,以便在我们不同的模型系统中获得全长mRNA信息,“该出版物的第一作者Carlos Alfonso-Gonzalez说。
除了果蝇,希尔格斯实验室还将神经系统的人类模型纳入他们的研究:大脑类器官 - 在诱导多能干细胞培养的培养皿中的“迷你大脑”。转录结束位点在转录开始时预先确定。
在全分子尺度上代表每个mRNA的收集数据为单个基因的转录提供了前所未有的洞察力“我们意识到,远非起始位点(TSS)和终止位点(TES)随机组合在一起,我们发现转录起始位点通常与转录结束的不同位点特异性相关,”Hilgers说。
这种联系实际上是因果关系:例如,在卵巢中,通常只在大脑中使用的TSS的人工激活覆盖了正常的TES,并人为地诱导了大脑TES的使用。这表明TSS在塑造每个组织特有的RNA景观中的关键作用,从而影响组织身份。
启动子优势推动RNA多样性、基因功能和组织特性
然而,有一个现象很突出。“某些TSS表现出意想不到的支配行为。它们推翻了结束转录的传统信号,胜过其他TSS,并导致选择不同的TES。因此,我们称他们为主要发起人,“阿方索-冈萨雷斯说。
此外,研究小组发现,这些显性启动子与其相关基因末端之间的相互作用是由不同的表观遗传特征引导的。重要的是,果蝇脑细胞的结果可以在人脑类器官中复制,表明启动子优势是一种保守的,也许是通用的机制,用于调节功能蛋白的产生和细胞的功能。
这种新机制的生理相关性是什么?通过深入的序列保守分析,弗莱堡研究人员发现TSS和TES表现出共同进化:在物种之间数百万年的进化中,基因中从显性启动子开始的单个核苷酸变化伴随着相应基因末端的变化。
“我们将这一观察结果解释为推动进化,以维持基因两端之间的相互作用,这意味着这些耦合对动物健康的重要性,”Valérie Hilgers说。