跳动百科

深层蛋白质组项目为人类复杂性提供图谱

邰初园
导读 生物学的一个主要难题是,虽然人类基因组包含大约20,000个基因,但许多相对原始的生物 - 包括普遍研究的蠕虫秀丽隐杆线虫 - 具有几乎

生物学的一个主要难题是,虽然人类基因组包含大约20,000个基因,但许多相对原始的生物 - 包括普遍研究的蠕虫秀丽隐杆线虫 - 具有几乎相同数量的基因。

如果不是基因本身,那么是什么解释了两个物种之间复杂性的巨大飞跃?

一个答案可能在于蛋白质组学领域,该领域专注于识别和定义构成单个细胞的蛋白质构建块。人类基因不是用一个基因编码一种具有单一目的的蛋白质,而是像强大的压缩文件一样,单个基因可以编码数百种不同的蛋白质,每种蛋白质在体内执行精确的功能。

多达95%的人类基因具有这种能力,称为选择性剪接。

今天(24月<>日)发表在《自然生物技术》杂志上的一项新研究概述了一种量化人类蛋白质组和人体产生的大量蛋白质变异的元尺度方法。蛋白质组学是生物学的基石,也是了解蛋白质功能障碍如何导致疾病的先驱。

在威斯康星大学麦迪逊分校生物分子化学教授兼Morgridge研究所研究员Joshua Coon的带领下,研究小组开发了一种称为“深度蛋白质组测序”的方法,该方法为标准蛋白质组学实验中出现的蛋白质提供了前所未有的表征。

该项目使用了六种不同的人类细胞类型和六种蛋白酶 - 将蛋白质分解成更小片段(肽)的酶,作为实验中检测的原材料。然后,该团队通过采用不同的质谱方法分析肽,这是鉴定蛋白质的领先技术。

研究人员从1,17个不同的蛋白质组中鉴定了超过717万个肽。从这些数据中,他们能够检测到这些样品中所有单个蛋白质的大约80%的序列 - 与仅测序~20%蛋白质的标准方法相比,有了很大的增加。

实现这一更完整的画面是蛋白质组学的圣杯。

“在质谱和蛋白质组学领域,一直有一个目标,即检测样品中存在的所有蛋白质,然后对存在的所有单个蛋白质进行完全测序,”Coon说。“但我们真的没有检测到整个蛋白质,只是它的一小部分。

“这项研究产生的数据代表了迄今为止收集的最深入的蛋白质组学图谱,”Coon补充道。“这些方法和资源为蛋白质多样性的全面绘图奠定了基础,并有望催化未来的研究工作。

研究小组创建了一个名为 deep-sequencing.app 的在线公开资源,科学家可以在其中查询任何基因并检查与该基因相关的相应肽和蛋白质修饰。

该项目主要由美国国立卫生研究院赞助,得到了德国马克斯普朗克生物化学研究所,加拿大多伦多大学和澳大利亚加文研究所研究小组的主要投入。帕维尔·西尼特钦(Pavel Sinitcyn)是马克斯·普朗克研究所(Max Planck Institute)的科学家,现在是库恩实验室(Coon Lab)和莫格里奇跨学科博士后研究员(Morgridge Interdisciplinary Postflow)的博士后,他领导了一个项目的大规模数据分析工作,该项目在10年内产生了超过<>TB的数据。在多伦多,调查员本杰明·布伦考(Benjamin Blencowe)提供了替代剪接的专业知识。

科学家们对选择性剪接对蛋白质多样性的贡献有多大存在分歧,主要是因为该过程很难在蛋白质水平上检测到。Coon Lab项目是第一个专门针对实际蛋白质中剪接事件的证据的项目。他们发现,在基因表达的RNA阶段检测到的大多数替代剪接也存在于蛋白质中。

“我认为这些知识告诉我们,是的,这些关于剪接的想法 - 允许细胞拥有用于不同目的的蛋白质库 - 现在已经得到验证。这是我们第一次能够测量并证明它,“库恩说。

在马克斯普朗克研究所期间,Sinitcyn在Jurgen Cox的实验室工作,Jurgen Cox是计算质谱领域的世界领先的生物信息学小组。Sinitcyn 开发了软件解决方案,能够检测质谱数据中单个氨基酸变异和替代剪接的证据。

“我们正在处理来自异构来源的超过 5 TB 的数据,因此我们的第一个问题是找到一种方法来解释产生误报的高概率,”Sinitcyn 说。“但第二个问题,令人兴奋的问题,实际上是为了证明这个数据集与重要的生物学问题的相关性。