尽管它是生物体中几乎所有过程的基石,但生物蛋白质的正确折叠和运输是众所周知的实验研究困难且耗时的过程。
在eLife发表的一篇新论文中,生物科学学院和计算机科学学院的研究人员表明,AF2Complex 或许可以助一臂之力。
基于 DeepMind 的 AlphaFold 2 模型,AF2Complex(AlphaFold 2 Complex 的简称)是一种机器学习工具,能够预测单个蛋白质的详细三维结构,是一种深度学习工具,旨在预测多种蛋白质的物理相互作用。通过这些预测,AF2Complex 能够以前所未有的细节计算出哪些蛋白质可能相互作用以形成功能复合物。
“我们基本上进行了计算实验,试图找出对生物功能很重要的超复合物(大型相互作用的蛋白质组)的原子细节,”摄政教授兼生物科学学院玛丽和梅西吉布森 Jeffrey Skolnick 解释说,并且该研究的通讯作者之一。去年由同一个研究团队开发的 AF2Complex,“就像使用由深度学习和超级计算提供支持的计算显微镜”。
在他们的最新研究中,研究人员使用这种“计算显微镜”来检查复杂的蛋白质合成和运输途径,希望阐明该途径中的蛋白质如何相互作用以最终将新合成的蛋白质从细菌内部运输到外膜——并确定实验可能遗漏的球员。对该途径的深入了解可能会确定抗生素和治疗设计的新目标,同时为使用 AF2Complex 在计算上加速整个此类生物学研究提供基础。
计算综合体
AlphaFold 2 由总部位于伦敦的人工智能实验室 DeepMind 创建,是一种深度学习工具,能够仅使用其构建块氨基酸生成关于单个蛋白质三维结构的准确预测。更进一步,AF2Complex 使用这些结构来预测蛋白质能够相互作用形成功能复合物的可能性,每个结构的哪些方面是可能的相互作用位点,甚至哪些蛋白质复合物可能配对产生甚至更大的官能团称为超复合物。
“今年早些时候 AF2Complex 的成功开发让我们相信,这种方法在识别和表征对生命很重要的一组蛋白质-蛋白质相互作用方面具有巨大潜力,”佐治亚理工学院高级研究科学家 Mu Gao 分享道。“为了进一步说服广大的分子生物学界,我们 [不得不] 用更有说服力、影响更大的应用来证明它。”
研究人员选择将 AF2Complex 应用于大肠杆菌 (E. coli) 中的一条通路,大肠杆菌是生命科学研究中的一种模式生物,由于其相对简单和快速生长,通常用于实验性 DNA 操作和蛋白质生产。
为了证明该工具的强大功能,该团队检查了对交换营养物质和应对环境压力至关重要的蛋白质的合成和运输:外膜蛋白,简称 OMP。这些蛋白质位于革兰氏阴性菌的最外层膜上,革兰氏阴性菌是一大类细菌,其特征是存在内外膜,如大肠杆菌。然而,蛋白质是在细胞内产生的,必须被运送到它们的最终目的地。
“经过二十多年的实验研究,研究人员已经确定了一些关键参与者的蛋白质复合物,但肯定不是全部,”高解释说。AF2Complex “可以让我们发现 OMP 生物发生途径的一些新颖有趣的特征,这些特征在以前的实验研究中被遗漏了。”
新见解
使用橡树岭国家实验室的 Summit 超级计算机,包括计算机科学本科生 Davi Nakajima An 在内的团队对 AF2Complex 进行了测试。他们将一些已知在 OMP 的合成和运输中很重要的蛋白质与大约 1,500 种其他蛋白质(大肠杆菌细胞包膜中的所有已知蛋白质)进行了比较,以了解该工具计算出的哪对最有可能相互作用,以及哪对这些对很可能形成超复合物。
为了确定 AF2Complex 的预测是否正确,研究人员将该工具的预测与已知的实验数据进行了比较。“令人鼓舞的是,”Skolnick 说,“在计算筛选的热门结果中,我们发现了以前已知的相互作用伙伴。” 即使在那些已知相互作用的蛋白质对中,AF2Complex 也能够突出显示这些相互作用的结构细节,这些细节解释了以前实验的数据,从而为该工具的准确性提供了额外的信心。
除了已知的相互作用之外,AF2Complex 还预测了几个未知的对。进一步深入研究这些意想不到的合作伙伴,揭示了这些对的哪些方面可能相互作用以形成更大的功能性蛋白质组的详细信息、以前实验人员未能发现的复合物的可能活性配置,以及 OMP 合成和运输方式的新潜在机制。
“由于外膜途径对于革兰氏阴性菌来说既重要又独特,因此参与该途径的关键蛋白质可能成为新抗生素的新靶点,”Skolnick 说。“因此,我们提供有关这些新药物靶标的分子见解的工作可能对新的治疗设计很有价值。”
除了这条通路之外,研究人员还希望 AF2Complex 对生物学研究意义重大。
“与预测单个蛋白质序列的结构不同,预测超复合物的结构模型可能非常复杂,尤其是当复合物的成分或化学计量未知时,”高指出。“在这方面,AF2Complex 可能成为生物学家进行不同蛋白质组合试验实验的新计算工具,”可能会加快并提高此类生物学研究的整体效率。