跳动百科

研究人员使用人工智能探索潜在的人畜共患疾病

卫娟菡
导读 在 大流行期间,Timothée Poisot 和他的团队已经在努力研究一种预测哺乳动物和病毒之间相互作用的算法。大流行凸显了密切监测

在 大流行期间,Timothée Poisot 和他的团队已经在努力研究一种预测哺乳动物和病毒之间相互作用的算法。

大流行凸显了密切监测可能感染人类的病毒的重要性。在大流行的早期阶段,Timothée Poisot和他的同事已经在开发一种预测哺乳动物与病毒相互作用的算法。

“我们从 2020 年的头几个月开始,在大流行开始之前就一直在研究这个项目,”蒙特利尔大学生物科学系教授、病毒出现研究计划 (VERENA) 的成员 Poisot 说,这是一个位于华盛顿特区的国际研究机构。

仅仅三年多后,Poisot及其同事在Cell Press的高级开放获取期刊Patterns上发表了数千小时的计算和验证结果。

做出更好的预测

Poisot属于一个多学科研究小组,该团队希望更好地预测哺乳动物和病毒之间的相互作用。当满足某些条件时,病毒从一个物种传播到另一个物种最终会导致人畜共患病的出现 - 世界卫生组织将其定义为“从非人类动物传播到人类的传染病”。

根据Poisot的说法,“基本问题是我们只知道病毒和哺乳动物之间百分之一到百分之二的相互作用。这些网络是分散的,几乎没有相互作用,只集中在少数几个物种中。

尝试手动对所有相互作用进行采样将是一项艰巨的任务,特别是因为有数千种哺乳动物,甚至还有数千种病毒 - 导致无限的哺乳动物 - 病毒组合。

因此,Poisot和他的同事们试图开发一种使用机器学习的新算法,作为一种制定假设的方式,然后用于确定哪些宿主 - 病毒相互作用需要进一步探索。

“我们想知道哪种病毒可能会感染哪种哺乳动物,因此我们可以确定哪些相互作用最有可能发生,”Poisot说,他花了数千个小时与他的团队一起创建算法并改进。

“过时的名称和错误”

“我们拥有的一些数据集较旧:它们包含特定物种的过时名称,或者由于数据是手动输入而存在错误,”Poisot说。

第一项工作是清理和标准化数据,这是一项非常耗时的任务。一旦他和他的同事创建了算法,他们就必须对其进行改进。“我们算法的优势之一是你不需要很多信息来使用它,”Poisot说。

部署现有模型进行预测需要大量关于分类学、系统发育结构、采样数据等信息。为了解决这个问题,Poisot和他的团队开发的算法将系统表示为病毒和哺乳动物之间的相互作用网络,然后算法必须完成。

“该算法采用我们已经知道的网络,并将其投射到一个新的空间,有点像皮影戏:它以一种新的方式揭示了交互,”Poisot说。反过来,这使我们能够做出预测。

即便如此,做出这些预测需要在Calcul Québec的计算机上进行10,000小时的计算。将结果与已知的相互作用相匹配,该模型发现了病毒和宿主之间80,000个新的潜在相互作用。

“在那之后,”Poisot说,“主要任务是确定我们对模型预测能力的信心水平。该模型必须经过统计验证,这本身就要求研究人员使用非常不完整的数据发表一篇关于验证方法的文章。

监测 20 种关键病毒

然后,研究小组选择了20种值得监测的关键病毒,因为它们有可能跨越物种屏障并感染人类。该团队还确定了应该集中资源的“热门”区域。“我们对团队进行了很多讨论,因为起初有些结果对我们来说似乎很奇怪,”Poisot说。

发现的病毒之一是鼠外膜炎,它与小鼠的天花有关。“我们持怀疑态度,但当我们搜索文献时,我们发现人类中有病例,”Poisot说。

该研究项目的重要成果之一是重新发现了特定的人畜共患病毒,这些病毒已经成为分散出版物的主题,但从未在数据库中链接过。

该研究的另一个创新方面是绘制结果图,以更好地了解全球范围内的病毒 - 哺乳动物相互作用。“我们的模型进行空间预测,但更准确地说,该模型具体指出在哪一组哺乳动物和可能发现某些类型病毒的位置,”Poisot说。

两个值得探索的地区

该团队已经确定了两个要探索的地理区域。首先是南美洲的亚马逊盆地,那里的宿主和病毒之间的相互作用比其他地方更原始,并且更有可能观察到新的相互作用。其次是中非,在那里发现了新的宿主,它们是人畜共患病毒的潜在携带者。

“我们真的在改变我们需要去的地方,研究哺乳动物以发现新的病毒,”Poisot解释说。因此,希望了解宿主病毒系统的多样化以及它们对人类所代表的人畜共患风险的病毒学家应该对这两个区域感兴趣,他补充说。

Poisot和他的研究同事的下一步是使该领域的合作伙伴易于访问和用户友好。“我们希望让利益相关者更容易采用我们的模式。我们现在知道要监测哪些物种,在哪里以及针对什么类型的病毒,“他说。