跳动百科

机器人和人工智能联手发现高选择性催化剂

终广鹏
导读 研究人员使用化学合成机器人和计算成本效益高的AI模型来成功预测和验证高选择性催化剂。他们的研究结果发表在Angewandte Chemie Internat

研究人员使用化学合成机器人和计算成本效益高的AI模型来成功预测和验证高选择性催化剂。他们的研究结果发表在Angewandte Chemie International Edition杂志上。

随着 ChatGPT 语言处理功能的出现,人工智能 (AI) 最近成为头条新闻。为化学反应设计创建同样强大的工具仍然是一个重大挑战,特别是对于复杂的催化反应。为了帮助应对这一挑战,化学反应设计与发现研究所和马克斯普朗克研究所的研究人员展示了一种机器学习方法,该方法利用先进而高效的二维化学描述符来准确预测高度选择性的不对称催化剂,而无需量子化学计算。

“已经有几种先进的技术可以'预测'催化剂结构,但这些方法通常需要大量的计算资源和时间投入;然而,它们的准确性仍然有限,“联合第一作者Nobuya Tsuji说。“在这个项目中,我们开发了一个预测模型,即使使用日常笔记本电脑也可以运行。

对于学习化学信息的计算机,分子通常表示为描述符的集合,这些描述符通常由这些分子的小部分或片段组成。这些对于人工智能来说更容易处理,可以排列和重新排列以构建不同的分子,就像乐高积木可以以不同的方式排列和连接以构建不同的结构一样。

然而,计算成本较低的二维描述符难以准确表示复杂的催化剂结构,导致预测不准确。为了改善这个问题,研究人员开发了新的圆形子结构(CircuS)2D描述符,明确表示催化中常见的环状和支链烃结构。人工智能的训练数据是通过利用合成机器人的简化、半自动过程通过实验获得的。然后将该实验数据转换为描述符并用于训练AI模型。

研究人员使用完全训练的模型对190种不属于训练数据的催化剂进行了虚拟测试。在此集合中,AI模型仅在对具有中等选择性的催化剂的数据进行训练后,就能够预测高选择性的催化剂,显示出超越训练数据进行推断的能力。然后对预测具有最高选择性的催化剂进行实验测试,表现出与AI模型预测的几乎相同的选择性。获得高选择性对于新药的设计尤其重要,该技术为化学家提供了一个强大的优化选择性的框架,在计算和劳动力成本方面都是有效的。

“通常,为了预测新的选择性催化剂,化学家会使用基于量子化学计算的模型。然而,这种模型的计算成本很高,当化合物的数量和分子的大小增加时,它们的应用变得有限,“联合第一作者Pavel Sidorov评论道。“基于2D结构的模型便宜得多,因此可以在几秒钟内处理成百上千个分子。这使得化学家能够更快地过滤掉他们可能不感兴趣的化合物。