在化学反应过程中,分子获得能量,直到达到所谓的过渡态——反应必须从这个点继续进行。这种状态转瞬即逝,几乎不可能通过实验观察到。
这些过渡态的结构可以使用基于量子化学的技术来计算,但该过程非常耗时。麻省理工学院的一个研究团队现在开发了一种基于机器学习的替代方法,可以更快地计算这些结构——几秒钟之内。
他们的新模型可用于帮助化学家设计新的反应和催化剂,以生成燃料或药物等有用的产品,或模拟自然发生的化学反应,例如可能有助于推动地球生命进化的化学反应。
麻省理工学院化学与化学工程副教授、该研究的资深作者希瑟·库里克(HeatherKulik)表示:“了解过渡态结构对于思考设计催化剂或理解自然系统如何进行某些转变非常重要。”。
ChenruDuan博士'22是一篇描述这项工作的论文的主要作者,该论文发表在《自然计算科学》上。康奈尔大学研究生杜元琪和麻省理工学院研究生贾浩也是该论文的作者。
转瞬即逝的转变
对于任何给定的化学反应的发生,它必须经历一个过渡态,当达到反应进行所需的能量阈值时,就会发生过渡态。任何化学反应发生的概率部分取决于过渡态形成的可能性。
“过渡态有助于确定化学转变发生的可能性。如果我们有很多我们不想要的东西,比如二氧化碳,并且我们想将其转化为有用的燃料,比如甲醇,那么过渡态以及它的有利程度决定了我们从产物的反应物,”库利克说。
化学家可以使用称为密度泛函理论的量子化学方法来计算过渡态。然而,这种方法需要大量的计算能力,并且仅计算一个过渡态就可能需要数小时甚至数天的时间。
最近,一些研究人员尝试使用机器学习模型来发现过渡态结构。然而,迄今为止开发的模型需要将两种反应物视为一个实体,其中反应物相对于彼此保持相同的方向。任何其他可能的方向都必须建模为单独的反应,这会增加计算时间。
“如果反应物分子旋转,那么原则上,在旋转之前和之后它们仍然可以发生相同的化学反应。但在传统的机器学习方法中,模型会将这些视为两种不同的反应。这使得机器学习训练变得更加困难,而且准确性也降低。”段说。
麻省理工学院的团队开发了一种新的计算方法,允许他们使用一种称为扩散模型的模型来表示两种相对于彼此任意方向的反应物,该模型可以了解哪种类型的过程最有可能产生特定的反应物。结果。作为模型的训练数据,研究人员使用了使用量子计算方法计算出的9,000种不同化学反应的反应物、产物和过渡态的结构。
“一旦模型了解了这三种结构如何共存的基本分布,我们就可以给它新的反应物和产物,它会尝试生成与这些反应物和产物配对的过渡态结构,”段说。
研究人员在大约1,000个以前从未见过的反应上测试了他们的模型,要求它为每个过渡态生成40种可能的解决方案。然后,他们使用“置信模型”来预测哪些状态最有可能发生。与使用量子技术生成的过渡态结构相比,这些解决方案的精确度在0.08埃(一亿分之一厘米)以内。每个反应的整个计算过程只需几秒钟。
库里克说:“你可以想象,这真的可以扩展到考虑生成数千个过渡态,而通常用传统方法只需要生成少数几个过渡态。”
模拟反应
尽管研究人员主要针对涉及原子数量相对较少(整个系统最多23个原子)的化合物的反应来训练他们的模型,但他们发现它也可以对涉及较大分子的反应做出准确的预测。
“即使你观察更大的系统或酶催化的系统,你也能很好地了解原子最有可能重新排列的不同类型的方式,”库里克说。
研究人员现在计划扩展他们的模型,以纳入催化剂等其他成分,这可以帮助他们研究特定催化剂能在多大程度上加速反应。这对于开发生产药物、燃料或其他有用化合物的新工艺非常有用,特别是当合成涉及许多化学步骤时。
“传统上所有这些计算都是通过量子化学进行的,现在我们能够用这种快速生成模型取代量子化学部分,”段说。
研究人员表示,这种模型的另一个潜在应用是探索其他行星上发现的气体之间可能发生的相互作用,或者模拟地球生命早期进化过程中可能发生的简单反应。
哥本哈根大学化学教授扬·哈尔堡·詹森(JanHalborgJensen)没有参与这项研究,他说,这种新方法代表着“在预测化学反应性方面向前迈出了重要一步”。
“找到反应的过渡态和相关势垒是预测化学反应性的关键步骤,也是最难实现自动化的任务之一,”他说。“这个问题阻碍了许多重要领域的发展,例如计算催化剂和反应发现,这是我看到的第一篇可以消除这个瓶颈的论文。”