Nature Communications| 深度学习与分子动力学模拟相结合的靶向特异性肽抑制剂设计

Nature Communications volume 15, Article number: 1611 (2024)

论文信息

标题: Design of target specific peptide inhibitors using generative deep learning and molecular dynamics simulations

发表时间: 2024

发表作者: Sijie Chen, Tong Lin, Ruchira Basu, Jeremy Ritchey, Shen Wang, Yichuan Luo, Xingcan Li, Dehua Pei, Levent Burak Kara, Xiaolin Cheng

发表机构:

College of Pharmacy, The Ohio State University
Mechanical Engineering Department, Carnegie Mellon University
Machine Learning Department, Carnegie Mellon University
Department of Chemistry and Biochemistry, The Ohio State University
Electrical and Computer Engineering Department, Carnegie Mellon University
Department of Radiology, Affiliated Hospital and Medical School of Nantong University
Translational Data Analytics Institute, The Ohio State University

关键词: 深度学习，分子动力学模拟，肽抑制剂，目标特异性，β-catenin，NF-κB essential modulator

摘要：文章介绍了一种计算方法来设计目标特异性肽。方法集成了基于门控循环单元的变分自编码器和Rosetta FlexPepDock，用于肽序列生成和结合亲和力评估。随后，分子动力学模拟被用来缩小多肽的选择用于实验分析。应用这种计算策略来设计特异性靶向β-catenin和NF-κB必需调节剂的肽抑制剂。在12个β-catenin抑制剂中，与母体肽相比，6个表现出更好的结合亲和力。最优的c端肽与β-catenin结合的IC为0.010±0.06 μM，是母肽的15倍。对于50 NF-κB必需调节剂，四种被测肽中的两种与母肽的结合明显增强。总的来说，这项研究强调了深度学习和基于结构的建模和模拟在目标特定肽设计中的成功整合。

一句话摘要: 本研究成功地将深度学习和结构建模与模拟相结合，设计了针对β-catenin和NF-κB essential modulator的目标特异性肽抑制剂。

随着生物技术的迅猛发展，针对特定蛋白质靶点设计高亲和力的肽类抑制剂成为了药物研发领域的一项重要任务。本文介绍了一种结合了基于门控循环单元（Gated Recurrent Unit, GRU）的变分自编码器（Variational Autoencoder, VAE）和Rosetta FlexPepDock的计算方法，用于生成肽序列并评估其与目标蛋白的结合亲和力。此外，通过分子动力学（Molecular Dynamics, MD）模拟进一步筛选肽类候选物，以进行实验验证。本研究成功应用于设计特异性靶向β-连环蛋白和NF-κB基本调节子的肽抑制剂，其中部分设计的抑制剂展现出比母体肽更高的结合亲和力。本导读将全面深入地反映出该研究的核心内容，并提供图表资料以加深理解。

背景信息

肽类抑制剂在药物研发中扮演着重要角色，尤其是在抗生素发现和生物材料设计等领域。然而，设计特定蛋白-蛋白相互作用（Protein-Protein Interactions, PPIs）的肽抑制剂仍然是一个巨大的挑战。传统的基于结构的方法和基于序列的方法都存在局限性，如引入偏差、搜索空间巨大、计算成本高等问题。

问题陈述与研究缺口

尽管AlphaFold等模型在识别高亲和力肽结合体方面取得了成功，但其计算需求大且限于自然氨基酸，这对序列搜索和与流行的肽亲和力成熟策略的兼容性构成了挑战。此外，现有的肽设计方法通常依赖于突变来优化序列和结构，限制了全局能量最小化的搜索。

研究目标与意义

本研究的目标是设计N端和C端扩展的肽类抑制剂，以提高其对β-连环蛋白的结合亲和力。通过结合深度学习和基于结构的建模与模拟，本研究旨在高效生成针对特定蛋白表面的高亲和力肽结合体。

理论框架

本研究采用了一种多步骤序列生成算法，该算法结合了基于深度学习的生成模型与基于结构的建模和模拟。首先，使用GRU基VAE和Metropolis Hasting (MH)采样算法生成潜在的肽序列。然后，通过Rosetta FlexPepDock快速评估VAE-MH生成的肽的结合亲和力，并使用MD模拟对高排名的肽进行重新评估。

图 2 | VAE-MH序列编码和解码过程示意图。

研究方法

研究方法包括以下几个步骤：

使用VAE将肽序列嵌入到一个连续的潜在空间向量中，该向量可以解码回序列的原始表示。
使用MH算法通过近似q(z∣c)生成新的肽序列，其中z是扩展的编码，c是代表所需分子性质（例如PPI结合体）的变量。
通过Rosetta FlexPepDock和MM/GBSA方法进行肽-蛋白复合物的结合能量计算，以筛选出具有更高亲和力的肽。
对选定的肽进行实验验证，包括荧光偏振（Fluorescence Polarization, FP）竞争实验。

图 3 | Rosetta Design生成的N端或C端扩展的肽与VAE-MH模型生成的肽的结合能量评分比较。

论文组织结构

本文首先介绍了β-连环蛋白的背景和其在细胞增殖中的作用，然后详细描述了设计肽抑制剂的计算方法，包括VAE-MH模型的建立和优化。接着，文章展示了通过Rosetta FlexPepDock和MM/GBSA方法筛选N端扩展肽的过程，并通过实验验证了所设计肽的有效性。最后，文章讨论了所提出方法的优势和潜在的改进空间。

全文解读：

概述

本文介绍了一种计算方法，用于设计针对特定蛋白靶点的多肽抑制剂。这种方法结合了基于门控循环单元(GRU)的变分自动编码器(VAE)与Rosetta FlexPepDock进行多肽序列生成和亲和力评估，然后通过分子动力学模拟来缩小待实验检验多肽的选择范围。研究聚焦于专门针对β-catenin和NF-κB基本调节器(NEMO)的多肽抑制剂的设计。试验结果显示，对β-catenin的十二个抑制剂中有六个展现出比父代多肽更好的结合亲和力，最佳C端多肽的IC50值为0.010 ± 0.06 µM，比父代多肽改善了15倍。对于NEMO，四个测试的多肽中有两个展示了明显更优的结合能力。

接下来通过对β-catenin的N端扩展，利用Rosetta Design和Rosetta FlexPepDock评估扩展多肽的结合能量，所得结果支持了通过N端或C端扩展来提高多肽9对β-catenin的亲和力的可能性。通过VAE-MH过程引入的多肽扩展，经Rosetta FlexPepDock和MM/GBSA计算后，部分多肽展现出比父代多肽更优的结合特性。然而，这种改进程度适中，例如最优N端扩展NAL-9的IC50值为0.084μM，大约是父代多肽的两倍改善。

随后通过化学合成和筛选组合多肽库对β-catenin进行测试，旨在发现更强的多肽抑制剂。所选的几种多肽基于在OBOC(一珠一化合物)多肽库筛选后的序列进行合成和IC50测定。从这一策略中发现，尽管VAE-MH导出的多肽展现出适度的亲和力提高，但遗憾的是，N-端扩展策略未能显著增强多肽的功效。

最后，文中讨论了深度生成模型在设计高亲和力特异性多肽抑制剂中的成功。
这包括两个计算流水线的介绍：第一个流水线通过VAE-MH生成多肽扩展并通过Rosetta FlexPepDock和MM/GBSA进行排序和筛选；第二个流水线采用迭代细化的VAE-MH模型生成针对特定蛋白表面的C端或N端扩展。这些方法在设计具有高亲和力的多肽方面展示了显著的潜力，特别突出了结合了深度学习、生物物理学基于模拟的Rosetta Docking和分子动力学模拟的计算流程。

背景

论文提出了一种针对特定靶点的肽类抑制剂的计算方法。该方法结合了基于门控循环单元的变分自编码器和Rosetta FlexPepDock用于肽序列生成及结合亲和力评估，随后通过分子动力学模拟来缩小实验检测肽类的选择范围。研究旨在设计特定针对β-catenin和NF-κB基本调节子的肽类抑制剂。

方法

此论文采用的研究方法可以归类为“实验研究”，综合运用了深度学习和结构基础的建模模拟技术，具体如下：

设计研究目标：通过增加肽的氨基酸链长度，来改善其与β-catenin的结合能力，并通过Rosetta FlexPepDock评估改造后的肽与β-catenin的结合能量。
使用计算工具：首先使用变分自编码器（VAE）配合门控循环单元（GRU）模型生成N端或C端扩展的肽链，然后利用Rosetta FlexPepDock对不同长度扩展的肽进行结合能量分析，以评估其结合效率。
细节分析与优选：深入分析扩展肽链的长度对其结合性能的影响，并将肽序列根据Rosetta FlexPepDock的评分从高到低排名选择前十种进行分子力学（MM/GBSA）自由能计算，挑选出结合能量最佳的肽。
实验验证：最终挑选的几种肽经过实验测试来验证其抑制β-catenin的能力，并通过实验数据进一步评估计算模型的准确性和有效性。

上述研究涵盖了从计算模拟到实验验证的全流程，展现了结合深度学习模型与生物物理实验手段的现代生物信息学研究方法。通过这种方法，研究人员不但能够高效地筛选出具有潜力的肽类抑制剂，还可以系统地了解和解析肽-蛋白相互作用的微观机制，为药物设计和蛋白质工程提供了新的视角和工具。

结论

论文总结：

研究方法：提出了一种针对特定靶标（β-catenin和NF-κB essential modulator）设计特异性肽的计算方法，该方法结合了基于Gated Recurrent Unit的变分自编码器和Rosetta FlexPepDock用于肽序列生成和结合亲和力评估，进而使用分子动力学模拟来筛选实验测定的肽。
主要发现：
- 通过N端和C端扩展策略，改善了与β-catenin结合的肽的效能。
- 在β-catenin的结合能力改善中，发现最优肽CAL-2，其IC50值为0.010 μM，比父序列肽改善了15倍。
结论：该研究成功结合了深度学习和基于结构的建模与模拟，为特定靶标肽设计提供了新的计算方法，同时也发现了针对β-catenin具有改善结合能力的肽。

Nature Communications volume 15, Article number: 1611 (2024)

Nature Communications| 深度学习与分子动力学模拟相结合的靶向特异性肽抑制剂设计

Design of target specific peptide inhibitors using generative deep learning and molecular dynamics simulations

产品中心

多肽合成|多肽定制

抗体制备|抗体定制

最新资讯

Nature Communications| 深度学习与分子动力学模拟相结合的靶向特异性肽抑制剂设计

背景信息

问题陈述与研究缺口

研究目标与意义

理论框架

研究方法

论文组织结构

Nature Communications| 深度学习与分子动力学模拟相结合的靶向特异性肽抑制剂设计