APS | 上海藥物所綜述擴散模型在AI輔助的抗體設計中的應用
文章來源:上海藥物研究所 | 發(fā)布時間:2024-10-09 | 【打印】 【關閉】
2024年9月30日,中國科學院上海藥物研究所徐華強團隊在Acta Pharmacologica Sinica發(fā)表綜述文章“AI-driven antibody design with generative diffusion models: current insights and future directions”。本綜述總結了擴散模型在AI輔助抗體設計中的應用,包括抗體的從頭設計、已有抗體結構的優(yōu)化、以及相應的實驗評測方法,系統(tǒng)地總結了基于擴散模型的抗體生成領域的研究進展,并為進一步改進針對抗體設計的擴散模型提供了參考。

抗體是不可或缺的免疫系統(tǒng)組成部分,也是現(xiàn)代大分子藥物設計最重要的部分,然而抗體藥物的研發(fā)和優(yōu)化通常面臨花費多、周期長、優(yōu)化難等實驗相關的問題,亟待先進的計算方法提供支持和輔助??焖侔l(fā)展的人工智能(AI)模型已經在多種任務中起到了關鍵作用,而擴散模型作為AI領域的后起之秀,不僅對圖片和視頻生成產生了革命性改變,也已經在蛋白質設計、小分子設計等藥物設計領域發(fā)揮了作用。鑒于擴散模型能夠高效學習大量高質量數(shù)據(jù)的分布,并且能夠根據(jù)提示詞生成相關數(shù)據(jù)的特點,其在抗體設計領域中,尤其是用抗原作為“提示詞”生成抗體方面,具有天然的優(yōu)勢。為此,本文綜述了擴散模型在抗體設計領域的應用,以輔助架起抗體設計方面計算和實驗的橋梁。

圖1.如何在抗體設計任務中使用擴散模型
抗體設計任務主要包括兩方面,分別是從頭抗體設計和抗體優(yōu)化。圖2展示了一些從頭抗體設計方法。其中針對抗體的RFDiffusion在抗體和蛋白訓練數(shù)據(jù)上進行了微調,并結合ProteinMPNN方法設計CDR序列,基于語言模型提取隱空間信息的思路在AntiBARTy Diffusion和EAGLE上也得到了應用,AbDiffuser則嘗試通過設計新的模型架構來整合抗原-抗體相互作用的序列和結構信息。在從頭抗體設計上,這些思路都取得了一定成果,包括實驗上微摩爾級別的親和力,或設計了和上市藥物相媲美的新抗體。

圖2.在從頭抗體設計中應用擴散模型
而針對已有抗體的優(yōu)化問題,研究者們不僅可以使用針對抗體專門設計和訓練的,基于結構或基于序列的模型(如DiffAb或NOS)來從抗原-抗體復合物結構出發(fā)生成新的抗原結合區(qū),還可以使用通用的蛋白質設計模型(如基于結構的RFdiffusion、Chroma或者基于序列的EvoDiff、Taxdiff),這樣的模型將生成新的結構或序列,后續(xù)可以在計算或實驗方法上進一步評價所生成的蛋白質。該綜述還討論了如何在結構、序列、結合親和力估計和實驗方法上評測所生成的抗體。

圖3.利用通用的蛋白質生成模型優(yōu)化抗體
綜上所述,擴散模型的應用為加速抗體設計提供了新途徑,主要包括利用高質量的大數(shù)據(jù)集,來捕捉界面的復雜相互作用和探索更廣闊的序列空間。盡管仍面臨一些挑戰(zhàn),如負樣本的缺失,計算估計方法的準確度有限,抗體成藥性的評估等,但AI方法的不斷完善進步和相關數(shù)據(jù)庫的擴充,有望進一步提高基于擴散模型的抗體設計的精確性和有效性,最終使其成為生物技術領域的優(yōu)質工具。
上海藥物所博士研究生何欣恒、助理研究員李俊睿為本文共同第一作者;上海藥物所徐華強研究員為本文通訊作者。本研究得到了國家自然科學基金,中國科學院戰(zhàn)略性先導科技專項,上海市市級科技重大專項和臨港實驗室的基金資助。
