深勢科技團隊最新成果登Nature子刊:RiD方法解決高維空間采樣難題
近日,深勢科技團隊最新成果登上《自然-計算科學(xué)》(Nature Computational Science),論文題為《利用自適應(yīng)強化動力學(xué)對高維自由能面進行高效采樣》(Efficient sampling of high-dimensional free energy landscapes using adaptive reinforced dynamics),文中使用了超過100個集合變量加速采樣進程,此前的采樣方法從未處理過如此高維的集合變量!蹲匀唬嬎憧茖W(xué)》(Nature Computational Science)是Nature旗下專注于計算科學(xué)的頂級期刊,主要關(guān)注最新計算方法的發(fā)展及其如何在各學(xué)科中解決實際問題。這是深勢科技繼12月8日推出蛋白質(zhì)結(jié)構(gòu)預(yù)測工具Uni-Fold,并開源訓(xùn)練、推理代碼后的又一重磅成果。
(論文:Efficient sampling of high-dimensional free energy landscapes using adaptive reinforced dynamics)
蛋白質(zhì)是生命的基石,它的功能與其獨特的三維結(jié)構(gòu)及動力學(xué)性質(zhì)息息相關(guān)。解析蛋白質(zhì)的結(jié)構(gòu)、了解蛋白質(zhì)的動力學(xué)性質(zhì),不僅能讓我們解讀生命密碼,更有助于加速藥物研發(fā)。深勢科技提出的基于神經(jīng)網(wǎng)絡(luò)的強化動力學(xué)方法(Reinforced Dynamics, RiD)被進一步應(yīng)用于擁有更高維集合變量(Collective Variables, CVs)的體系中,這一研究將推進蛋白質(zhì)結(jié)構(gòu)采樣、結(jié)構(gòu)精修或環(huán)區(qū)優(yōu)化等工作的進行,讓研究人員能夠通過計算方法向蛋白質(zhì)的天然狀態(tài)更近一步。
(RiD工作流,RiD方法應(yīng)用在超過100個集合變量的體系上)
神經(jīng)網(wǎng)絡(luò)加持下,對蛋白結(jié)構(gòu)的"精雕細琢"再進一步
幾十年來,科學(xué)家們通過各種實驗手段解析了十幾萬個蛋白質(zhì)結(jié)構(gòu),但這相較于已經(jīng)測序的數(shù)十億計蛋白質(zhì)來說還遠遠不夠。實驗方法成本高、周期長,因此能否用計算方法還原蛋白質(zhì)生理狀態(tài)并加速研究工作成為計算生物學(xué)中最具挑戰(zhàn)性的問題之一。
盡管在2020年的國際蛋白質(zhì)結(jié)構(gòu)預(yù)測頂級競賽CASP(Critical Assessment of protein Structure Prediction)中,來自DeepMind的AI算法AlphaFold2的表現(xiàn)引發(fā)生物界巨大轟動。但相比于蛋白質(zhì)真實的生理狀態(tài),AlphaFold2的預(yù)測結(jié)果仍需要進一步的蛋白結(jié)構(gòu)精修。
目前在蛋白質(zhì)結(jié)構(gòu)優(yōu)化中,基于經(jīng)典分子動力學(xué)(Molecular Dynamics, MD)的優(yōu)化方案在近兩期的CASP上都取得了優(yōu)異的結(jié)果。但是,經(jīng)典分子動力學(xué)模擬方法在蛋白質(zhì)體系中采樣效率低,而傳統(tǒng)增強采樣算法又面臨著計算量大、難以選取集合變量以及維數(shù)災(zāi)難的問題。強化動力學(xué)(Reinforced Dynamics,RiD)方法則可以借助神經(jīng)網(wǎng)絡(luò),處理幾十甚至上百維的集合變量,使其能夠應(yīng)用在復(fù)雜體系中。RiD方法在蛋白質(zhì)結(jié)構(gòu)優(yōu)化問題上處理了超過100個集合變量,讓經(jīng)典分子動力學(xué)方法無法得到的蛋白質(zhì)天然結(jié)構(gòu)在強化動力學(xué)方案下成為現(xiàn)實。
(在R0974s1, R0986s1 和 R1002-D2 三個案例中的蛋白結(jié)構(gòu)精修結(jié)果)
在CASP13比賽中三個典型例子(R0974s1, R0986s1 和 R1002-D2)上,RiD做到了大幅提升。相比于初始結(jié)構(gòu),RiD優(yōu)化后的結(jié)構(gòu)平均提升了14.6點GDT-HA分數(shù),其中最高分數(shù)分別達到了92.4,82.6和79.7。同時,優(yōu)化結(jié)果具有良好的魯棒性(圖a和b)。特別地,在R1002-D2的例子上,經(jīng)典分子動力學(xué)模擬只采樣的很小的區(qū)域(圖c 紫紅色區(qū)域),RiD可以從初始結(jié)構(gòu)(圖c 黑色X,圖d)經(jīng)過去折疊(圖e),最終模擬到天然狀態(tài)結(jié)構(gòu)(圖c 藍色X,圖f)。
蛋白質(zhì)在生物體內(nèi)是不斷運動的,目前描述蛋白質(zhì)構(gòu)象系綜的最佳方式之一是借助分子模擬手段。對于生物大分子體系的高效采樣是分子模擬的一個關(guān)鍵問題,RiD作為這一問題的出色解決方案,為多個領(lǐng)域的突破帶來可能。對于藥物設(shè)計而言,RiD能夠在更多的場景發(fā)揮重要作用:探尋構(gòu)象變化中的隱藏口袋和別構(gòu)口袋,困難藥物靶點中固有無序蛋白的構(gòu)象采樣,抗體環(huán)區(qū)優(yōu)化等。對于藥物科研人員來說,這些難題的解決能有效提升藥物研發(fā)效率。
為了方便學(xué)術(shù)開發(fā)與應(yīng)用,深勢科技團隊已將RiD方法重構(gòu)為開源軟件供用戶使用。同時深勢科技也針對藥物設(shè)計場景,對RiD進行了進一步的開發(fā)和優(yōu)化,集成于旗下一站式計算輔助藥物設(shè)計平臺Hermite中。用戶可通過Hermite-ProteinRefine對輸入的蛋白質(zhì)進行結(jié)構(gòu)優(yōu)化,獲得更接近天然狀態(tài)的蛋白結(jié)構(gòu)。
(Hermite界面-通道蛋白在膜里面)
去年,深勢科技核心成員的工作開辟了“AI+物理模型+高性能計算”的科學(xué)計算新范式,一舉斬獲“計算應(yīng)用領(lǐng)域諾貝爾獎”、國際高性能計算應(yīng)用領(lǐng)域最高獎項“戈登·貝爾獎”。 如今RiD的誕生與應(yīng)用,也是深勢科技團隊“AI+物理模型+高性能計算”組合拳的極佳體現(xiàn),也是新一代分子模擬算法在藥物設(shè)計領(lǐng)域落地,實現(xiàn)效率與精度統(tǒng)一的例證之一。深勢科技致力于運用領(lǐng)跑行業(yè)的分子模擬技術(shù),為人類文明最基礎(chǔ)的生命、能源、材料科學(xué)與工程研究打造新一代微尺度工業(yè)設(shè)計和仿真平臺。
Hermite作為根植于云計算的臨床前計算機輔助藥物設(shè)計平臺,能為藥物開發(fā)人員提供數(shù)據(jù)、算法、算力三位一體的一站式解決方案。除RiD模塊外,Hermite上已集成多個重量級功能,例如近期上線的蛋白質(zhì)結(jié)構(gòu)預(yù)測工具Uni-Fold,在藥物優(yōu)化階段比較不同分子與蛋白靶點結(jié)合活性差別的Uni-FEP,等等。
在結(jié)構(gòu)生物學(xué)領(lǐng)域,利用Uni-Fold、RiD等AI+計算模擬的算法,并結(jié)合冷凍電鏡等實驗手段,深勢科技正致力于打造一套模擬—AI—實驗三者聯(lián)合驅(qū)動的結(jié)構(gòu)生物學(xué)解決方案,為基于結(jié)構(gòu)的藥物設(shè)計提供更高的起點,加速科學(xué)家們的藥物發(fā)現(xiàn)進程。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
技術(shù)文庫
最新活動更多
-
10 GSK膨脹的ADC野望
- 1 2025高端醫(yī)療器械國產(chǎn)替代提速,這些賽道值得關(guān)注!
- 2 多數(shù)人錯估了關(guān)稅將對中國醫(yī)藥產(chǎn)業(yè)的影響
- 3 一季度醫(yī)療儀器及器械進出口報告:前十大出口市場在哪?
- 4 認購火爆,映恩生物打響18A IPO重啟信號槍
- 5 中國創(chuàng)新藥出海:機遇、挑戰(zhàn)與未來展望
- 6 核藥賽道解碼:高壁壘、國產(chǎn)替代與千億市場卡位
- 7 創(chuàng)新藥是避風(fēng)港,更是發(fā)射臺!
- 8 第一醫(yī)藥扣非凈利潤僅687.40萬元:上!半[形土豪”要再沉淀沉淀
- 9 隱匿的醫(yī)療大佬,10年干出千億級公司
- 10 外骨骼機器人,誰是盈利最強企業(yè)?