丨分析丨AlphaFold幾乎破解所有蛋白質(zhì),Deep Mind的下一步戰(zhàn)略?
前言:
蛋白質(zhì)是有機(jī)體內(nèi)細(xì)胞的關(guān)鍵構(gòu)成部分,也被稱為支撐生命正常運(yùn)轉(zhuǎn)的基石。它具有一定的形狀和空間結(jié)構(gòu),且形狀與功能之間有密切的聯(lián)系。
因此,只有深入了解蛋白質(zhì)結(jié)構(gòu),才能更好地掌握原理和功能,進(jìn)一步推動(dòng)生物科學(xué)的發(fā)展。
作者 | 方文
圖片來(lái)源 | 網(wǎng) 絡(luò)
蛋白質(zhì)結(jié)構(gòu)研究加速度
蛋白質(zhì)是生命的基石,由氨基酸鏈組成,并折疊成復(fù)雜的形狀。蛋白質(zhì)根據(jù)儲(chǔ)存在DNA中的指令產(chǎn)生復(fù)雜的生物分子,它們執(zhí)行著至關(guān)重要的細(xì)胞任務(wù),并完成各種機(jī)體功能。
一些蛋白質(zhì)是有益的,例如那些參與消化食物的蛋白質(zhì);而另一些則是有害的,例如那些參與腫瘤生長(zhǎng)的蛋白質(zhì)。它們各自都有著非常復(fù)雜的形狀和結(jié)構(gòu)。
由于蛋白質(zhì)的形狀與其功能密切相關(guān)。了解蛋白質(zhì)的結(jié)構(gòu)可以更好地了解其作用和工作原理,這也是解決許多生命科學(xué)問(wèn)題的關(guān)鍵。
以前,研究人員需要付出幾個(gè)月或幾年的時(shí)間和精力,才能弄清蛋白質(zhì)的結(jié)構(gòu)。
如今,憑借人工智能的力量,幾秒鐘內(nèi)就能完成。
它不僅可被用于疾病研究、食物安全、疫苗開(kāi)發(fā)、可持續(xù)發(fā)展等領(lǐng)域;
還幫助科學(xué)家深入了解體內(nèi)復(fù)雜過(guò)程是如何工作的、以及哪些有機(jī)分子能被用于克服污染、生命起源于何處等那些為全人類所關(guān)注的重要問(wèn)題。
AlphaFold蛋白質(zhì)數(shù)據(jù)庫(kù)
AlphaFold蛋白質(zhì)數(shù)據(jù)庫(kù)不僅實(shí)現(xiàn)了1000倍的擴(kuò)容,成為[蛋白質(zhì)宇宙],更能在幾分鐘破解漸凍人等不治之癥相關(guān)的世界級(jí)生物難題。
這些轉(zhuǎn)儲(chǔ)數(shù)據(jù)將在Deep Mind和歐洲分子生物學(xué)實(shí)驗(yàn)室歐洲生物信息研究所共同建立的一個(gè)數(shù)據(jù)庫(kù)中免費(fèi)公開(kāi)。
在這些逾 2.14 億個(gè)結(jié)構(gòu)預(yù)測(cè)中,約35%的預(yù)測(cè)結(jié)果被認(rèn)為準(zhǔn)確度很高,即和實(shí)驗(yàn)解析的結(jié)構(gòu)一樣可靠。
另有45%的預(yù)測(cè)被認(rèn)為置信度足夠高,在很多情況下都能使用。
AlphaFold預(yù)測(cè)的許多結(jié)構(gòu)都很可靠,能在很多情況下替代實(shí)驗(yàn)解析的結(jié)構(gòu)。
其他情況下,研究人員會(huì)用AlphaFold的預(yù)測(cè)結(jié)果驗(yàn)證和解讀實(shí)驗(yàn)數(shù)據(jù)。
不可靠的預(yù)測(cè)結(jié)果一望即知,其中一些源于蛋白質(zhì)固有的無(wú)序性質(zhì),這種無(wú)序意味著蛋白質(zhì)本身沒(méi)有固定的形狀,至少在沒(méi)有其他分子的情況下是無(wú)序的。
AlphaFold的發(fā)展歷程
2016年,DeepMind公司開(kāi)發(fā)的AlphaGo擊敗韓國(guó)傳奇圍棋選手李世石后,其先進(jìn)性與潛力受到認(rèn)可,DeepMind決定成立團(tuán)隊(duì)開(kāi)始研究[蛋白質(zhì)折疊問(wèn)題]。
2018年12月,AlphaFold在第13屆國(guó)際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽上預(yù)測(cè)出了43種蛋白質(zhì)中25種蛋白質(zhì)的最精確結(jié)構(gòu)。
2020年,DeepMind 推出一個(gè)名為 AlphaFold的AI算法,它可以正確地完成蛋白質(zhì)的結(jié)構(gòu)測(cè)定。
2021年,與歐洲分子生物學(xué)實(shí)驗(yàn)室EMBL合作,建立了一個(gè)公開(kāi)發(fā)布 AlphaFold 預(yù)測(cè)結(jié)果的可搜索數(shù)據(jù)庫(kù),即 AlphaFold DB,其公布的最初一組數(shù)據(jù)包含了 98% 的人類蛋白質(zhì)。
2021年7月15日,DeepMind通過(guò)一篇Nature論文開(kāi)源了其基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的AlphaFold2模型;
7月22日,DeepMind再次發(fā)表Nature論文,推出AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù),向公眾免費(fèi)開(kāi)放人類蛋白質(zhì)組以及另外20種模式生物的總共超過(guò)350000種結(jié)構(gòu),并且對(duì)98.5%的人類蛋白質(zhì)結(jié)構(gòu)進(jìn)行了準(zhǔn)確預(yù)測(cè)。
今年1月,DeepMind 宣布已經(jīng)有超過(guò)30萬(wàn)研究者使用了 AlphaFold數(shù)據(jù)庫(kù),并且添加了超過(guò)27個(gè)蛋白質(zhì)組,總計(jì)超過(guò)19萬(wàn)條蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)數(shù)據(jù)。
這次添加的重要性在于其中17個(gè)蛋白質(zhì)組都和被忽視熱帶疾病有關(guān),影響全球十多億人。
今年7月,DeepMind 將 AlphaFold 數(shù)據(jù)庫(kù)從近100萬(wàn)條擴(kuò)展到2.14億條,覆蓋了人類已知的絕大多數(shù)蛋白質(zhì)。
目前預(yù)測(cè)準(zhǔn)確度尚待提升
人工智能有一個(gè)學(xué)習(xí)的過(guò)程,要通過(guò)大量的訓(xùn)練來(lái)提升其準(zhǔn)確性。
如果AlphaFold預(yù)測(cè)的蛋白質(zhì)結(jié)構(gòu)是不常見(jiàn)的結(jié)構(gòu),AI無(wú)法通過(guò)已有的知識(shí)學(xué)習(xí)到這個(gè)結(jié)構(gòu),預(yù)測(cè)時(shí)就容易產(chǎn)生偏差。
AI是一個(gè)能夠利用現(xiàn)有的知識(shí)預(yù)測(cè)將來(lái)的工具,如果連現(xiàn)有的知識(shí)都是缺失狀態(tài),自然無(wú)法預(yù)測(cè)新結(jié)構(gòu)。
除非把世界上所有的蛋白質(zhì)結(jié)構(gòu)都預(yù)測(cè)并驗(yàn)證過(guò)了,否則是不可能達(dá)到100%的準(zhǔn)確率。
雖然對(duì)部分蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)不完全準(zhǔn)確,但AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)在開(kāi)放數(shù)據(jù)的同時(shí)也提供了相應(yīng)結(jié)構(gòu)預(yù)測(cè)的準(zhǔn)確度報(bào)告,為使用者提供參考。
將開(kāi)啟數(shù)字生物學(xué)新時(shí)代
過(guò)去幾十年來(lái),確定蛋白質(zhì)結(jié)構(gòu)的主要方法是實(shí)驗(yàn)室中的各種成像技術(shù),包括X 射線晶體學(xué)、冷凍電鏡、微晶電子衍射等。
這些方式通常依賴昂貴的設(shè)備,耗時(shí)比較長(zhǎng),解析出一個(gè)蛋白質(zhì)結(jié)構(gòu)可能需要數(shù)月甚至數(shù)年時(shí)間。
與實(shí)驗(yàn)室中的各種成像技術(shù)相比,基于氨基酸序列預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)是一種極具吸引力的方式,也是 AI 在生命科學(xué)領(lǐng)域的重要落腳點(diǎn)。
以 AlphaFold 為代表的蛋白結(jié)構(gòu)預(yù)測(cè)模型可能是人工智能對(duì)科學(xué)界的最大貢獻(xiàn)。
DeepMind 在官方通稿中表示:以 AlphaFold 為代表的蛋白結(jié)構(gòu)預(yù)測(cè)將生物學(xué)帶入了一個(gè)結(jié)構(gòu)更為豐富的時(shí)代,并以數(shù)字化速度開(kāi)啟科學(xué)探索。
結(jié)尾:
數(shù)量龐大的蛋白質(zhì)結(jié)構(gòu)為生命科學(xué)研究帶來(lái)的影響仍是毋庸置疑,尤其是在結(jié)構(gòu)生物學(xué)的領(lǐng)域。
AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)中的結(jié)構(gòu)雖然有不足之處,不能全部將其應(yīng)用于研究中,但數(shù)量龐大的蛋白質(zhì)結(jié)構(gòu)對(duì)生命科學(xué)各個(gè)領(lǐng)域的研究,仍有著不可忽略的意義。
部分資料參考:雷鋒網(wǎng):《AlphaFold 新成果再次引爆生命科學(xué)界》,ZAKER:《AlphaFold把幾乎所有已知蛋白質(zhì)的結(jié)構(gòu)預(yù)測(cè)完了》,硅星人:《DeepMind“順手”放的大招,要一舉攻克漸凍人癥》
原文標(biāo)題 : AI芯天下丨分析丨AlphaFold幾乎破解所有蛋白質(zhì),Deep Mind的下一步戰(zhàn)略?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
ChatZOC,藏在口袋里的「眼科醫(yī)生」
-
金百澤科技亮相中國(guó)國(guó)際醫(yī)療器械博覽會(huì) | 盡顯醫(yī)療領(lǐng)域硬實(shí)力
-
進(jìn)階的新冠疫苗 又一個(gè)中國(guó)造
-
“AI醫(yī)療第一股”鷹瞳科技上市首日即破發(fā)
-
圓心科技登陸港股,“賣藥的生意”還好不好做?
-
十圖解讀2021年中國(guó)康復(fù)醫(yī)療行業(yè)現(xiàn)狀
-
醫(yī)藥流通數(shù)字化運(yùn)營(yíng)實(shí)現(xiàn)精細(xì)化飼養(yǎng)
-
科學(xué)家發(fā)現(xiàn)人體新器官:將有助于癌癥治療
技術(shù)文庫(kù)
最新活動(dòng)更多
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月30-31日報(bào)名參會(huì)>>> 全數(shù)會(huì)2025中國(guó)激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會(huì)
-
精彩回顧立即查看>> 【線下論壇】新唐科技2025新品發(fā)布會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】研華嵌入式核心優(yōu)勢(shì),以Edge AI驅(qū)動(dòng)機(jī)器視覺(jué)升級(jí)
-
精彩回顧立即查看>> OFweek 2025(第十四屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】從直流到高頻,材料電特性參數(shù)的全面表征與測(cè)量
- 1 2025高端醫(yī)療器械國(guó)產(chǎn)替代提速,這些賽道值得關(guān)注!
- 2 多數(shù)人錯(cuò)估了關(guān)稅將對(duì)中國(guó)醫(yī)藥產(chǎn)業(yè)的影響
- 3 一季度醫(yī)療儀器及器械進(jìn)出口報(bào)告:前十大出口市場(chǎng)在哪?
- 4 認(rèn)購(gòu)火爆,映恩生物打響18A IPO重啟信號(hào)槍
- 5 核藥賽道解碼:高壁壘、國(guó)產(chǎn)替代與千億市場(chǎng)卡位
- 6 中國(guó)創(chuàng)新藥出海:機(jī)遇、挑戰(zhàn)與未來(lái)展望
- 7 創(chuàng)新藥是避風(fēng)港,更是發(fā)射臺(tái)!
- 8 第一醫(yī)藥扣非凈利潤(rùn)僅687.40萬(wàn)元:上!半[形土豪”要再沉淀沉淀
- 9 復(fù)星的進(jìn)退與前行
- 10 隱匿的醫(yī)療大佬,10年干出千億級(jí)公司