DeepMind的蛋白質(zhì)折疊AI解決了50年來(lái)的生物學(xué)重大挑戰(zhàn)_第1頁(yè)
DeepMind的蛋白質(zhì)折疊AI解決了50年來(lái)的生物學(xué)重大挑戰(zhàn)_第2頁(yè)
DeepMind的蛋白質(zhì)折疊AI解決了50年來(lái)的生物學(xué)重大挑戰(zhàn)_第3頁(yè)
DeepMind的蛋白質(zhì)折疊AI解決了50年來(lái)的生物學(xué)重大挑戰(zhàn)_第4頁(yè)
DeepMind的蛋白質(zhì)折疊AI解決了50年來(lái)的生物學(xué)重大挑戰(zhàn)_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

DeepMind的蛋白質(zhì)折疊AI解決了50年來(lái)的生物學(xué)重大挑戰(zhàn)科學(xué)家們表示,谷歌用于預(yù)測(cè)蛋白質(zhì)3D形狀的深度學(xué)習(xí)計(jì)劃有望改變生物學(xué)。前言蛋白質(zhì)是生命的基石,負(fù)責(zé)細(xì)胞內(nèi)發(fā)生的大部分事情。蛋白質(zhì)的工作方式和功能由其三維形狀決定-"結(jié)構(gòu)即功能"是分子生物學(xué)的公理。幾十年來(lái),實(shí)驗(yàn)室實(shí)驗(yàn)一直是獲得良好蛋白質(zhì)結(jié)構(gòu)的主要途徑。從20世紀(jì)50年代開(kāi)始,利用X射線(xiàn)束射向結(jié)晶的蛋白質(zhì),并將衍射光轉(zhuǎn)化為蛋白質(zhì)的原子坐標(biāo)的技術(shù),首次確定了蛋白質(zhì)的完整結(jié)構(gòu)。X射線(xiàn)晶體學(xué)產(chǎn)生了絕大部分的蛋白質(zhì)結(jié)構(gòu)。但是,在過(guò)去的十年里,低溫電鏡已經(jīng)成為許多結(jié)構(gòu)生物學(xué)實(shí)驗(yàn)室青睞的工具??茖W(xué)家們長(zhǎng)期以來(lái)一直想知道,蛋白質(zhì)的構(gòu)成部分:一串不同的氨基酸是如何映射出其最終形狀的許多扭曲和褶皺的。研究人員說(shuō),在20世紀(jì)80年代和90年代,使用計(jì)算機(jī)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的早期嘗試表現(xiàn)不佳。當(dāng)其他科學(xué)家將這些方法應(yīng)用于其他蛋白質(zhì)時(shí),發(fā)表的論文中對(duì)方法的崇高要求往往會(huì)被瓦解。JohnMoult和KrzysztofFidelis兩位教授于1994年創(chuàng)辦了CASP,每?jī)赡赀M(jìn)行一次盲審,以促進(jìn)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方面的新SOTA研究。該活動(dòng)挑戰(zhàn)團(tuán)隊(duì)預(yù)測(cè)已經(jīng)用實(shí)驗(yàn)方法解決的蛋白質(zhì)的結(jié)構(gòu),但這些蛋白質(zhì)的結(jié)構(gòu)還沒(méi)有被公開(kāi)。Moult認(rèn)為這個(gè)實(shí)驗(yàn)極大地改善了這一領(lǐng)域。DeepMind已經(jīng)取得了不俗的成績(jī),展示了人工智能已經(jīng)學(xué)會(huì)了用超人的技術(shù)來(lái)玩各種復(fù)雜的游戲。但DeepMind的聯(lián)合創(chuàng)始人DemisHassabis一直強(qiáng)調(diào),這些成功只是邁向更大目標(biāo)的墊腳石。DeepMind名為AlphaFold的系統(tǒng)在2018年CASP13上的表現(xiàn)讓該領(lǐng)域的許多科學(xué)家大吃一驚,長(zhǎng)期以來(lái),該領(lǐng)域一直是小型學(xué)術(shù)團(tuán)體的堡壘,但其方法與其他應(yīng)用AI的團(tuán)隊(duì)大致相似。AlphaFold的第一次迭代將被稱(chēng)為深度學(xué)習(xí)的AI方法應(yīng)用于結(jié)構(gòu)和遺傳數(shù)據(jù),以預(yù)測(cè)蛋白質(zhì)中氨基酸對(duì)之間的距離。DeepMind公司的JohnJumper說(shuō),在沒(méi)有調(diào)用人工智能的第二步中,AlphaFold使用這些信息來(lái)提出蛋白質(zhì)應(yīng)該是什么樣子的"共識(shí)"模型,他是該項(xiàng)目的領(lǐng)導(dǎo)者。該團(tuán)隊(duì)試圖以這種方法為基礎(chǔ),但最終還是碰壁了。因此,它改變了策略,并開(kāi)發(fā)了一個(gè)人工智能網(wǎng)絡(luò),該網(wǎng)絡(luò)納入了關(guān)于決定蛋白質(zhì)如何折疊的物理和幾何約束的額外信息。Jumper說(shuō),他們還設(shè)置了一個(gè)更困難的任務(wù):網(wǎng)絡(luò)不是預(yù)測(cè)氨基酸之間的關(guān)系,而是預(yù)測(cè)目標(biāo)蛋白質(zhì)序列的最終結(jié)構(gòu)。這是一個(gè)復(fù)雜程度相當(dāng)高的系統(tǒng)。2020年11月30日在兩年一度的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)挑戰(zhàn)賽中,AlphaFold表現(xiàn)優(yōu)于其他約100個(gè)團(tuán)隊(duì),DeepMind和長(zhǎng)期舉辦的"蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)關(guān)鍵評(píng)估"(CASP)競(jìng)賽的組織者宣布DeepMind的AlphaFold的最新版本AlphaFold2可以準(zhǔn)確地預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),已經(jīng)破解了生物學(xué)的一個(gè)重大挑戰(zhàn)。驚人的準(zhǔn)確性CASP歷時(shí)數(shù)月,目標(biāo)蛋白或被稱(chēng)為域的蛋白部分(共約100個(gè))定期發(fā)布,各團(tuán)隊(duì)有幾周時(shí)間提交預(yù)測(cè)結(jié)構(gòu)。然后,一個(gè)獨(dú)立的科學(xué)家團(tuán)隊(duì)會(huì)使用衡量預(yù)測(cè)蛋白與實(shí)驗(yàn)確定的結(jié)構(gòu)相似度的指標(biāo)來(lái)評(píng)估這些預(yù)測(cè)。評(píng)估人員不知道誰(shuí)在進(jìn)行預(yù)測(cè)。Lupas說(shuō),AlphaFold的預(yù)測(cè)是以"427組"的名義到達(dá)的,但它的許多條目的驚人準(zhǔn)確性使它們脫穎而出。一些預(yù)測(cè)比其他預(yù)測(cè)更好,但近三分之二的預(yù)測(cè)在質(zhì)量上與實(shí)驗(yàn)結(jié)構(gòu)相當(dāng)。Moult說(shuō),在某些情況下,并不清楚AlphaFold的預(yù)測(cè)和實(shí)驗(yàn)結(jié)果之間的差異是預(yù)測(cè)錯(cuò)誤還是實(shí)驗(yàn)的人為因素。Moult說(shuō),AlphaFold的預(yù)測(cè)與一種名為核磁共振光譜的技術(shù)確定的實(shí)驗(yàn)結(jié)構(gòu)匹配度很差,但這可能歸結(jié)于原始數(shù)據(jù)如何轉(zhuǎn)換為模型。該網(wǎng)絡(luò)還難以對(duì)蛋白質(zhì)復(fù)合物中的單個(gè)結(jié)構(gòu)或群體進(jìn)行建模,即與其他蛋白質(zhì)的相互作用會(huì)扭曲它們的形狀。Moult說(shuō):與上屆CASP相比,今年各團(tuán)隊(duì)預(yù)測(cè)的結(jié)構(gòu)更加準(zhǔn)確,但大部分的進(jìn)展可以歸功于AlphaFold。在被認(rèn)為難度適中的蛋白質(zhì)上,其他團(tuán)隊(duì)的最佳表現(xiàn)通常在100分的預(yù)測(cè)準(zhǔn)確度上得到75分,而AlphaFold在同樣蛋白上得到90分左右。Moult說(shuō),大約有一半的團(tuán)隊(duì)在總結(jié)他們的方法的摘要中提到了"深度學(xué)習(xí)",這表明人工智能正在對(duì)該領(lǐng)域產(chǎn)生廣泛的影響。其中大部分來(lái)自學(xué)術(shù)團(tuán)隊(duì),但微軟和中國(guó)科技公司騰訊也進(jìn)入了CASP14。紐約市哥倫比亞大學(xué)的計(jì)算生物學(xué)家、CASP參賽者M(jìn)ohammedAlQuraishi渴望挖掘AlphaFold在比賽中的表現(xiàn)細(xì)節(jié),并在12月1日DeepMind團(tuán)隊(duì)展示其方法時(shí),了解更多關(guān)于系統(tǒng)的工作原理。他強(qiáng)烈預(yù)感是,AlphaFold將是變革性的。蛋白三維結(jié)構(gòu)的快速獲取AlphaFold預(yù)測(cè)幫助確定了一種細(xì)菌蛋白的結(jié)構(gòu),Lupas實(shí)驗(yàn)室多年來(lái)一直在試圖破解這種結(jié)構(gòu)。Lupas的團(tuán)隊(duì)之前已經(jīng)收集了原始的X射線(xiàn)衍射數(shù)據(jù),但將這些類(lèi)似羅夏的模式轉(zhuǎn)化為結(jié)構(gòu)需要一些關(guān)于蛋白質(zhì)形狀的信息。獲取這些信息的技巧以及其他預(yù)測(cè)工具都失敗了。Lupas說(shuō):427組的模型在半小時(shí)內(nèi)就給了研究人員結(jié)構(gòu),而此前研究人員花了十年時(shí)間嘗試了所有的方法,"DeepMind的聯(lián)合創(chuàng)始人兼首席執(zhí)行官DemisHassabis表示,該公司計(jì)劃讓AlphaFold變得有用,以便其他科學(xué)家可以采用它。該公司此前公布了AlphaFold第一版的細(xì)節(jié),以便其他科學(xué)家復(fù)制這種方法。AlphaFold可能需要幾天的時(shí)間才能得出預(yù)測(cè)的結(jié)構(gòu),其中包括對(duì)蛋白質(zhì)不同區(qū)域可靠性的估計(jì)。Hassabis補(bǔ)充說(shuō):研究人員剛剛開(kāi)始了解生物學(xué)家會(huì)想要什么,他認(rèn)為藥物發(fā)現(xiàn)和蛋白質(zhì)設(shè)計(jì)是潛在的應(yīng)用。2020年初,該公司發(fā)布了對(duì)少數(shù)SARS-CoV-2蛋白結(jié)構(gòu)的預(yù)測(cè),這些蛋白的結(jié)構(gòu)尚未通過(guò)實(shí)驗(yàn)確定。加利福尼亞大學(xué)伯克利分校的分子神經(jīng)生物學(xué)家StephenBrohawn說(shuō),DeepMind對(duì)一種名為Orf3a的蛋白質(zhì)的預(yù)測(cè)最終與后來(lái)通過(guò)冷凍EM確定的蛋白質(zhì)非常相似,他的團(tuán)隊(duì)在6月份發(fā)布了該結(jié)構(gòu)。真實(shí)世界的影響AlphaFold不太可能關(guān)閉Brohawn等使用實(shí)驗(yàn)方法解決蛋白質(zhì)結(jié)構(gòu)的實(shí)驗(yàn)室。但這可能意味著,質(zhì)量較低、更容易收集的實(shí)驗(yàn)數(shù)據(jù)將成為獲得良好結(jié)構(gòu)的全部需求。一些應(yīng)用,如蛋白質(zhì)的進(jìn)化分析,將蓬勃發(fā)展,因?yàn)楝F(xiàn)有基因組數(shù)據(jù)的海嘯現(xiàn)在可能會(huì)被可靠地轉(zhuǎn)化為結(jié)構(gòu)。英國(guó)欣克斯頓歐洲分子生物學(xué)實(shí)驗(yàn)室-歐洲生物信息學(xué)研究所的結(jié)構(gòu)生物學(xué)家、過(guò)去的CASP評(píng)估員JanetThornton說(shuō):這是一個(gè)使他開(kāi)始認(rèn)為在有生之年不會(huì)得到解決的問(wèn)題。她希望這種方法能夠幫助闡明人類(lèi)基因組中數(shù)千種未解決的蛋白質(zhì)的功能,并理解人與人之間不同的致病基因變異。AlphaFold的表現(xiàn)也是Dee

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論