21個物種的“阿爾法折疊2”結(jié)構(gòu)模型中特征結(jié)構(gòu)元素的空間。圖片來源:《自然·結(jié)構(gòu)與分子生物學(xué)》
科技日報實(shí)習(xí)記者 張佳欣
據(jù)最近發(fā)表在《自然·結(jié)構(gòu)與分子生物學(xué)》上的論文,包括西班牙何塞·卡雷拉斯白血病研究所癌癥免疫遺傳學(xué)小組負(fù)責(zé)人愛德華·波爾塔博士在內(nèi)的一個團(tuán)隊,比較了現(xiàn)有可用的新結(jié)構(gòu)得出結(jié)論:“阿爾法折疊2”為任何給定物種貢獻(xiàn)了額外25%的高質(zhì)量蛋白質(zhì)結(jié)構(gòu)。
“阿爾法折疊2”是深度思維公司開發(fā)的一種神經(jīng)網(wǎng)絡(luò),專門用于根據(jù)蛋白質(zhì)的氨基酸序列精確解析蛋白質(zhì)的3D結(jié)構(gòu)。
“阿爾法折疊2”數(shù)據(jù)庫已經(jīng)發(fā)布了21種模式生物的典型蛋白質(zhì)亞型的預(yù)測,幾乎涵蓋了365198個蛋白質(zhì)中的每一個殘基。這大約是蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(PDB)中實(shí)驗(yàn)結(jié)構(gòu)數(shù)量的兩倍,獨(dú)特蛋白質(zhì)數(shù)量的六倍。
許多蛋白質(zhì)在癌癥等疾病中發(fā)揮的關(guān)鍵作用已為人所知,但科學(xué)家缺乏對它們在分子水平上的功能的深入了解。這些結(jié)構(gòu)信息將幫助科學(xué)家更好地了解這些蛋白質(zhì),了解它們可能在細(xì)胞內(nèi)與哪些其他分子相互作用,并設(shè)計能夠在它們改變時干擾其功能的新藥。
“阿爾法折疊2”的功能也有局限性。團(tuán)隊發(fā)現(xiàn),該算法在試圖重建蛋白質(zhì)復(fù)合體時存在問題。大多數(shù)蛋白質(zhì)與其他蛋白質(zhì)一起完成生物功能,因此極其需要預(yù)測不同蛋白質(zhì)是如何粘在一起的。另一個局限性是它無法顯示突變蛋白質(zhì)的結(jié)構(gòu),突變通常會導(dǎo)致蛋白質(zhì)功能異常,是癌癥等許多疾病的原因。
盡管如此,團(tuán)隊認(rèn)識到“阿爾法折疊2”將在未來幾年極大地影響基礎(chǔ)和生物醫(yī)學(xué)研究。這不僅歸功于它的直接貢獻(xiàn),即數(shù)千個新的可靠的3D蛋白質(zhì)模型,而且還因?yàn)樗_啟了一個基于人工智能的計算工具的新時代,能夠產(chǎn)生沒有人能預(yù)料的結(jié)果。
事實(shí)上,這個時代已經(jīng)開始了。最近,“臉書”母公司Meta的一個團(tuán)隊使用了其自然語言預(yù)測器的修改版本來“自動補(bǔ)全”蛋白質(zhì)。這款名為ESMFold的人工智能工具似乎沒有谷歌的同類工具那么準(zhǔn)確,但速度要快60倍,并可以克服一些已知的“阿爾法折疊2”的局限性,例如處理突變的序列。
正如論文作者所言,“‘阿爾法折疊2’和即將到來的工具的應(yīng)用將對生命科學(xué)產(chǎn)生革命性的影響”。