21個物種的“阿爾法折疊2”結構模型中特征結構元素的空間。圖片來源:《自然·結構與分子生物學》
科技日報實習記者?張佳欣
據最近發表在《自然·結構與分子生物學》上的論文,包括西班牙何塞·卡雷拉斯白血病研究所癌癥免疫遺傳學小組負責人愛德華·波爾塔博士在內的一個團隊,比較了現有可用的新結構得出結論:“阿爾法折疊2”為任何給定物種貢獻了額外25%的高質量蛋白質結構。
“阿爾法折疊2”是深度思維公司開發的一種神經網絡,專門用于根據蛋白質的氨基酸序列精確解析蛋白質的3D結構。
“阿爾法折疊2”數據庫已經發布了21種模式生物的典型蛋白質亞型的預測,幾乎涵蓋了365198個蛋白質中的每一個殘基。這大約是蛋白質結構數據庫(PDB)中實驗結構數量的兩倍,獨特蛋白質數量的六倍。
許多蛋白質在癌癥等疾病中發揮的關鍵作用已為人所知,但科學家缺乏對它們在分子水平上的功能的深入了解。這些結構信息將幫助科學家更好地了解這些蛋白質,了解它們可能在細胞內與哪些其他分子相互作用,并設計能夠在它們改變時干擾其功能的新藥。
“阿爾法折疊2”的功能也有局限性。團隊發現,該算法在試圖重建蛋白質復合體時存在問題。大多數蛋白質與其他蛋白質一起完成生物功能,因此極其需要預測不 同蛋白質是如何粘在一起的。另一個局限性是它無法顯示突變蛋白質的結構,突變通常會導致蛋白質功能異常,是癌癥等許多疾病的原因。
盡管如此,團隊認識到“阿爾法折疊2”將在未來幾年極大地影響基礎和生物醫學研究。這不僅歸功于它的直接貢獻,即數千個新的可靠的3D蛋白質模型,而且還因為它開啟了一個基于人工智能的計算工具的新時代,能夠產生沒有人能預料的結果。
事實上,這個時代已經開始了。最近,“臉書”母公司Meta的一個團隊使用了其自然語言預測器的修改版本來“自動補全”蛋白質。這款名為ESMFold的 人工智能工具似乎沒有谷歌的同類工具那么準確,但速度要快60倍,并可以克服一些已知的“阿爾法折疊2”的局限性,例如處理突變的序列。
正如論文作者所言,“‘阿爾法折疊2’和即將到來的工具的應用將對生命科學產生革命性的影響”。
關注微信公眾號(kjxw001)及微博(中國科技新聞網)

