蛋白質解密 三傑獲化學諾獎

  以AI模型計算機技術 助拆解複雜結構

  生命體旺盛的化學反應背後,是蛋白質的貢獻。科學家們完全理解和掌握蛋白質的美好願望,如今已觸手可及。今屆諾貝爾化學獎分別授予科企Google轄下人工智能(AI)企業DeepMind創辦人哈薩比斯和高級科學家詹珀,表彰他們利用AI模型「AlphaFold2」,預測人類世界幾乎所有兩億個已知蛋白質的結構;亦授予美國華盛頓大學生物化學家貝克,表彰他利用計算機技術輔助創造全新的蛋白質,相信其研究成果潛力巨大。

  蛋白質分子通常由20種氨基酸組成,組合方式千變萬化。1960年代以來,研究人員主要使用一種名為「X射線晶體學」的方式,確認蛋白質結構。科學家們發現,蛋白質的三維結構完全由其氨基酸序列決定,但一個蛋白質可能的結構種類多達10的47次方種,如果氨基酸鏈是隨機折疊,單是分析一種蛋白質的結構,就要耗費較宇宙年齡還要長的時間尋找答案。

  「Top7」人造蛋白質改變世界

  伴隨研究進展,人們發現知道蛋白質的氨基酸序列後,可分析其不同部分作用力,預測蛋白質的結構。1994年,一項名為「蛋白質結構預測批判性評估」(CASP)的競賽誕生,全球各地的科學家們定期相聚「猜謎」,謎面是一種蛋白質的氨基酸序列,謎底則要依照該序列,預測蛋白質的三維結構。

  2018年,哈薩比斯團隊利用AI模型AlphaFold參加CASP競賽,其預測準確率接近60%,以絕對優勢奪冠。不過要將準確率提升到90%以上,需要詹珀的協助:在全新版本AlphaFold2當中,詹珀調整着色點,將所有已知蛋白質結構和氨基酸序列資料庫,全部用於AI訓練。2020年競賽中,AlphaFold2的準確率幾乎與X射線晶體學一致,相較後者需耗時數月甚至多年,AI只需幾分鐘便能給出結果。

  人們知曉蛋白質的結構,又能否創造新的蛋白質?1990年代,貝克開始研發預測蛋白質結構的電腦軟件Rosetta,取得一定成果。貝克思考,如果反向利用Rosetta,輸入需要的蛋白質結構,由軟件輸出構建氨基酸序列的建議,或許便能創造出新的蛋白質。在貝克團隊努力下,一款名為「Top7」的人造蛋白質問世,它由93個氨基酸組成,結構極為穩定,與任何天然蛋白質都不相同。該成果自此打開「從頭設計蛋白質」世界的大門,這意味科學家們想要設計有特定功能的蛋白質,除調整天然蛋白質結構外,還可以從零開始將它製造出來。

  逾200萬人曾使用AlphaFold2

  諾貝爾獎委員會稱,截至本月,全球有來自190個國家超過200萬人使用過AlphaFold2。遙想當年,X射線晶體學於1962年獲得當屆化學獎,如今時隔逾60年,人類探索蛋白質結構的效率已大幅提升,更可以自行創造蛋白質,其成果在納米材料作靶向藥和疫苗等領域,都能發揮重要作用。