由Google DeepMind開發的AlphaGenome,近期登上了《Nature》雜誌封面。這項研究可說揭開了基因的黑盒子,讓AI能夠解讀DNA並預測突變,為疾病及藥物研究開闢出一條新的道路。
Google DeepMind曾憑藉AlphaFold獲得2024年諾貝爾化學獎後,如今他們的研究範圍從蛋白質折疊更進一步來到DNA領域。AlphaGenome可以幫助科學家解析DNA中的微小差異,找出為什麼會讓我們面臨高血壓、肥胖及失智症等疾病的風險。
AlphaGenome是什麼?
AlphaGenome是一種深度學習模型,擁有一次預測100萬鹼基對的功能(編按:鹼基對是DNA或RNA當中,兩個特定的鹼基(A、T、C、G、U)彼此用氫鍵結合在一起的一對,例如A一定跟T或U、C一定跟G配在一起)。
人類基因組由約30億個鹼基對組成,其中負責編碼蛋白質的區域僅佔2%,其餘98%曾被科學界視為不具備功能的「暗基因組」(Dark Genome),實際上卻是生命的指揮中心,決定了基因在何時、何地以及如何表現。
「我們將AlphaGenome視為一種工具,用以了解基因組中功能性元素的作用。我們希望這能加速人類對生命密碼基礎層面的理解。」Google DeepMind研究工程師那塔莎.拉特謝娃(Natasha Latysheva)表示。
AlphaGenome如何幫助醫學突破?
AlphaGenome厲害的地方在於,能夠打破過去「長度」與「解析度」的權衡難題:想要預測得多就得犧牲細節,想要精準的細節就無法預測太長。
它透過創新的架構設計與分散式計算解決這個兩難,透過結合卷積神經網路及Transformer技術,能夠在預測100萬鹼基對的同時,保持對單個字母極高的解析度。
在性能測試上,AlphaGenome展現了超越以往專門化模型的實力,在預測單一DNA序列的24項測試中,有22項達到當前最先進的水準;在預測突變效應的評估中,則在26項測試中,有25項達到最先進水準。
實際案例:讀取正常與非正常兩組DNA,找出白血病致病原因
而實際案例中,科學家研究一種由未成熟的T細胞(一種白血球)失控生長所引起的白血病。科學家發現,許多致病的關鍵並非在於製造蛋白質的基因本身發生了改變,而是發生在控制基因開關的暗基因組區域。這類突變不會改變蛋白質的結構,而是改變了基因被「開啟」的強度或時機。
AlphaGenomec會同時讀取一組正常的DNA,和另一組是帶有突變的DNA,分別預測這兩組序列在細胞內的運作方式,包括基因表達、剪接以及染色質的摺疊結構。AlphaGenome精準還原變化過程,發現一個微小的非編碼突變,引發了一個新的MYB結合基序(MYB binding motif),並且這個基序最終成為引發T細胞失控增長、導致癌症的原因。
AlphaGenome成功將一個看似無關緊要的非編碼區突變,與其下游的致癌基因連結起來,直接揭示了疾病發生的分子機制,揭示該模型不僅能「讀」DNA,還能模擬突變如何干擾細胞內的調控網絡,將原本需要數個月實驗的研究縮短至幾週甚至幾秒鐘。
AlphaGenome有哪些應用潛力?
AlphaGenome的核心價值在於能解讀過去難以分析的98%「非編碼DNA」(即暗基因組),賦予這項技術在醫學與生物學的應用潛力。
1.疾病診斷
這是AlphaGenome目前最直接且具影響力的應用領域。許多罕見疾病的病因不明,是因為過去的檢測多集中在編碼蛋白質的區域。AlphaGenome能協助科學家找出位於非編碼區的致病突變,為未確診的罕見疾病患者提供診斷線索。
對於癌症、高血壓、失智症和肥胖等成因複雜的疾病,該模型能預測DNA上的微小差異如何影響基因調控,進而改變罹病風險。例如,它能區分哪些突變是推動癌症發展的主要突變,哪些只是附帶發生的。
2.合成生物學與基因治療技術
AlphaGenome不僅能預測DNA,還能輔助「寫」DNA。科學家可利用模型的預測能力將其轉化為設計能力,創造出具備特定功能的人工合成DNA。並且其他AI生成的DNA序列,AlphaGenome也可快速預測這些新序列的功能特徵,提升生成模型的品質。
3.加速基礎研究
AlphaGenome可以成為一個高效的「虛擬實驗室」,大幅降低了傳統生物實驗的時間與成本。在實際進行昂貴的實驗前,研究人員可先在電腦上模擬數百萬個突變的影響,從中篩選出最值得研究的目標,大幅縮短研究週期。
同時專家認為,AlphaGenome未來有望應用於全基因組關聯分析領域,快速處理數以萬計的變異數據,找出疾病與基因的關聯。
雖然潛力巨大,但目前AlphaGenome主要定位為非商業用途的研究工具,去年已向非商業用途開放,至今有約3,000位科學家使用過這項AI工具。
延伸閱讀:
AI龍蝦更名為「Moltbot」!Clawdbot是什麼?跟ChatGPT、Gemini有何不同?要收費嗎?
本文初稿為AI編撰,整理.編輯/陳建鈞
