ChatGPT等大模型點燃人工智慧新一輪熱潮之際,另一種累積數百萬年的天書般「語言」也試圖用該技術獲得最新解碼。近日,全球基因定序儀龍頭因美納(Illumina)宣布推出全新的人工智慧演算法PrimateAI-3D,以求更準確地預測患者致病基因突變。
每年產生的基因組數據總量接近400億GB,這是根據美國國家衛生研究院發布的數據得出的。但是,獲得這些數據只是解決許多生命謎團的第一步,要讓它們對人類健康有真正的幫助,還需要深入的解讀和分析。
目前的科學研究顯示,每個人都攜帶著數百萬種基因變異,正是這些變異導致了健康和疾病風險的個體差異,但目前大多數變異的作用方式尚不明確。美國貝勒醫學院人類基因組定序中心和因美納人工智慧實驗室希望能藉助PrimateAI-3D更進一步解決問題。
據因美納方面介紹,PrimateAI-3D採用了與ChatGPT和AlphaFold類似的深度神經網路架構,不同之處在於PrimateAI-3D是根據基因組序列而不是人類語言來進行訓練。 「你可以在維基百科和其他地方的現有文本上訓練ChatGPT等生成語言模型,我們使用了類似的深度學習架構,但我們的數據來自數百萬年的自然選擇。」因美納人工智慧副總裁Kyle Farh表示。
另外,在ChatGPT等生成語言模型中,現有的文本就可以為訓練提供信息,而人類基因組中導致疾病的基因變異在很大程度上卻是未知的。為解決這個問題,PrimateAI-3D利用自然選擇來訓練深度神經網路的參數,這種訓練是基於先前對233種不同靈長類動物進行定序時發現的數百萬種良性基因變異來開展,這也是迄今為止所進行的最大規模的非人靈長類物種定序工作。
翻譯:我們已經證明了,我們對於非人類靈長類動物的基因變異了解越多,就能越準確地預測可能導致人類疾病的變異。 重寫:我們已經驗證,隨著我們對非人靈長類動物的遺傳變異了解程度的增加,我們能夠更準確地預測哪些突變可能導致人類疾病。 」來自美國貝勒醫學院的Jeffrey Rogers說。
隨後,包括Rogers在內的美國貝勒醫學院人類基因組定序中心及分子與人類遺傳學系的研究人員和Farh領導的因美納人工智慧實驗室團隊,將PrimateAI-3D演算法應用到了英國生物樣本庫的近50萬個個體中,識別出潛在的致病人類突變。最近,《科學》(Science)這個頂尖學術期刊上發表了兩篇與之相關的研究。
他們發現,在調查的90種不同臨床病症中,一般人群裡97%的健康成員的基因組中至少潛伏著一種高度可幹預變異。研究結果也發現了導致常見疾病高風險的罕見基因變異。 Farh說,整體而言,PrimateAI-3D在評估心血管疾病和2型糖尿病等健康問題的遺傳風險方面,比以往任何一種方法準確度都要提高至少12%。
Farh補充指出,這項新技術具有的優勢之一是它可普及於全人類。這也意味著,其克服了現有遺傳風險評估中固有的對歐洲白人血統人群的偏見,這些評估主要基於這些群體的數據。
因美納首席技術官Alex Aravanis表示,「將最新的人工智慧技術應用於基因組學,以揭示糖尿病、心臟病和自體免疫疾病等複雜遺傳疾病的關鍵底層訊息,這項技術的推出為因美納在遺傳風險預測和藥物標靶發現方面帶來巨大機會。”
據因美納方面表示,PrimateAI-3D將整合在因美納的互聯軟體中,供基因組學界使用。
以上是定序儀巨擘因美納基於靈長類基因推出AI演算法,預測致病基因突變的詳細內容。更多資訊請關注PHP中文網其他相關文章!