編輯 | KX
近日,生技公司Atomic AI 宣布成功開發了第一個利用化學製圖資料的大型語言模型(LLM)。 Atomic AI 將先進的機器學習技術與最新的結構生物學相結合,旨在破解RNA 藥物的發現之謎
Atomic AI 的研究人員創建了一個新的平台組件,利用內部使用定制濕實驗室分析收集的大規模化學作圖資料。科學家收集了數百萬個 RNA 序列的數據,並進行了超過 10 億個核苷酸水平的測量。透過這些資料的訓練,ATOM-1 對 RNA 有了豐富的了解,然後可以用來優化不同 RNA 模式的特性。
Atomic AI在12月14日發佈了一篇題為《ATOM-1:基於化學圖譜資料建構的RNA結構與功能的基礎模型》的預印本論文,這篇論文發表在bioRxiv。在這篇論文中,Atomic AI詳細描述了他們獨特的ATOM-1™平台組件,這個基礎模型能夠準確預測RNA的結構和功能,對於改善RNA療法的開發具有重要作用
#Atomic AI 首席科學官Manjunath Ramarao 博士說:
「ATOM-1 能夠預測RNA 的結構和功能方面以及RNA 模式的關鍵特徵,包括小分子、mRNA 疫苗、siRNA 和環狀RNA,以幫助有效設計治療方法。我們的目標是創建一個簡化的藥物發現流程,以推進我們自己的管道,並與合作夥伴合作,幫助驗證他們的RNA 靶點和工具,最終快速、更有效地為患者提供所需的治療方法。」
Atomic AI 創始科學家兼機器學習主管Stephan Eismann 博士表示:
「透過建立基於RNA 核苷酸修飾和下一代定序的大型數據集,Atomic AI 團隊創建了首個RNA 基礎模型。我們對我們的模型在RNA 研究的其他方面的廣泛應用以及它優化基於RNA 的藥物的各種特性的潛力感到興奮,例如mRNA 疫苗的穩定性和翻譯效率或siRNA 的活性和毒性。」
基於RNA 的藥物和RNA 標靶藥物正成為治療疾病的有前途的新方法。優化這些療法需要進行耗時且昂貴的實驗篩選,而合理的設計則需要準確理解 RNA 的結構和功能
迄今為止,生命科學界幾乎沒有可用的高品質RNA數據。因為現有的方法,如用於收集體內資訊的動物模型或用於確定3D RNA結構的冷凍電子顯微鏡(cryo-EM),難以使用且耗時。由於缺乏「真實」數據,優化關鍵RNA治療特性(包括穩定性、毒性和翻譯效率)一直具有挑戰性
首個在化學圖譜數據上訓練的RNA 基礎模型
為了回應這項設計挑戰,Atomic AI 推出了 ATOM-1,這是第一個在化學圖譜資料上訓練的 RNA 基礎模型,透過專門為機器學習訓練開發的資料收集策略來實現。在 ATOM-1 嵌入之上使用小型探針(probe)神經網絡,證明該模型已經開發了豐富的 RNA 內部表示。經過有限數量額外數據的訓練,這些小型網路在關鍵 RNA 預測任務上實現了最先進的準確性,這表明這種方法可以實現整個 RNA 領域的療法設計。
ATOM-1 能夠更精確地預測RNA 的二級和三級結構,相較於先前發表的方法
##圖示:在一個二級結構上訓練的具有257 個參數的線性探針可推廣到其他RNA。 (資料來源:論文)圖示:用於三級結構預測的 ATOM-1 探針展示了最先進的準確性。 (資料來源:論文)值得注意的是,在比較ATOM-1 與其他疫苗設計計算工具的回顧性分析中,ATOM-1 優於所有1,600 種其他預測溶液內mRNA 穩定性的方法。基於這些結果,新的基礎模型可以用有限的數據進行調整,以預測 RNA 的不同特性,不僅可以確定 RNA 的結構,還可以預測 RNA 療法的其他關鍵特徵。 圖示:ATOM-1 探針與沒有基礎模型嵌入的基線相比的結構預測。 (資料來源:論文)在過去的兩年半中,我們一直有目的地設計和收集資料來訓練我們的基礎模型,"Atomic AI" 創辦人兼執行長 Raphael Townshend 博士表示。 "透過機器學習和生成人工智慧,我們現在有了一個獨特的機會,ATOM-1 可以透過少量的初始資料點進行調整,以高精度預測RNA 的結構和功能。"以上是RNA藥物發現迎來突破,首個RNA基礎模型揭示超10億個核苷酸水平的測量技術的詳細內容。更多資訊請關注PHP中文網其他相關文章!