根據外媒Tech Xplore報道,麻省理工學院的研究人員最近開發了一種叫做EquBind的新模型,這個模型可以提前預測新蛋白質分子的結構,提升藥物開發的效率。
目前這項技術已經得到了業界內的認可,闡述這項技術的論文也將在7月被國際機器學習會議(ICML)會議接收。
目前,藥物研發是一件漫長而又昂貴的事情。其中最主要的原因就是開發藥物的成本十分昂貴。這種成本不僅包括數十億美元的資金投入,還包括長達數十年的研究時間。
而且在研發的過程中,90%的藥物都會因為無效或副作用太多而研發失敗,只有10%的藥物能夠順利通過食品藥物管理局的檢查,被批准上市。
因此,藥廠會提高研發成功藥品的價格,來彌補研發失敗藥品造成的損失,所以目前有些藥物的價格居高不下。
▲一些蛋白質分子結構
如果研究人員想要進行藥物開發,就要先找到有開發潛力的類藥物分子(drug-like molecules)。藥物研發進展緩慢還有另一個重要的原因,那就是現存的類藥物分子數量龐大。數據顯示,目前現存的類藥物分子多達1016種,這個數字遠遠超出了現有的分子計算模型的計算上限。
為了處理資料如此龐大的分子,加快藥物開發的進程,麻省理工學院電子工程和電腦科學系的研一學生Hannes St rk開發了一種稱為「EquBind」的幾何深度學習模型。 EquBind比現存最快的分子計算對接模型運行速度快1200倍,能夠更快找到類藥物分子。
目前大多數傳統的分子計算對接模型都是透過一種稱為「配體-蛋白質」(ligand- to-protein binding)的方法尋找類藥物分子。具體而言,模型需要先接收大量的樣本分子,然後讓配體與各種分子結合,然後模型再對不同分子進行評分,再以最後的排名來篩選出最合適的分子。但這種做法流程繁複,模型尋找類藥物分子的效率較低。
Hannes St rk對這個過程做了一個形象的比喻,他說:「以前的典型的『配體-蛋白質』方法就好像是試圖讓模型把鑰匙插入有很多鑰匙孔的鎖,模型要花費大量的時間為鑰匙和每一個鎖孔的適配度打分,再選出最合適的那個。」
他繼續解釋:「而EquBind可以跳過最花費時間的步驟,可以在遇到新分子時提前預測最合適的'鎖孔',這就是所謂的'盲配對'(blind docking)。EquBind有內置的幾何推理算法,能夠幫助模型學習分子的基本結構。這個算法可以讓EquBind在遇到新的分子時直接預測出最合適的位置,而不用花費大量的時間嘗試不同的位置並打分數。」
▲麻省理工學院
這個模型引起了治療公司Relay的首席數據官帕特·沃爾特斯(Pat Walters)的注意。沃爾斯特建議Hannes St rk的研究團隊使用這種模型來進行用於治療肺癌、白血病和胃腸道腫瘤的藥物開發。通常而言,用於這些領域藥物的蛋白質配體很難用大多數傳統的方法對接,但是EquBind卻能讓它們成功對接。
▲兩種治療肺癌的抑制劑藥物
沃特斯說:「EquBind為蛋白質對接問題提供了一種獨特的解決方案,它解決了結構預測和綁定位點識別等問題。這種方法可以很好地利用數千種公開的晶體結構信息,EquBind可能會以新的方式影響這個領域。」
發表這項技術的論文將在7月被國際機器學習會議(ICML)接收,該論文的作者Hannes St rk表示:「我很期待能在這次會議上收到一些關於EquBind模型的改進意見。」
AI製藥是一個2020年才走進公眾視野的新興領域。
製藥領域是一個天然的AI場景。新藥研發的長週期、高成本、低成功率,為AI留下了龐大的用武之地:機器可以自主學習數據、挖掘數據,總結歸納專家經驗外的藥物研發規律,繼而優化藥物研發流程中的各環節,不僅可以提升藥物研發效率與成功率,還有望降低研發費用與試誤成本。
因為這樣的特性和發展潛力,目前AI製藥勢頭正盛。但也有業內人士唱衰,說AI在製藥過程中扮演的終歸只是輔助角色,繞不開行業固有的流程和機制,不可能用兩三年的時間做完十年的事。
但整體而言,目前AI製藥領域還是不斷有新的技術突破,發展蒸蒸日上。
以上是效率提升1200倍!麻省理工開發AI製藥新模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!