搜尋
首頁科技週邊人工智慧中國科學院團隊創造了一種統一框架,用於提高酶動力學參數的預測準確性

中國科學院團隊創造了一種統一框架,用於提高酶動力學參數的預測準確性

編輯| 蘿蔔皮

酶動力學參數的預測對於生物技術和工業應用中酶的設計和優化至關重要,然而目前的預測工具在各種任務上的有限性能限制了它們的實際應用。

中國科學院的研究人員最近提出了UniKP,這是一個基於預訓練語言模型的統一框架,可用於預測酶動力學參數,包括酶週轉數(kcat)、米氏常數(Km)和催化效率(kcat/Km),這些參數是從蛋白質序列和底物結構中獲得的。

也提出了基於UniKP (EF-UniKP) 的雙層框架,能夠在考慮環境因素(如 pH 值和溫度)的情況下,穩定地預測 kcat 值。同時,研究團隊也系統性地探討了四種代表性的重新加權方法,成功地降低了高價值預測任務中的預測誤差。

該研究題為《UniKP: a unified framework for the prediction of enzyme kinetic parameters》,於2023年12月11日在《Nature Communications》雜誌上發表。

中國科學院團隊創造了一種統一框架,用於提高酶動力學參數的預測準確性

研究酵素對特定底物的催化效率是生物學中的重要議題,對酵素的演化、代謝工程和合成生物學有深遠影響。測量kcat和Km的體外實驗數據,以及最大周轉率和米氏常數,可以作為衡量酵素催化特定反應效率的指標,用於比較不同酵素的相對催化活性。

目前,酵素動力學參數的測量主要依賴實驗測量,耗時、成本高、勞動強度大,導致實驗測量的動力學參數值資料庫很小。例如,序列資料庫 UniProt 包含超過 2.3 億個酵素序列,而酵素資料庫 BRENDA 和 SABIO-RK 則包含數萬個實驗測量的 kcat 值。 Uniprot 標識符在這些酶資料庫中的整合促進了測量參數和蛋白質序列之間的連接。然而,與酶序列的數量相比,這些連接的規模仍然小得多,限制了定向進化和代謝工程等下游應用的進展。

酶動力學參數預測框架

在這項研究中,中國科學院的研究人員提出了一個名為UniKP的新框架,它基於預訓練語言模型,旨在提高預測酶動力學參數的準確性。這些參數包括kcat、Km和kcat / Km,可以根據給定的酵素序列和底物結構進行預測。研究人員對16種不同的機器學習模型和2種深度學習模型進行了全面比較,並發現UniKP在預測準確性方面表現出色。該研究有望為酶動力學領域的研究和應用提供新的工具和方法。

中國科學院團隊創造了一種統一框架,用於提高酶動力學參數的預測準確性

圖示:UniKP 概述。 (資料來源:論文)

與先前最先進的模型 DLKcat 相比,UniKP 在 kcat 預測任務中表現出了卓越的性能,平均決定係數為 0.68,提高了 20%。研究人員推測,預訓練模型透過使用整個資料庫中的無監督資訊來創建易於學習的酶序列和底物結構表示,對 UniKP 的表現做出了巨大貢獻。

對模型學習的分析表明,蛋白質資訊具有主導作用,這可能是由於酶結構與底物結構相比的複雜性。此外,UniKP 可以有效捕獲酶及其突變體之間 kcat 值的微小差異,包括實驗測量的情況,這對於酶的設計和修飾至關重要。 UniKP 預測值的R^2 與gmean 方法的R^2 的高同一性區域和低同一性區域之間的差異證明了UniKP 在提取更深層的互連資訊方面的能力,從而在這些任務中表現出更高的預測準確度。

兩層框架 EF-UniKP

目前的大部分模型沒有考慮環境因素,這是模擬真實實驗條件的關鍵限制。為了解決這個問題,研究人員提出了一個兩層框架 EF-UniKP,它考慮了環境因素。基於分別具有 pH 和溫度資訊的兩個新建的資料集,EF-UniKP 與初始 UniKP 相比顯示出改進的性能。這是一個準確、高通量、獨立於生物體且依賴環境的 kcat 預測。此外,這種方法有可能擴展到包括其他因素,例如共底物和 NaCl 濃度。

中國科學院團隊創造了一種統一框架,用於提高酶動力學參數的預測準確性

圖示:考慮環境因素的兩層架構。 (資料來源:論文)

然而,由於缺乏綜合數據,現有模型並未考慮這些因素之間的交互作用。隨著實驗技術的進步,包括生物鑄造實驗室自動化和持續進化方法,研究人員預計酶動力學數據將激增。這種湧入不僅豐富了該領域,而且提高了預測模型的準確性。

由於 kcat 資料集的高度不平衡,導致高 kcat 值預測存在較高誤差,該團隊系統地探索了四種代表性的重新加權方法來緩解這一問題。結果表明,每種方法的超參數設定對於改進高 kcat 值預測至關重要。

該團隊證實了目前框架在米氏常數(Km)預測和 kcat / Km 預測方面的強通用性。 UniKP 在預測 Km 值方面實現了最先進的性能,更令人印象深刻的是,在預測 kcat / Km 值方面優於目前最先進模型的綜合結果。此外,研究人員基於實驗測量的 kcat / Km 值以及使用 kcat / Km 資料集上的 kcat 和 Km 預測模型計算的 kcat / Km 值驗證了 UniKP 框架。

值得注意的是,從 UniKP kcat / UniKP Km 得出的值與實驗 kcat / Km 之間觀察到的相關性相對較低(PCC = −0.01)。這種差異可能是由於建立各自模型時使用的不同資料集造成的,因此需要開發一個不同的模型來預測 kcat / Km 值。將來,隨著包含 kcat 和 Km 值的統一資料集的出現,預計 kcat 和 Km 模型的計算輸出將與 kcat / Km 專用模型產生的輸出緊密一致。

在酶的挖掘和進化中具體應用

UniKP 在酪氨酸氨裂解酶(TAL) 酶挖掘和定向進化中的應用,證明了其徹底改變合成生物學和生物化學研究的潛力。這項研究表明,UniKP 有效識別了高活性 TAL,並迅速提高了現有 TAL 的催化效率,RgTAL-489T 的 kcat / Km 值比野生型酵素高出 3.5 倍。

此外,在考慮環境因素時,衍生框架 EF-UniKP 始終能夠以極高的精度識別高活性 TAL 酶,來自 Tephrocybe rancida 的 TrTAL 的 kcat / Km 值比野生型酶高 2.6 倍。結果顯示,5個序列的 kcat 和 kcat / Km 值均超過野生型酵素。

透過加速酶的發現和優化過程,UniKP 預計將成為推進生物催化、藥物發現、代謝工程和其他依賴酶催化過程的領域的強大工具。

局限與展望

然而,目前版本的 UniKP 仍存在一些限制。例如,雖然 UniKP 能夠區分實驗測量的酵素及其變異的 kcat 值,但預測的 kcat 值不夠準確。這可能是由於與已知蛋白質序列和底物結構的數量相比資料集不足。

雖然重新加權方法可以在一定程度上緩解由不平衡的kcat 資料集引起的預測偏差(約6.5% 的改進),但透過合成少數過採樣技術和其他樣本合成方法可以實現更顯著的改進。

合成生物學的一個中心目標是開發數位細胞,它將徹底改變科學家研究生物學的方法。這項研究的一個關鍵先決條件是仔細確定途徑內所有酵素的酵素參數。人工智慧輔助的工具闡明了這項挑戰,提供了一種預測酶動力學的高通量方法。

雖然與早期模型相比,UniKP 預測因子的誤差減少了,但不準確仍然是建立精確代謝模型的重大障礙。納入越來越多的實驗確定的 kcat 和 Km 值可以提高模型的準確性。

接下來,研究人員打算結合最先進的演算法,例如遷移學習、強化學習和其他小樣本學習演算法來有效處理不平衡資料集。並且,該團隊的目標是探索更多應用,包括酵素進化和生物體的全局分析。

論文連結:https://www.nature.com/articles/s41467-023-44113-1

以上是中國科學院團隊創造了一種統一框架,用於提高酶動力學參數的預測準確性的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:机器之心。如有侵權,請聯絡admin@php.cn刪除
閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?Apr 11, 2025 pm 12:13 PM

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

開始使用Meta Llama 3.2 -Analytics Vidhya開始使用Meta Llama 3.2 -Analytics VidhyaApr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

AV字節:Meta' llama 3.2,Google的雙子座1.5等AV字節:Meta' llama 3.2,Google的雙子座1.5等Apr 11, 2025 pm 12:01 PM

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

與機器交談的人類成本:聊天機器人真的可以在乎嗎?與機器交談的人類成本:聊天機器人真的可以在乎嗎?Apr 11, 2025 pm 12:00 PM

連接的舒適幻想:我們在與AI的關係中真的在蓬勃發展嗎? 這個問題挑戰了麻省理工學院媒體實驗室“用AI(AHA)”研討會的樂觀語氣。事件展示了加油

了解Python的Scipy圖書館了解Python的Scipy圖書館Apr 11, 2025 am 11:57 AM

介紹 想像一下,您是科學家或工程師解決複雜問題 - 微分方程,優化挑戰或傅立葉分析。 Python的易用性和圖形功能很有吸引力,但是這些任務需要強大的工具

3種運行Llama 3.2的方法-Analytics Vidhya3種運行Llama 3.2的方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

Meta's Llama 3.2:多式聯運AI強力 Meta的最新多模式模型Llama 3.2代表了AI的重大進步,具有增強的語言理解力,提高的準確性和出色的文本生成能力。 它的能力t

使用dagster自動化數據質量檢查使用dagster自動化數據質量檢查Apr 11, 2025 am 11:44 AM

數據質量保證:與Dagster自動檢查和良好期望 保持高數據質量對於數據驅動的業務至關重要。 隨著數據量和源的增加,手動質量控制變得效率低下,容易出現錯誤。

大型機在人工智能時代有角色嗎?大型機在人工智能時代有角色嗎?Apr 11, 2025 am 11:42 AM

大型機:AI革命的無名英雄 雖然服務器在通用應用程序上表現出色並處理多個客戶端,但大型機是專為關鍵任務任務而建立的。 這些功能強大的系統經常在Heavil中找到

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用