人工智慧(AI)一直在迅速發展,但對人類來說,強大的模型卻是個「黑盒子」。
我們不了解模型內部的運作原理,不清楚它得出結論的過程。
然而最近,波昂大學(University of Bonn)的化學資訊學專家Jürgen Bajorath教授和他的團隊取得了重大突破。
他們設計了一種技術,揭示了藥物研究中使用的某些人工智慧系統的運作機制。
研究顯示,人工智慧模型主要透過回憶現有數據來預測藥物有效性,而非學習特定化學交互作用。
-也就是說,AI預測純靠拼湊記憶,機器學習其實並沒有學習!
他們的研究結果最近發表在《自然機器智能》(Nature Machine Intelligence)雜誌上。
論文網址:https://www.nature.com/articles/s42256-023-00756-9
在醫藥領域,研究人員正在狂熱地尋找有效的活性物質來對抗疾病-哪種藥物分子最有效?
通常,這些有效的分子(化合物)會對接在蛋白質上,蛋白質作為觸發特定生理作用鏈的酵素或受體。
在特殊情況下,某些分子也負責阻斷體內的不良反應,例如過度的發炎反應。
可能的化合物數量龐大,尋找有效的化合物就像大海撈針一樣。
因此,研究人員首先使用AI模型來預測,哪些分子最能與各自的目標蛋白對接並牢固結合。然後在實驗研究中,更詳細地進一步篩選這些候選藥物。
自人工智慧發展以來,藥物發現研究也越來越多地採用AI相關的技術。
比如圖神經網路(GNN),適用於預測某種分子與目標蛋白結合的強度。
圖由表示物件的節點和表示節點之間關係的邊組成。在蛋白質與配體複合物的圖表示中,圖的邊連接蛋白質或配體節點,表示物質的結構,或蛋白質和配體之間的相互作用。
GNN模型使用從X射線結構中提取的蛋白質配體相互作用圖,來預測配體親和力。
Jürgen Bajorath教授表示,GNN模型對我們來說就像一個黑盒子,我們無法得知它如何得出自己的預測。
Jürgen Bajorath教授任職於波昂大學LIMES研究所、波昂-亞琛國際資訊科技中心(Bonn-Aachen International Center for Information Technology)和拉瑪機器學習與人工智慧研究所(Lamarr Institute for Machine Learning and Artificial Intelligence)。
人工智慧如何運作?
來自波昂大學化學資訊學的研究人員,與羅馬Sapienza大學的同事一起,詳細分析了圖神經網路是否真的學習到了蛋白質與配體的相互作用。
研究人員使用他們專門開發的「EdgeSHAPer」方法分析了總共六種不同的GNN架構。
EdgeSHAPer程式可以判斷GNN是否學習了化合物和蛋白質之間最重要的相互作用,或者是透過其他的方式來得出預測。
科學家們使用從蛋白質配體複合物結構中提取的圖訓練了六個GNN,——化合物的作用方式以及與目標蛋白的結合強度已知。
然後,在其他複合物上測試經過訓練的GNN,並使用EdgeSHAPer分析GNN如何產生預測。
「如果GNN按照預期行事,它們需要學習化合物和目標蛋白之間的相互作用,並且透過優先考慮特定的相互作用來給出預測」。
然而,根據研究小組的分析,六個GNN基本上都沒有做到這一點。大多數GNN只學會了一些蛋白質與藥物的相互作用,主要集中在配體上。
上圖展示了6個GNN中的實驗結果,色標條表示用EdgeSHAPer確定的每個預測的前25個邊中蛋白質、配體和相互作用所佔的平均比例。
我們可以看到,代表綠色的相互作用本該是模型需要學到的,然而在整個實驗中所佔的比例都不高,而代表配體的橙色條佔了最大的比例。
為了預測分子與目標蛋白的結合強度,模型主要「記住」了它們在訓練過程中遇到的化學相似分子及其結合數據,而不管目標蛋白如何。這些被記住的化學相似性基本上決定了預測。
這讓人想起「聰明的漢斯效應」(Clever Hans effect),--就像那匹看起來會數數的馬,實際上是根據同伴面部表情和手勢的細微差別,來推斷出預期的結果。
這或許意味著,GNN所謂的「學習能力」可能是站不住腳的,模型的預測在很大程度上被高估了,因為可以使用化學知識和更簡單的方法進行同等品質的預測。
不過,研究中也發現了另一個現象:當測試化合物的效力增加時,模型傾向於學習到更多的相互作用。
也許透過修改表徵和訓練技術,這些GNN還能朝著理想的方向進一步改進。不過,對於可以根據分子圖學習物理量的假設,一般來說應該要謹慎看待。
「人工智慧不是黑魔法。」
#以上是AI未經學習!最新研究揭示了解讀人工智慧黑盒的方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

連接的舒適幻想:我們在與AI的關係中真的在蓬勃發展嗎? 這個問題挑戰了麻省理工學院媒體實驗室“用AI(AHA)”研討會的樂觀語氣。事件展示了加油

介紹 想像一下,您是科學家或工程師解決複雜問題 - 微分方程,優化挑戰或傅立葉分析。 Python的易用性和圖形功能很有吸引力,但是這些任務需要強大的工具

Meta's Llama 3.2:多式聯運AI強力 Meta的最新多模式模型Llama 3.2代表了AI的重大進步,具有增強的語言理解力,提高的準確性和出色的文本生成能力。 它的能力t

數據質量保證:與Dagster自動檢查和良好期望 保持高數據質量對於數據驅動的業務至關重要。 隨著數據量和源的增加,手動質量控制變得效率低下,容易出現錯誤。

大型機:AI革命的無名英雄 雖然服務器在通用應用程序上表現出色並處理多個客戶端,但大型機是專為關鍵任務任務而建立的。 這些功能強大的系統經常在Heavil中找到


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能

記事本++7.3.1
好用且免費的程式碼編輯器

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境