最近科學界又出現一場爭論,故事的主角是DeepMind位於倫敦的研究中心於2021年12月發表的一篇Science論文,研究人員發現神經網路可以用來訓練並建構比以前更精確的電子密度和交互作用圖,能夠有效解決傳統泛函理論中的系統誤差。
論文連結:https://www.science.org/doi/epdf/10.1126/science.abj6511
文中提出的DM21模型精確地模擬了複雜的系統,如氫鏈、帶電的DNA鹼基對和二元過渡態。對量子化學領域來說,可以說是開闢了一條通往精確的通用函數且可行的技術路線。
DeepMind的研究人員也放出了DM21模型的程式碼,方便同儕復現。
#倉庫連結:https://github.com/deepmind/deepmind-research
依照道理來說,論文和程式碼都公開,還是發表在頂尖期刊上,實驗結果和研究結論基本上是可靠的。
但時隔八個月,來自俄羅斯和韓國的八位研究人員也在Science上發表了一篇科技評論,他們認為DeepMind原始研究中存在問題,即訓練集和測試集可能存在重疊部分,導致實驗結論不正確。
論文連結:https://www.science.org/doi/epdf/10.1126/science.abq3385
如果質疑屬實,那DeepMind這篇號稱化學界重大技術突破的論文,神經網路取得的改進可能都得歸功於資料外洩了。
不過DeepMind的反應也很迅速,在該評論發表的同一天,立刻寫了一篇回應表示反對,並表示強烈譴責:他們提出的觀點要么不正確,要麼與論文的主要結論以及對DM21總體品質的評估無關。
論文連結:https://www.science.org/doi/epdf/10.1126/science.abq4282
著名物理學家費曼曾說過,科學家就是要盡快證明自己是錯的,只有這樣才能進步。
雖然這次討論的結果還沒有定論,俄羅斯團隊也沒有進一步發表反駁文章,但該事件對人工智慧領域的研究可能會產生更深遠的影響:即該如何證明自己訓練得到的神經網路模型,真正理解了任務,而非只是記憶pattern?
研究問題
化學是21世紀的中心科學(確信),例如設計具有指定特性的新材料,如生產清潔電力或開發高溫超導體,都需要在電腦上對電子進行模擬。
電子是控制原子如何結合形成分子的亞原子粒子,也負責固體中的電流流動,了解電子在分子內的位置可以大大有助於解釋其結構、性質和反應性。
1926年,薛丁格提出薛丁格方程,能夠正確描述波函數的量子行為。但用該方程式來預測分子中的電子則顯得力不從心,因為所有的電子都相互排斥,需要追蹤每個電子位置的機率,即使對於少量電子來說也是一項非常複雜的任務。
1960 年代出現了一項重大突破,當時Pierre Hohenberg和Walter Kohn意識到沒有必要單獨追蹤每個電子。相反,知道任何電子在每個位置的機率(即電子密度)就足以準確計算所有交互作用。
在證明了上述理論後,Kohn獲得諾貝爾化學獎,從而創立了密度泛函理論(density functional theory, DFT)
儘管DFT 證明mapping存在,但50多年來,電子密度和相互作用能之間映射的確切性質,即所謂的密度泛函仍然未知,必須進行近似求解。
DFT本質上還是一種求解薛丁格方程式的方法,其準確性取決於它的交換相關(exchange-correlation)部分。雖然DFT涉及一定程度的近似,但它是研究物質在微觀層面如何以及為何以某種方式表達的唯一實用方法,因此已成為所有科學領域中使用最廣泛的技術之一。
多年來,研究人員提出了400多種精確度不同的近似函數,但所有這些近似都存在系統誤差,因為它們無法捕捉精確泛函的某些關鍵數學特性。
一說到學習近似函數,這不就是神經網路在做的事嗎?
DeepMind在這篇論文裡就是在分子資料和具有分數電荷和自旋的虛構系統上訓練一個神經網路DM 21 (DeepMind 21),成功學習到了一個沒有系統錯誤的泛函,能夠避免離域誤差(delocalization error)和自旋對稱性破缺(spin symmetry breaking),可以更好地描述廣泛的化學反應類別。
從原理上來說,任何涉及電荷移動的化學物理過程都容易出現離域誤差,任何涉及鍵斷裂的過程都容易出現自旋對稱性破缺。而電荷運動和鍵斷裂是許多重要技術應用的核心,但這些問題也可能導致描述最簡單分子(如氫)的官能基出現大量定性失敗。
模型搭建採用的是多層感知器(MLP),輸入為被佔領的Kohn-Sham(KS)軌道的局部和非局部特徵。
目標函數包含兩個:一個是用於學習交換相關能本身的迴歸損失,另一個是確保函數導數在訓練後可用於自洽場(self-consistent field , SCF)計算的梯度正規化項。
對於迴歸損失,研究人員用一個固定密度的資料集,代表了2235個反應的反應物和產物,透過最小二乘法目標,訓練網路從這些密度映射到高準確度的反應能量,其中1161個訓練反應代表了小型主族H-Kr分子的原子化、電離、電子親和力和分子間結合能,1074個反應代表了H-Ar原子的關鍵FC和FS密度。
訓練後得到的模型DM21能夠在大型主族基準的所有反應上自洽地運行,產生更準確的分子密度。
真SOTA還是資料外洩?
DeepMind在訓練DM21時,所採用的資料是分數電荷系統,例如帶有半個電子的氫原子。
為了證明DM21的優越性,研究人員在一組拉伸二聚體(stretched dimers)上,稱為bond-breaking benchmark(BBB)群組,進行測試。例如兩個氫原子相距很遠,總共有一個電子。
實驗結果發現DM21泛函在BBB測試集上表現出出色的性能,超越了迄今為止所有測試的經典DFT泛函和DM21m(與DM21 訓練相同,但在訓練集中沒有分數電荷)。
然後DeepMind在論文中宣稱:DM21已經了解分數電荷系統背後的物理原理。
但仔細觀察就會發現BBB組中,所有二聚體都變得與訓練組中的系統非常相似。實際上,由於電弱相互作用的局部性,原子相互作用僅在短距離處強,在此之外,兩個原子的行為基本上就好像它們沒有相互作用。
俄羅斯科學院澤林斯基有機化學研究所的研究小組長Michael Medvedev解釋說,在某些方面,神經網路就像人類一樣,他們更喜歡因為錯誤的原因得到正確的答案。因此,訓練神經網路並不難,但你很難證明它已經學習了物理定律,而不是只是記住正確的答案。
因此,BBB 測試集不是一個合適的測試集:它不會測試DM21 對分數電子系統的理解,對此類系統的DM21 處理的其他四個證據的徹底分析也沒有得出決定性的結論:只有它在SIE4x4 集上的良好精度可能是可靠的。
俄羅斯的研究者也認為,在訓練集中使用分數電荷系統並不是DeepMind工作中唯一的新穎之處。他們透過訓練集將物理約束引入神經網路的想法,以及透過對正確化學勢的訓練來賦予物理意義的方法,未來可能會廣泛用於神經網路DFT 泛函的建構。
DeepMind回應
對於Comment論文聲稱的DM21對於訓練集外預測分數電荷(FC)和分數自旋(FS)條件的能力在論文中沒有得到證明,這是基於訓練集與斷鍵基準BBB有約50%的重疊,以及其他泛化例子的有效性和準確性得出的結論。
DeepMind不同意該分析,並認為所提出的觀點要么不正確,要么與本文的主要結論和對DM21總體質量的評估不相關,因為BBB並不是論文中所展示的FC和FS行為的唯一例子。
訓練集和測試集之間的overlap是機器學習中值得關注的研究問題:記憶意味著一個模型可以透過複製訓練集中的例子在測試集上表現較好。
Gerasimov認為DM21在BBB上的表現(包含有限距離的二聚體)可以透過複製FC和FS系統的輸出(即原子在無限分離極限時與二聚體匹配)得到很好的解釋。
為了證明DM21的泛化超出了訓練集,DeepMind研究人員也考慮H2 (陽離子二聚體)和H2(中性二聚體)的原型BBB例子,可以得出結論:確切的exchange-correlation函數是非局部的;隨著距離的增加,返回一個常數記憶的值會導致BBB預測出現顯著錯誤。
以上是連續反轉! DeepMind遭俄羅斯團隊質疑:我們該如何證明神經網路懂物理世界?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

使用Gemma範圍探索語言模型的內部工作 了解AI語言模型的複雜性是一個重大挑戰。 Google發布的Gemma Scope是一種綜合工具包,為研究人員提供了一種強大的探索方式

解鎖業務成功:成為商業智能分析師的指南 想像一下,將原始數據轉換為驅動組織增長的可行見解。 這是商業智能(BI)分析師的力量 - 在GU中的關鍵作用

SQL的Alter表語句:動態地將列添加到數據庫 在數據管理中,SQL的適應性至關重要。 需要即時調整數據庫結構嗎? Alter表語句是您的解決方案。本指南的詳細信息添加了Colu

介紹 想像一個繁華的辦公室,兩名專業人員在一個關鍵項目中合作。 業務分析師專注於公司的目標,確定改進領域,並確保與市場趨勢保持戰略一致。 simu

Excel 數據計數與分析:COUNT 和 COUNTA 函數詳解 精確的數據計數和分析在 Excel 中至關重要,尤其是在處理大型數據集時。 Excel 提供了多種函數來實現此目的,其中 COUNT 和 COUNTA 函數是用於在不同條件下統計單元格數量的關鍵工具。雖然這兩個函數都用於計數單元格,但它們的設計目標卻針對不同的數據類型。讓我們深入了解 COUNT 和 COUNTA 函數的具體細節,突出它們獨特的特性和區別,並學習如何在數據分析中應用它們。 要點概述 理解 COUNT 和 COU

Google Chrome的AI Revolution:個性化和高效的瀏覽體驗 人工智能(AI)正在迅速改變我們的日常生活,而Google Chrome正在領導網絡瀏覽領域的負責人。 本文探討了興奮

重新構想影響:四倍的底線 長期以來,對話一直以狹義的AI影響來控制,主要集中在利潤的最低點上。但是,更全面的方法認識到BU的相互聯繫

事情正穩步發展。投資投入量子服務提供商和初創企業表明,行業了解其意義。而且,越來越多的現實用例正在出現以證明其價值超出


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

Atom編輯器mac版下載
最受歡迎的的開源編輯器

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

Dreamweaver CS6
視覺化網頁開發工具