DeepMind論文登上Nature：困擾數學家數十年的難題，大模型發現全新解-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

DeepMind論文登上Nature：困擾數學家數十年的難題，大模型發現全新解

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Dec 15, 2023 pm 03:07 PM

數據模型

作為今年人工智慧領域的頂尖技術，大型語言模型（LLM）擅長於將概念進行組合，並透過閱讀、理解、寫作和編碼來幫助人們解決問題。但是，它們是否能夠發現全新的知識呢？

鑑於LLM已被證明存在"幻覺"問題，即生成與事實不符的信息，因此利用LLM進行可驗證的正確發現是一項具有挑戰性的任務

現在，來自Google DeepMind 的研究團隊提出了一種為數學和電腦科學問題搜尋解決方案的新方法——FunSearch。 FunSearch 的工作原理是將預先訓練的 LLM（以電腦程式碼的形式提供創意解決方案）與自動「評估器」配對，以防止產生幻覺和錯誤想法。透過在這兩個組件之間來回迭代，最初的解決方案演變成了「新的知識」。相關論文發表在《自然》雜誌。

DeepMind論文登上Nature：困擾數學家數十年的難題，大模型發現全新解

論文網址：https://www.nature.com/articles/s41586-023-06924-6

#這項工作是首次利用LLM 在科學或數學的挑戰性開放問題方面取得新發現。

FunSearch 發掘出全新的 cap set 問題解決方案，這是數學領域中一直存在的未解決問題。此外，DeepMind 還借助該解決方案，探索出更有效率的演算法來解決「裝箱」問題，該問題在許多領域都有廣泛應用，例如資料中心的效率提升。展示了FunSearch 的實際應用價值

研究團隊認為FunSearch 將成為一個特別強大的科學工具，因為它輸出的程式揭示了其解決方案是如何建構的，而不僅僅是是解決方案是什麼。這將會激發科學家的進一步見解，從而形成科學改進與發現的良性循環。

透過語言模型的演化推動發現

FunSearch 採用了由LLM 支援的演化演算法，以鼓勵和推動得分最高的創意和思路。這些創意和想法可以被表達為計算機程序，以便它們可以自動運行和評估

首先，用戶需要將問題的描述以代碼的形式編寫出來。這個描述應該包括評估程序的過程以及用於初始化程序池的種子程序

FunSearch是一個不斷迭代的過程。在每次迭代中，系統會從目前的程序集區中選擇一些程序，並將其傳遞給LLM。 LLM會在此基礎上進行建置並產生新的程序，然後自動進行評估。最佳的程序將被添加回到現有的程式庫中，從而形成一個自我改進的循環。 FunSearch使用了Google的PaLM 2，但也相容於其他接受過程式碼訓練的方法

DeepMind論文登上Nature：困擾數學家數十年的難題，大模型發現全新解

#LLM 會從程式資料庫中檢索出生成的最佳程序，並被要求產生一個更好的程序。

眾所周知，在各個領域中探索新的數學知識和演算法是非常具有挑戰性的任務，往往超出目前最先進的人工智慧系統的能力範圍。為了讓FunSearch能夠勝任這項任務，研究團隊引進了多個關鍵元件。 FunSearch並非從零開始，而是從問題的常識出發，透過演化過程來專注於尋找最關鍵的想法以實現新的發現

此外，FunSearch 的演化過程使用一種策略來提高想法的多樣性，以避免停滯情況。最後，為了提高系統效率，進化過程是並行運作的。

在數學領域開闢新天地

DeepMind 表示，他們首先要解決的是Cap set 問題，這是一個開放性難題，幾十年來一直困擾著多個研究領域的數學家。知名數學家陶哲軒曾把它描述為自己最喜歡的開放性問題。 DeepMind 選擇與威斯康辛大學麥迪遜分校的數學教授 Jordan Ellenberg 合作，他是 Cap set 問題的重要突破者。

一個重要的問題是在高維網格中尋找最大的點集（稱為「cap set」），使得其中沒有三個點共線。這個問題的重要性在於它可以作為極值組合學中其他問題的模型。極端值組合學研究集合可能具有的最小或最大大小，這些集合可以是數字、圖形或其他物件。暴力解法無法解決此問題——需要考慮的可能性數量很快就會超過宇宙中原子的數量

#FunSearch 以程式形式產生的解決方案在某些情況下發現了有史以來最大的cap set。這代表了過去 20 年 cap set 規模的最大成長。此外，FunSearch 的性能超過了最先進的計算求解器，因為這個問題的規模遠遠超出了它們目前的能力。

DeepMind論文登上Nature：困擾數學家數十年的難題，大模型發現全新解

互動式圖表顯示了從種子程式（上）到新的高分函數（下）的演變。每個圓圈都代表一個程序，其大小與分配給它的分數成正比。圖中僅顯示底部程式的上級。 FunSearch 為每個節點產生的對應函數如右側所示。

這些結果表明，FunSearch 技術可以讓人類超越困難組合問題的既定結果，而在這些問題上很難建立直覺。 DeepMind 期望這種方法能夠在組合學中類似理論問題的新發現中發揮作用，並在未來為通訊理論等領域帶來新的可能性。

FunSearch 偏好簡潔、可由人類理解的程式

儘管發現新的數學知識本身意義重大，但與傳統的電腦搜尋技術相比，FunSearch 方法也展現出了其他的優勢。這是因為，FunSearch 並不是只會產生問題解決方案的黑盒子。相反，它產生的程式會描述出這些解決方案是如何得出的。這種「show-your-working」通常是科學家的工作方式，他們透過闡述產生新發現或新現象的過程來解釋這些發現或現象。

FunSearch更傾向於尋找具有較低Kolmogorov複雜度的解決方案，這些解決方案代表了高度緊湊的程序。 Kolmogorov複雜度是指輸出解所需要的最短電腦程式的長度。透過使用簡短的程序，FunSearch可以描述非常大的對象，從而能夠處理非常複雜的問題。此外，這也讓研究者更容易理解FunSearch產生的程式輸出。 Ellenberg表示：「FunSearch提供了一種全新的機制來製定打擊策略。透過FunSearch產生的解決方案在概念上比單純的數字清單更為豐富。透過研究它們，我學到了一些東西。」

更重要的是，FunSearch 程式的這種可解釋性可以為研究人員提供可操作的見解。例如，DeepMind 在使用 FunSearch 的過程中註意到，它的一些高分輸出的程式碼中存在著耐人尋味的對稱性。這讓 DeepMind 對問題有了新的認識，他們利用這種認識改進了引入 FunSearch 的問題，從而找到了更好的解決方案。 DeepMind 認為，這是人類與 FunSearch 在數學領域的許多問題上合作的典範。

DeepMind論文登上Nature：困擾數學家數十年的難題，大模型發現全新解

左圖：透過檢查 FunSearch 產生的程式碼，DeepMind 獲得了更多可操作的見解（高亮部分）。右圖：使用（較短的）左圖程式構造的原始「可接受」集合。

解決一個眾所周知的計算難題

在理論cap set 問題成功的鼓舞下，DeepMind 決定將FunSearch 應用於電腦科學中一個重要的實際挑戰－裝箱問題（bin packing），以探索它的靈活性。裝箱問題關注的是如何將不同尺寸的物品打包到最少數量的箱子中。它是許多現實世界問題的核心，從裝載物品的貨櫃到資料中心的計算工作分配，這些場景都需要最大限度地降低成本。

通常，解決線上裝箱問題會使用基於人類經驗的啟發式演算法規則。然而，針對每種特定情況（大小、時間或容量各不相同）制定一套規則是非常具有挑戰性的。雖然與 cap set 問題有很大不同，但使用 FunSearch 來解決這個問題非常容易。 FunSearch 提供了一個自動自訂的程序，可以根據具體情況適應數據，相較於現有的啟發式方法，它能夠使用更少的箱子來裝載相同數量的物品

DeepMind論文登上Nature：困擾數學家數十年的難題，大模型發現全新解