搜尋
首頁科技週邊人工智慧DeepMind論文登上Nature:困擾數學家數十年的難題,大模型發現全新解

作為今年人工智慧領域的頂尖技術,大型語言模型(LLM)擅長於將概念進行組合,並透過閱讀、理解、寫作和編碼來幫助人們解決問題。但是,它們是否能夠發現全新的知識呢?

鑑於LLM已被證明存在"幻覺"問題,即生成與事實不符的信息,因此利用LLM進行可驗證的正確發現是一項具有挑戰性的任務

現在,來自Google DeepMind 的研究團隊提出了一種為數學和電腦科學問題搜尋解決方案的新方法——FunSearch。 FunSearch 的工作原理是將預先訓練的 LLM(以電腦程式碼的形式提供創意解決方案)與自動「評估器」配對,以防止產生幻覺和錯誤想法。透過在這兩個組件之間來回迭代,最初的解決方案演變成了「新的知識」。相關論文發表在《自然》雜誌。

DeepMind論文登上Nature:困擾數學家數十年的難題,大模型發現全新解

論文網址:https://www.nature.com/articles/s41586-023-06924-6

#這項工作是首次利用LLM 在科學或數學的挑戰性開放問題方面取得新發現。

FunSearch 發掘出全新的 cap set 問題解決方案,這是數學領域中一直存在的未解決問題。此外,DeepMind 還借助該解決方案,探索出更有效率的演算法來解決「裝箱」問題,該問題在許多領域都有廣泛應用,例如資料中心的效率提升。展示了FunSearch 的實際應用價值

研究團隊認為FunSearch 將成為一個特別強大的科學工具,因為它輸出的程式揭示了其解決方案是如何建構的,而不僅僅是是解決方案是什麼。這將會激發科學家的進一步見解,從而形成科學改進與發現的良性循環。

透過語言模型的演化推動發現

FunSearch 採用了由LLM 支援的演化演算法,以鼓勵和推動得分最高的創意和思路。這些創意和想法可以被表達為計算機程序,以便它們可以自動運行和評估

首先,用戶需要將問題的描述以代碼的形式編寫出來。這個描述應該包括評估程序的過程以及用於初始化程序池的種子程序

FunSearch是一個不斷迭代的過程。在每次迭代中,系統會從目前的程序集區中選擇一些程序,並將其傳遞給LLM。 LLM會在此基礎上進行建置並產生新的程序,然後自動進行評估。最佳的程序將被添加回到現有的程式庫中,從而形成一個自我改進的循環。 FunSearch使用了Google的PaLM 2,但也相容於其他接受過程式碼訓練的方法

DeepMind論文登上Nature:困擾數學家數十年的難題,大模型發現全新解

#LLM 會從程式資料庫中檢索出生成的最佳程序,並被要求產生一個更好的程序。

眾所周知,在各個領域中探索新的數學知識和演算法是非常具有挑戰性的任務,往往超出目前最先進的人工智慧系統的能力範圍。為了讓FunSearch能夠勝任這項任務,研究團隊引進了多個關鍵元件。 FunSearch並非從零開始,而是從問題的常識出發,透過演化過程來專注於尋找最關鍵的想法以實現新的發現

此外,FunSearch 的演化過程使用一種策略來提高想法的多樣性,以避免停滯情況。最後,為了提高系統效率,進化過程是並行運作的。

在數學領域開闢新天地

DeepMind 表示,他們首先要解決的是Cap set 問題,這是一個開放性難題,幾十年來一直困擾著多個研究領域的數學家。知名數學家陶哲軒曾把它描述為自己最喜歡的開放性問題。 DeepMind 選擇與威斯康辛大學麥迪遜分校的數學教授 Jordan Ellenberg 合作,他是 Cap set 問題的重要突破者。

一個重要的問題是在高維網格中尋找最大的點集(稱為「cap set」),使得其中沒有三個點共線。這個問題的重要性在於它可以作為極值組合學中其他問題的模型。極端值組合學研究集合可能具有的最小或最大大小,這些集合可以是數字、圖形或其他物件。暴力解法無法解決此問題——需要考慮的可能性數量很快就會超過宇宙中原子的數量

#FunSearch 以程式形式產生的解決方案在某些情況下發現了有史以來最大的cap set。這代表了過去 20 年 cap set 規模的最大成長。此外,FunSearch 的性能超過了最先進的計算求解器,因為這個問題的規模遠遠超出了它們目前的能力。

DeepMind論文登上Nature:困擾數學家數十年的難題,大模型發現全新解

互動式圖表顯示了從種子程式(上)到新的高分函數(下)的演變。每個圓圈都代表一個程序,其大小與分配給它的分數成正比。圖中僅顯示底部程式的上級。 FunSearch 為每個節點產生的對應函數如右側所示。

這些結果表明,FunSearch 技術可以讓人類超越困難組合問題的既定結果,而在這些問題上很難建立直覺。 DeepMind 期望這種方法能夠在組合學中類似理論問題的新發現中發揮作用,並在未來為通訊理論等領域帶來新的可能性。

FunSearch 偏好簡潔、可由人類理解的程式

儘管發現新的數學知識本身意義重大,但與傳統的電腦搜尋技術相比,FunSearch 方法也展現出了其他的優勢。這是因為,FunSearch 並不是只會產生問題解決方案的黑盒子。相反,它產生的程式會描述出這些解決方案是如何得出的。這種「show-your-working」通常是科學家的工作方式,他們透過闡述產生新發現或新現象的過程來解釋這些發現或現象。

FunSearch更傾向於尋找具有較低Kolmogorov複雜度的解決方案,這些解決方案代表了高度緊湊的程序。 Kolmogorov複雜度是指輸出解所需要的最短電腦程式的長度。透過使用簡短的程序,FunSearch可以描述非常大的對象,從而能夠處理非常複雜的問題。此外,這也讓研究者更容易理解FunSearch產生的程式輸出。 Ellenberg表示:「FunSearch提供了一種全新的機制來製定打擊策略。透過FunSearch產生的解決方案在概念上比單純的數字清單更為豐富。透過研究它們,我學到了一些東西。」

更重要的是,FunSearch 程式的這種可解釋性可以為研究人員提供可操作的見解。例如,DeepMind 在使用 FunSearch 的過程中註意到,它的一些高分輸出的程式碼中存在著耐人尋味的對稱性。這讓 DeepMind 對問題有了新的認識,他們利用這種認識改進了引入 FunSearch 的問題,從而找到了更好的解決方案。 DeepMind 認為,這是人類與 FunSearch 在數學領域的許多問題上合作的典範。

DeepMind論文登上Nature:困擾數學家數十年的難題,大模型發現全新解

左圖:透過檢查 FunSearch 產生的程式碼,DeepMind 獲得了更多可操作的見解(高亮部分)。右圖:使用(較短的)左圖程式構造的原始「可接受」集合。

解決一個眾所周知的計算難題

在理論cap set 問題成功的鼓舞下,DeepMind 決定將FunSearch 應用於電腦科學中一個重要的實際挑戰- 裝箱問題(bin packing),以探索它的靈活性。裝箱問題關注的是如何將不同尺寸的物品打包到最少數量的箱子中。它是許多現實世界問題的核心,從裝載物品的貨櫃到資料中心的計算工作分配,這些場景都需要最大限度地降低成本。

通常,解決線上裝箱問題會使用基於人類經驗的啟發式演算法規則。然而,針對每種特定情況(大小、時間或容量各不相同)制定一套規則是非​​常具有挑戰性的。雖然與 cap set 問題有很大不同,但使用 FunSearch 來解決這個問題非常容易。 FunSearch 提供了一個自動自訂的程序,可以根據具體情況適應數據,相較於現有的啟發式方法,它能夠使用更少的箱子來裝載相同數量的物品

DeepMind論文登上Nature:困擾數學家數十年的難題,大模型發現全新解

使用現有啟發式-Best-fit 啟發式(左)和FunSearch 發現的啟發式(右)進行裝箱的範例。

像是線上裝箱這樣的複雜組合問題可以使用其他人工智慧方法來解決,例如神經網路和強化學習。這些方法也被證明是有效的,但也可能需要大量的資源來部署。另一方面,FunSearch 輸出的程式碼易於檢查和部署,這意味著它的解決方案有可能被應用到各種現實工業系統中,從而迅速帶來效益。

DeepMind:用大模型應對科學挑戰將成普遍做法

FunSearch 證明,如果能防止LLM 產生幻覺,那麼這些模型的力量不僅可以用來產生新的數學發現,還可以用來揭示重要現實問題的潛在解決方案。

DeepMind 認為,對於科學和工業領域的許多問題—— 無論是長期存在的問題還是新問題—— 使用LLM 驅動的方法生成有效和量身定制的演算法將成為普遍做法。

其實,這只是一個開始。隨著 LLM 不斷取得進展,FunSearch 也將持續改進。 DeepMind 表示,他們還將努力擴展其功能,以應對社會上各種緊迫的科學和工程挑戰。

以上是DeepMind論文登上Nature:困擾數學家數十年的難題,大模型發現全新解的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
外推指南外推指南Apr 15, 2025 am 11:38 AM

介紹 假設有一個農民每天在幾週內觀察農作物的進展。他研究了增長率,並開始思考他的植物在幾週內可以生長的高度。從Th

軟AI的興起及其對當今企業的意義軟AI的興起及其對當今企業的意義Apr 15, 2025 am 11:36 AM

軟AI(被定義為AI系統,旨在使用近似推理,模式識別和靈活的決策執行特定的狹窄任務 - 試圖通過擁抱歧義來模仿類似人類的思維。 但是這對業務意味著什麼

為AI前沿的不斷發展的安全框架為AI前沿的不斷發展的安全框架Apr 15, 2025 am 11:34 AM

答案很明確 - 只是雲計算需要向雲本地安全工具轉變,AI需要專門為AI獨特需求而設計的新型安全解決方案。 雲計算和安全課程的興起 在

生成AI的3種方法放大了企業家:當心平均值!生成AI的3種方法放大了企業家:當心平均值!Apr 15, 2025 am 11:33 AM

企業家,並使用AI和Generative AI來改善其業務。同時,重要的是要記住生成的AI,就像所有技術一樣,都是一個放大器 - 使得偉大和平庸,更糟。嚴格的2024研究O

Andrew Ng的新簡短課程Andrew Ng的新簡短課程Apr 15, 2025 am 11:32 AM

解鎖嵌入模型的力量:深入研究安德魯·NG的新課程 想像一個未來,機器可以完全準確地理解和回答您的問題。 這不是科幻小說;多虧了AI的進步,它已成為R

大語言模型(LLM)中的幻覺是不可避免的嗎?大語言模型(LLM)中的幻覺是不可避免的嗎?Apr 15, 2025 am 11:31 AM

大型語言模型(LLM)和不可避免的幻覺問題 您可能使用了諸如Chatgpt,Claude和Gemini之類的AI模型。 這些都是大型語言模型(LLM)的示例,在大規模文本數據集上訓練的功能強大的AI系統

60%的問題 -  AI搜索如何消耗您的流量60%的問題 - AI搜索如何消耗您的流量Apr 15, 2025 am 11:28 AM

最近的研究表明,根據行業和搜索類型,AI概述可能導致有機交通下降15-64%。這種根本性的變化導致營銷人員重新考慮其在數字可見性方面的整個策略。 新的

麻省理工學院媒體實驗室將人類蓬勃發展成為AI R&D的核心麻省理工學院媒體實驗室將人類蓬勃發展成為AI R&D的核心Apr 15, 2025 am 11:26 AM

埃隆大學(Elon University)想像的數字未來中心的最新報告對近300名全球技術專家進行了調查。由此產生的報告“ 2035年成為人類”,得出的結論是,大多數人擔心AI系統加深的採用

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器