首頁 >科技週邊 >人工智慧 >Google數學AI在Nature發表文章:證明超越1978年吳文俊法定理,展示世界級幾何水平

Google數學AI在Nature發表文章:證明超越1978年吳文俊法定理,展示世界級幾何水平

王林
王林轉載
2024-01-18 18:18:20932瀏覽

GoogleDeepMind再發Nature,Alpha系列AI重磅回歸,數學水準突飛猛進。

AlphaGeometry,無需人類示範達到IMO金牌選手的幾何等級。

Google數學AI在Nature發表文章:證明超越1978年吳文俊法定理,展示世界級幾何水平

有當年AlphaZero無需人類知識學圍棋《Mastering the game of Go without human knowledge》的感覺了。

AlphaGeometry在30道IMO難度的幾何定理證明題中做對了25道,而人類金牌選手平均做對了25.9道。此外,之前SOTA方法(1978年的吳文俊法)僅能做對10道。

Google數學AI在Nature發表文章:證明超越1978年吳文俊法定理,展示世界級幾何水平

IMO金牌得主陳誼廷(Evan Chen)負責評估AI生成的答案,他評價到:

AlphaGeometry的輸出令人印象深刻,既可靠又乾淨。過去的人工智慧解決方案存在偶然性,導致輸出有時需要手動檢查。

AlphaGeometry的解決方案具有可驗證的結構,既可以由機器驗證,也可以由人類理解。它使用經典幾何規則,如角度和相似三角形,就像學生一樣。

除成績亮眼之外,這項研究中還有三個重點引起業界關注:

  • #無需人類演示,也就是只用了AI合成資料訓練,延續了AlphaZero自學圍棋的方式。
  • 大模型結合其他AI方法,與AlphaGo和OpenAI Q*傳聞相似。
  • 與許多先前方法不同,AlphaGeometry可以產生人類可讀的證明過程,且模型和程式碼都開源。

Google數學AI在Nature發表文章:證明超越1978年吳文俊法定理,展示世界級幾何水平

團隊認為,AlphaGeometry提供了一個實現高階推理能力、發現新知識的潛在架構。

這可能有助於推動人工智慧的定理證明——被視為建構AGI的關鍵一步。

Google數學AI在Nature發表文章:證明超越1978年吳文俊法定理,展示世界級幾何水平

另外,量子位元在與作者團隊交流過程中,打聽到了是否真的會讓AlphaGeometry去參加一屆IMO競賽,就像當年AlphaGo挑戰人類圍棋冠軍一樣。

他們表示正在努力提升系統的能力,還需要讓AI能解決幾何以外更廣泛的數學問題。

AI證明幾何也畫輔助線

先前AI系統無法很好解決幾何問題,卡就卡在缺乏優質訓練資料。

人類學習幾何可以藉助紙和筆,在圖像上使用現有知識來發現新的、更複雜的幾何屬性和關係。

Google團隊為此用產生了10億個隨機幾何物件圖,以及其中點和線間的所有關係,最終篩選出1億不同難度的獨特定理和證明,AlphaGeometry在這些資料上完全從頭訓練。

Google數學AI在Nature發表文章:證明超越1978年吳文俊法定理,展示世界級幾何水平

系統由兩個模組組成,相互配合尋找複雜的幾何證明。

  • 語言模型,預測可用來解決問題的幾何結構(也就是新增輔助線)
  • 符號推理引擎,使用邏輯規則推導出結論。

Google數學AI在Nature發表文章:證明超越1978年吳文俊法定理,展示世界級幾何水平

一作Trieu Trinh介紹,AlphaGeometry的運作過程類似人腦分為快與慢兩種類型。

也就是諾貝爾經濟學獎得主丹尼爾‧卡尼曼的暢銷書《思考快與慢》中普及的「系統1、系統2」概念。

系統1提供快速、直覺的想法,系統2提供更深思熟慮、理性的決策。

一方面,語言模型擅長識別資料中的模式和關係,可以快速預測潛在有用的輔助結構,但通常缺乏嚴格推理或解釋其決策的能力。

另一方面,符號推理引擎基於形式邏輯並使用明確的規則來得出結論。它們是理性且可解釋的,但它們緩慢且不靈活,尤其是在獨自處理大型、複雜的問題時。

例如在解決一個IMO 2015年的競賽題時,藍色部分為AlphaGeometry的語言模型添加的輔助結構,綠色部分是最終證明的精簡版,共有109個步驟。

Google數學AI在Nature發表文章:證明超越1978年吳文俊法定理,展示世界級幾何水平

在做題過程中,AlphaGeometry也發現了2004年IMO競賽題中一個未使用的前提條件,並因此發現了更廣義的定理版本。

不需要O是BC的中點這個條件,就能證明P、B、C共線。

Google數學AI在Nature發表文章:證明超越1978年吳文俊法定理,展示世界級幾何水平

另外研究也發現,對於人類得分最低的3個問題,AlphaGeometry也需要非常長的證明過程和增加非常多的輔助結構才能解決。

但在相對簡單的問題上,人類平均分數和AI產生的證明長度之間沒有顯著相關性 (p = −0.06)

Google數學AI在Nature發表文章:證明超越1978年吳文俊法定理,展示世界級幾何水平

One More Thing

對於AlphaGeometry與AlphaGo的聯繫和區別,在與團隊交流過程中,Google科學家Quoc Le 介紹到:

他們都是在一個非常複雜的決策空間中搜索,但AlphaGo的方法更傳統(註:神經網路負責模式識別),AlphaGeometry中的神經網路負責建議下一步要採取的行動,指導搜尋演算法在決策空間中向正確的方向移動。

雖然這次成果隨Alpha系列命名,第一單位也是Google DeepMind,但其實作者主要是前Google大腦成員。

Quoc Le大神不用過多介紹,一作Trieu Trinh與通訊作者Thang Luong都在谷歌工作了六七年,Thang Luong自己高中時也是IMO選手。

兩位華人作者中,何河是紐約大學助理教授。吳宇懷先前參與了Google數學大模型Minerva研究,現在已經離開谷歌加入馬斯克團隊,成為xAI的聯合創始人之一。

論文地址:https://www.nature.com/articles/s41586-023-06747-5。

參考連結:
[1]https://www.nature.com/articles/d4186-024-00141 -5。

[2]https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry。

以上是Google數學AI在Nature發表文章:證明超越1978年吳文俊法定理,展示世界級幾何水平的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除