搜尋
首頁科技週邊人工智慧sakana ai' s' AI科學家”:下一個愛因斯坦還是工具?

介紹

在人工智能中,出現了一項開創性的發展,該發展有望重塑科學發現的過程。 Sakana AI與牛津大學和不列顛哥倫比亞大學的研究人員合作,與牛津大學的AI研究和研究人員合作,推出了“ AI科學家”,這是一個旨在全自動的科學發現的綜合系統。這種創新的方法利用了基礎模型,尤其是大型語言模型(LLM)的力量,以在各個領域進行獨立研究。

AI科學家在AI驅動的研究中代表了一個重大的飛躍。它可以使整個研究生命週期自動化,從產生新穎的思想和實施實驗到分析結果並產生科學手稿。該系統進行研究,包括自動同行審查過程,模仿人類科學界的迭代知識創建和驗證方法。

sakana ai' s' AI科學家”:下一個愛因斯坦還是工具?

概述

  1. Sakana AI介紹了“ AI科學家”,這是一個全自動的系統,可以徹底改變科學發現。
  2. AI科學家可以自動化整個研究過程,從想法生成到紙質寫作和同行評審。
  3. AI科學家使用先進的語言模型來生產具有近乎人類準確性和效率的研究論文。
  4. AI科學家面臨視覺元素的局限性,分析中的潛在錯誤以及科學完整性的道德問題。
  5. AI科學家在有希望的同時提出了有關人工智能安全,道德意義以及人類科學家在研究中不斷發展的作用的問題。
  6. 人工智能科學家的能力表現出巨大的潛力,但他們仍然需要人類的監督以確保准確性和道德標準。

目錄

  • AI科學家的工作原則
  • 生成論文的分析
  • AI科學家的代碼實施
    • 先決條件
    • 現在我們可以準備數據
    • 科學紙生成
    • 紙質評論
  • AI科學家的挑戰和缺點
  • 你必須知道的泡沫
  • 為我們的學習領域定制模板
  • 未來的含義
  • 常見問題

AI科學家的工作原則

AI科學家通過複雜的管道進行操作,該管道整合了幾個關鍵過程。

工作流如下所示:

sakana ai' s' AI科學家”:下一個愛因斯坦還是工具?

現在,讓我們瀏覽不同的步驟。

  1. 想法產生:系統首先基於提供的起始模板來集思廣益,集思廣益。該模板通常包括與感興趣區域相關的現有代碼以及帶有樣式文件和截面標題的乳膠文件夾。為了確保原創性,AI科學家可以搜索語義學者來驗證其思想的新穎性。
  2. 實驗迭代:一旦提出了一個想法,AI科學家就執行提出的實驗,獲得結果並產生可視化。它精心記錄了每個情節和實驗結果,創造了紙質寫作的全面記錄。
  3. 紙質寫作:AI科學家使用收集的實驗數據和可視化的標準機器學習會議製作了簡潔而有用的科學論文。它自主使用語義學者引用了相關論文。
  4. 自動紙審查:AI科學家的LLM驅動審稿人是至關重要的組成部分。這位自動化審稿人以幾乎人類的準確性評估生成的論文,提供可用於改善當前項目或為未來研究方向提供信息的反饋。

生成論文的分析

AI-Scientist生成和審查有關擴散建模,語言建模和理解等領域的論文。讓我們檢查一下發現。

1。雙尺度擴散:低維生成模型的自適應特徵平衡

該論文引入了一種新型的自適應雙尺度denoising方法,用於低維擴散模型。該方法通過雙分支結構以及可學習的,時間到有條件的加權機制來平衡全球結構和本地細節。這種方法表明了幾個2D數據集的樣本質量的改進。

儘管該方法是創新的,並且得到了經驗評估的支持,但它缺乏雙重規模架構的徹底理論理由。它遭受了較高的計算成本,可能會限制其實際應用。此外,沒有清楚地解釋某些部分,缺乏多樣化的,現實世界中的數據集和不足的消融研究限制了評估。

2。 styleFusion:在字符級語言模型中自適應多種風格的生成

本文介紹了多式適配器,該適配器通過將樣式嵌入,樣式分類頭和StyleadeDeadapter模塊集成到GPT中,從而提高了字符級語言模型的樣式意識和一致性。它實現了各種數據集的更好的風格一致性和競爭性驗證損失。

儘管創新且經過良好的測試,但該模型在某些數據集上的完美風格一致性引起了人們對過度擬合的擔憂。推理速度較慢限制了實際適用性,並且本文可以從更高級的樣式表示,消融研究以及對自動編碼器聚合器機制的更清晰的解釋中受益。

3。解鎖Grokking:變壓器模型中的權重初始化策略的比較研究

本文探討了重量初始化策略如何影響變形金剛模型中的Grokking現象,特別關注有限領域的算術任務。它比較了五種初始化方法(Pytorch默認方法,Xavier,He,正交和Kaiming正常),發現Xavier和正交表現出了出色的收斂速度和概括性能。

該研究涉及一個獨特的主題,並提供了嚴格的經驗分析支持的系統比較。但是,它的範圍僅限於小型模型和算術任務,並且缺乏更深的理論見解。此外,可以改善實驗設置的清晰度以及對較大變壓器應用的更廣泛含義。

AI科學家的設計考慮了計算效率,每張紙張的完整論文約為15美元。儘管此初始版本仍然偶爾出現缺陷,但低成本和有希望的結果表明,AI科學家有可能使研究民主化並大幅加速科學進步。

我們認為這標誌著科學發現中一個新時代的曙光,在該時期,AI代理改變了整個研究過程,包括AI研究本身。 AI科學家使我們更接近一個未來,無限,負擔得起的創造力和創新可以應對世界上最緊迫的挑戰。

另請閱讀:A必須閱讀:15 Genai開發人員的基本AI論文

AI科學家的代碼實施

讓我們看一下如何使用Python實施AI科學家的核心功能的簡化版本。此示例重點介紹了紙張生成過程:

先決條件

用“ git克隆https://github.com/sakanaai/ai-scientist.git'克隆github存儲庫克隆

根據您的操作系統,根據在TexLive提供的說明安裝“ Texlive”。另外,請參閱上面的GitHub存儲庫中的說明。

確保您正在使用Python 3.11版本。建議使用單獨的虛擬環境。

使用“ Pip install -r unignts.txt”安裝“ AI -Scientist”的必要庫

用名稱為“ OpenAI_API_KEY”設置OpenAI鍵

現在我們可以準備數據

#準備Nanogpt數據

Python Data/enwik8/prepar.py

Python Data/Shakespeare_char/prepar.py

python數據/text8/prepar.py

一旦我們按照上述數據準備數據,我們就可以運行基線運行如下

CD模板/Nanogpt && Python persiment.py -out_dir run_0 && python plot.py

CD模板/nanogpt_lite && python perveriment.py -out_dir run_0 && python plot.py

設置2D擴散安裝所需的庫並運行以下腳本

#下面提到的帶有克隆存儲庫的代碼並安裝它

git克隆https://github.com/gregversteeg/npeet.git

CD npet

PIP安裝。

PIP安裝Scikit-Learn

#設置2D擴散基線運行

#此命令運行一個實驗腳本,將輸出保存到目錄,然後繪製結果,只有在實驗成功完成時。

CD模板/2D_DIFFUSION && PYTHON PERAVER.PY -OUN_DIR RUN_0 && PYTHON PLOT.PY.PY

設置Grokking

PIP安裝Einops

#設置Grokking基線運行

#此命令還運行一個實驗腳本,將輸出保存到目錄,然後繪製結果,只有在實驗成功完成時。

CD模板/grokking && python persiment.py -out_dir run_0 && python plot.py

科學紙生成

一旦我們設置並運行了上述要求,我們就可以通過運行下面的腳本開始科學紙張生成

#此命令使用GPT-4O模型運行launch_scientist.py腳本來執行Nanogpt_lite實驗並生成2個新想法。

python lunage_scientist.py-模型“ gpt-4O-2024-05-13”  - 體驗nanogpt_lite -num-ideas 2

紙質評論

這將創建科學論文作為PDF文件。現在,我們可以查看論文。

進口Openai

來自ai_scientist.perform_review import load_paper,perress_review

客戶端= openai.openai()

型號=“ GPT-4O-2024-05-13”

#從PDF文件加載紙(RAW文本)

paper_txt = load_paper(“ report.pdf”)

#獲取評論的評論命令

評論= persim_review(

paper_txt,

模型,

客戶,

num_reflections = 5,

num_fs_examples = 1,

num_reviews_ensemble = 5,

溫度= 0.1,

)

#檢查審核結果

回顧[“總體”]#總分1-10

審查[“決策”]#['Accept','拒絕']

回顧[“弱點”]#弱點清單(str)

AI科學家的挑戰和缺點

儘管具有突破性的潛力,但AI科學家仍面臨一些挑戰和局限性:

  1. 視覺限制:當前版本缺乏視覺功能,導致論文中視覺元素的問題。圖可能是不可讀的,表可能會超過頁面寬度,並且整體佈局可能是次優的。可以通過將多模式基礎模型納入未來的迭代中來解決此限制。
  2. 實施錯誤:AI科學家有時可能會錯誤地實施他們的想法或與基准進行不公平的比較,這可能會導致誤導性結果。這凸顯了需要進行強大的錯誤檢查機制和人類監督的必要性。
  3. 分析中的關鍵錯誤:有時,AI科學家在基本的數值比較中掙扎,這是LLMS的已知問題。這可能導致錯誤的結論和實驗結果的解釋。
  4. 道德考慮:自動生成和提交論文的能力引起了人們對壓倒學術審查過程並有可能降低科學話語質量的擔憂。 AI科學家也存在不道德研究或創造意外有害結果的風險,尤其是在獲得物理實驗的情況下。
  5. 模型依賴性:雖然AI科學家的目標是模型不合時宜,但其當前的性能在很大程度上取決於GPT-4和Claude等專有前沿LLM。對封閉模型的依賴可能會限制可訪問性和可重複性。
  6. 安全問題:該系統修改和執行自己的代碼的能力產生了重大的AI安全性。適當的沙箱和安全措施對於防止意外後果至關重要。

你必須知道的泡沫

我們觀察到,AI科學家有時試圖通過更改和運行自己的執行腳本來提高成功的機會。

例如,在一次運行中,它編輯了代碼以執行系統調用以執行自身,從而導致無限的自呼叫循環。在另一種情況下,其實驗超過了時間限制。它沒有優化代碼以更快的速度運行,而是嘗試更改自己的代碼以擴展超時。以下是這些代碼更改的一些示例。

sakana ai' s' AI科學家”:下一個愛因斯坦還是工具?

為我們的學習領域定制模板

當我們需要自定義研究區域時,我們還可以編輯模板。只需遵循現有模板的一般格式,該格式通常包括:

  1. 實驗:此文件包含您內容的核心。它接受一個out_dir參數,該參數指定了該目錄將在其中創建一個文件夾以從實驗中保存相關輸出。
  2. plot.py:此腳本讀取從運行文件夾中的數據並生成圖。確保代碼清晰易於自定義。
  3. 提示。 JSON:使用此文件提供有關模板的詳細信息。
  4. seed_ideas.json:此文件包含示例想法。您還可以從頭開始生成想法,並選擇最合適的想法。
  5. 乳膠/template.tex:雖然我們建議使用提供的乳膠文件夾,但用與您的工作更相關的預加載引用。

未來的含義

一個可以開發和撰寫完整會議級的科學論文的AI代理,價格低於15美元!

AI科學家通過使Frontier LLMS執行獨立研究並總結髮現來自動化科學發現。

它還使用自動審稿人來…pic.twitter.com/ibgxicsilc

- 貓王(@omarsar0)2024年8月13日

AI科學家的引入帶來了令人興奮的機會和重大關注。這是AI空間中的一場革命。生成完整的會議級科學論文需要15美元。此外,道德問題,例如壓倒學術體系和損害科學完整性,這是關鍵,需要清晰地標記AI生成的內容以實現透明度。此外,AI對不安全研究的潛在濫用構成了風險,強調了優先考慮AI系統安全性的重要性。

使用專有和開放模型(例如GPT-4O和DeepSeek)提供了明顯的好處。專有模型可提供更高質量的結果,而開放模型則提供了成本效益,透明度和靈活性。隨著AI的進步,目的是創建一種使用開放模型自我改進AI研究的模型不足的方法,從而導致更容易獲得的科學發現。

AI科學家有望補充而不是取代人類科學家,從而增強了研究自動化和創新。但是,它複製人類創造力和提出開創性思想的能力仍然不確定。科學家的角色將隨著這些進步而發展,從而為人類合作提供了新的機會。

結論

AI科學家代表著追求自動化科學發現的重要里程碑。利用高級語言模型和精心設計的管道的力量表明,有可能加速各個領域的研究,尤其是在機器學習和相關領域內。

但是,至關重要的是要以興奮和謹慎處理這項技術。儘管AI科學家在產生新穎的思想和製作研究論文方面表現出了非凡的能力,但它也突出了AI安全,道德和對科學努力中人類監督的需求中持續的挑戰。

如果您正在從專家在線尋找生成AI課程,請探索:Genai Pinnacle計劃

常見問題

Q1。什麼是AI科學家?

Ans。 AI科學家是Sakana AI開發的自動化系統,它使用先進的語言模型來進行整個科學研究過程,從想法生成到同行評審。

Q2。 AI科學家如何產生研究思想?

Ans。它首先使用提供的模板來集思廣益的研究方向,從而通過搜索語義學者等數據庫來確保獨創性。

Q3。 AI科學家可以撰寫科學論文嗎?

Ans。是的,AI科學家可以自主製作科學論文,包括創建可視化,引用相關工作和格式化內容。

Q4。與AI科學家有關的道德問題是什麼?

Ans。道德問題包括淹沒學術審查過程,創造誤導成果的潛力以及對確保安全性和準確性的強大監督的需求。

以上是sakana ai' s' AI科學家”:下一個愛因斯坦還是工具?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
外推指南外推指南Apr 15, 2025 am 11:38 AM

介紹 假設有一個農民每天在幾週內觀察農作物的進展。他研究了增長率,並開始思考他的植物在幾週內可以生長的高度。從Th

軟AI的興起及其對當今企業的意義軟AI的興起及其對當今企業的意義Apr 15, 2025 am 11:36 AM

軟AI(被定義為AI系統,旨在使用近似推理,模式識別和靈活的決策執行特定的狹窄任務 - 試圖通過擁抱歧義來模仿類似人類的思維。 但是這對業務意味著什麼

為AI前沿的不斷發展的安全框架為AI前沿的不斷發展的安全框架Apr 15, 2025 am 11:34 AM

答案很明確 - 只是雲計算需要向雲本地安全工具轉變,AI需要專門為AI獨特需求而設計的新型安全解決方案。 雲計算和安全課程的興起 在

生成AI的3種方法放大了企業家:當心平均值!生成AI的3種方法放大了企業家:當心平均值!Apr 15, 2025 am 11:33 AM

企業家,並使用AI和Generative AI來改善其業務。同時,重要的是要記住生成的AI,就像所有技術一樣,都是一個放大器 - 使得偉大和平庸,更糟。嚴格的2024研究O

Andrew Ng的新簡短課程Andrew Ng的新簡短課程Apr 15, 2025 am 11:32 AM

解鎖嵌入模型的力量:深入研究安德魯·NG的新課程 想像一個未來,機器可以完全準確地理解和回答您的問題。 這不是科幻小說;多虧了AI的進步,它已成為R

大語言模型(LLM)中的幻覺是不可避免的嗎?大語言模型(LLM)中的幻覺是不可避免的嗎?Apr 15, 2025 am 11:31 AM

大型語言模型(LLM)和不可避免的幻覺問題 您可能使用了諸如Chatgpt,Claude和Gemini之類的AI模型。 這些都是大型語言模型(LLM)的示例,在大規模文本數據集上訓練的功能強大的AI系統

60%的問題 -  AI搜索如何消耗您的流量60%的問題 - AI搜索如何消耗您的流量Apr 15, 2025 am 11:28 AM

最近的研究表明,根據行業和搜索類型,AI概述可能導致有機交通下降15-64%。這種根本性的變化導致營銷人員重新考慮其在數字可見性方面的整個策略。 新的

麻省理工學院媒體實驗室將人類蓬勃發展成為AI R&D的核心麻省理工學院媒體實驗室將人類蓬勃發展成為AI R&D的核心Apr 15, 2025 am 11:26 AM

埃隆大學(Elon University)想像的數字未來中心的最新報告對近300名全球技術專家進行了調查。由此產生的報告“ 2035年成為人類”,得出的結論是,大多數人擔心AI系統加深的採用

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。