搜尋
首頁科技週邊人工智慧Olmo 2:完全開源基礎模型

AI2的開創性Olmo 2語言模型是完全開源的,為大語模型(LLMS)領域的性能和透明度樹立了新的基準。這些自回歸模型擁有優化的培訓,創新的數據混合物和高級指導調整技術。讓我們深入研究細節。

“每個人都想要開源的語言模型,但沒有人願意舉起這些沉重的屁股。” - 內森·蘭伯特(@natolambert)

這條推文完美地包圍了AI2克服的挑戰。他們的“ 2 Olmo 2 Furious”紙詳細介紹了他們的成功。

目錄

  • 2 Olmo 2憤怒:深度潛水
  • Olmo 2的主要特徵
    • 強大的訓練穩定性
    • 優化的數據混合物
    • 建築增強功能
  • 訓練後的改進
  • 基礎架構:關鍵成分
  • Olmo 2基準:性能比較
  • 體驗Olmo 2
  • 訪問Olmo 2:關鍵鏈接
  • 結論

2 Olmo 2憤怒:深度潛水

7B和13B參數尺寸可用的Olmo 2通過完全透明度來區分自身。 AI2已公開發布了培訓數據,代碼,食譜,甚至中間檢查站,從而促進了協作和加速研究。這些模型提供的績效與諸如Llama 3.1和Qwen 2.5之類的行業領導者相當,但效率顯著提高。

Olmo 2:完全開源基礎模型

“ 2 Olmo 2 Furious”研究論文提供了全面的細節。

Olmo 2的主要特徵

強大的訓練穩定性

Olmo 2使用:

  • 數據改進:過濾冗餘N-Grams。
  • 改進的初始化:標準化初始化方案。
  • 正則化:採用Z-loss穩定輸出邏輯。

這些改進可以使較大數據集的更平穩培訓和有效處理。

優化的數據混合物

Olmo 2採用了兩階段預處理的方法:

  • 最初的預處理:利用5萬億個代幣高質量的網絡數據。
  • 中期訓練增強:集成域特異性數據集(數學,STEM),以Dolmino Mix 1124數據集為例。

Olmo 2:完全開源基礎模型

建築增強功能

Olmo 2的建築結合了:

  • RMSNORM:用於穩定的激活歸一化。
  • 重新排序的層標準:通過標準化注意力和進發液層輸出來增強穩定性。
  • 高分辨率位置編碼:分辨率增加的旋轉位置嵌入。

這些架構選擇有助於可擴展性和效率。

訓練後的改進

Olmo 2的訓練後培訓利用Tülu3食譜,重點是:

  • 監督微調(SFT):完善的指導跟隨能力。
  • 具有可驗證獎勵(RLVR)的強化學習:在特定任務(數學,事實推理)上優化性能。

這導致Olmo 2教學模型在GSM8K和MMLU等基準中出色。

基礎架構:關鍵成分

AI2的高級基礎設施對Olmo 2的成功至關重要:

Olmo 2:完全開源基礎模型

  • 高性能計算集群:在多個數據中心使用NVIDIA H100 GPU。
  • 燒杯工作負載管理:用於有效的工作負載分配和監視。

這種強大的基礎架構可最大程度地減少培訓中斷並最大化資源利用率。

Olmo 2基準:性能比較

Olmo 2:完全開源基礎模型

Olmo 2在特定任務上經常優於QWEN 2.5和LLAMA 3.1,尤其是在包含Dolmino Mix 1124的情況下。它也表現出了顯著的效率,可相當或出色的結果,較少的鞋失敗了20%。

體驗Olmo 2

訪問模型並自己嘗試!還提供了本地用途的說明。

訪問Olmo 2:關鍵鏈接

結論

Olmo 2代表了開源AI的重大進步,優先考慮透明度和創新。通過公開分享其資源,AI2促進了協作並加速了該領域的進步,從而推動了AI應用程序的未來。

以上是Olmo 2:完全開源基礎模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
特斯拉的Robovan是2024年的Robotaxi預告片中的隱藏寶石特斯拉的Robovan是2024年的Robotaxi預告片中的隱藏寶石Apr 22, 2025 am 11:48 AM

自2008年以來,我一直倡導這輛共享乘車麵包車,即後來被稱為“ Robotjitney”,後來是“ Vansit”,這是城市運輸的未來。 我預見這些車輛是21世紀的下一代過境解決方案Surpas

Sam俱樂部在AI上押注以消除收據檢查並增強零售Sam俱樂部在AI上押注以消除收據檢查並增強零售Apr 22, 2025 am 11:29 AM

革新結帳體驗 Sam's Club的創新性“ Just Go”系統建立在其現有的AI驅動“掃描和GO”技術的基礎上,使會員可以在購物旅行期間通過Sam's Club應用程序進行掃描。

Nvidia的AI Omniverse在GTC 2025擴展Nvidia的AI Omniverse在GTC 2025擴展Apr 22, 2025 am 11:28 AM

NVIDIA在GTC 2025上的增強可預測性和新產品陣容 NVIDIA是AI基礎架構的關鍵參與者,正在專注於提高其客戶的可預測性。 這涉及一致的產品交付,達到績效期望以及

探索Google的功能探索Google的功能Apr 22, 2025 am 11:26 AM

Google的Gemma 2:強大,高效的語言模型 Google的Gemma語言模型家族以效率和性能而慶祝,隨著Gemma 2的到來而擴展。此最新版本包括兩種模型:270億個參數VER

下一波《 Genai:與Kirk Borne博士的觀點》 -Analytics Vidhya下一波《 Genai:與Kirk Borne博士的觀點》 -Analytics VidhyaApr 22, 2025 am 11:21 AM

這一領先的數據劇集以數據科學家,天體物理學家和TEDX演講者Kirk Borne博士為特色。 Borne博士是大數據,AI和機器學習的著名專家,為當前狀態和未來的Traje提供了寶貴的見解

AI適合跑步者和運動員:我們取得了出色的進步AI適合跑步者和運動員:我們取得了出色的進步Apr 22, 2025 am 11:12 AM

這次演講中出現了一些非常有見地的觀點——關於工程學的背景信息,這些信息向我們展示了為什麼人工智能如此擅長支持人們的體育鍛煉。 我將從每位貢獻者的觀點中概括出一個核心思想,以展示三個設計方面,這些方面是我們探索人工智能在體育運動中應用的重要組成部分。 邊緣設備和原始個人數據 關於人工智能的這個想法實際上包含兩個組成部分——一個與我們放置大型語言模型的位置有關,另一個與我們人類語言和我們的生命體徵在實時測量時“表達”的語言之間的差異有關。 Alexander Amini 對跑步和網球都很了解,但他還

傑米·恩格斯特羅姆(Jamie Engstrom)關於卡特彼勒的技術,人才和轉型傑米·恩格斯特羅姆(Jamie Engstrom)關於卡特彼勒的技術,人才和轉型Apr 22, 2025 am 11:10 AM

卡特彼勒(Caterpillar)的首席信息官兼高級副總裁傑米·恩格斯特(Jamie Engstrom)領導了一支由28個國家 /地區的2200多名IT專業人員組成的全球團隊。 在卡特彼勒(Caterpillar)工作了26年,其中包括她目前的四年半,Engst

新的Google照片更新使任何具有Ultra HDR質量的照片流行新的Google照片更新使任何具有Ultra HDR質量的照片流行Apr 22, 2025 am 11:09 AM

Google Photos的新Ultra HDR工具:快速指南 使用Google Photos的新型Ultra HDR工具增強照片,將標準圖像轉換為充滿活力的高動態範圍傑作。對於社交媒體而言,此工具可提高任何照片的影響,

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。