GPT-4O MINI：OpenAI的最新模型如何堆疊？-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

GPT-4O MINI：OpenAI的最新模型如何堆疊？

Joseph Gordon-Levitt

Apr 19, 2025 am 11:09 AM

Openai的最新產品GPT-4O Mini標誌著朝著負擔得起且可訪問的高級AI邁出的重要一步。這個小型語言模型（SLM）直接挑戰諸如Llama 3和Gemma 2之類的競爭對手，具有低潛伏期，成本效益和大量128K令牌上下文窗口。本文深入研究了對GPT-4O Mini的全面評估，將其性能與其前任GPT-3.5 Turbo和GPT-4O進行了一系列任務。

關鍵功能

具有成本效益和快速的： GPT-4O MINI優先考慮效率，以比較大型號低得多的成本提供接近實時的響應。
多模式潛力：當前支持文本和圖像輸入時，未來的計劃包括音頻和視頻集成。
出色的基準性能： GPT-4O MINI在推理，數學和編碼基準測試中表現出卓越的性能，超過了其前任和競爭對手。
廣泛的可用性：可通過OpenAI的API（助手，聊天完成和批處理API）訪問，使開發人員很容易獲得高級AI功能。

探索GPT-4O MINI的功能
性能基準和比較
定價和可用性
比較任務分析
設置和代碼示例
任務1：零射門分類
任務2：很少分類
任務3：Python編碼
任務4：SQL編碼
任務5：信息提取
任務6：封閉域問題回答
任務7：開放域問題回答
任務8：文檔摘要
任務9：內容轉換
任務10：語言翻譯
結論

探索GPT-4O MINI的功能

Openai對負擔能力的關注在GPT-4O Mini的設計中很明顯。其低成本和延遲有助於生成AI應用的快速發展。 “大上下文”窗口可以處理廣泛的文本數據，從而快速響應和API調用的有效並行化。

像GPT-4O一樣，GPT-4O MINI是多模式的，目前正在處理文本和圖像，並提供了對音頻和視頻的未來支持。截至2023年10月，經過培訓，它擁有128K令牌輸入上下文窗口和每個請求的16K令牌輸出限制。與GPT-4O共享同樣的令牌，它為非英語提示提供了改進的性能。

性能基準和比較

對各種LLM的嚴格測試，包括雙子座，克勞德，GPT-3.5 Turbo和GPT-4O，揭示了GPT-4O Mini的出色性能。

GPT-4O MINI：OpenAI的最新模型如何堆疊？

關鍵基準測試結果突出了GPT-4O Mini的優勢：

推理： MMLU的得分為82.0％，超過雙子座閃光燈（77.9％）和Claude Haiku（73.8％）。
數學：在MGSM上獲得87.0％的成績，超過雙子座閃光燈（75.5％）和Claude Haiku（71.7％）。
編碼：人類事件的分數為87.2％，優於Gemini Flash（71.5％）和Claude Haiku（75.9％）。
多模式推理： MMMU的出色表現，得分為59.4％，而Gemini Flash的得分為56.1％，Claude Haiku為50.2％。

通過人工分析的獨立分析進一步驗證了GPT-4O MINI的速度和成本優勢。

GPT-4O MINI：OpenAI的最新模型如何堆疊？

GPT-4O MINI在功能和工具調用方面也很出色，使其適合複雜的AI代理開發。它提高了長篇下說的性能和提取結構化數據並產生高質量電子郵件響應的能力是顯著的優勢。

定價和可用性

GPT-4O Mini可以通過OpenAI的助手，聊天完成和批處理API來獲得。定價具有很高的競爭力：\ $ 0.15每100萬輸入令牌和每100萬輸出令牌\ $ 0.60。預計還可以通過ChatGpt（免費，加上和團隊計劃）訪問。

GPT-4O MINI：OpenAI的最新模型如何堆疊？

（剩餘的響應將繼續對每個任務進行詳細分析，反映了原始輸入的結構和內容，但是通過略有釋義和句子進行了重組，以達到所需的釋義水平。這些圖像將保持不變並且以其原始形式。）。

以上是GPT-4O MINI：OpenAI的最新模型如何堆疊？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

特斯拉的Robovan是2024年的Robotaxi預告片中的隱藏寶石Apr 22, 2025 am 11:48 AM

自2008年以來，我一直倡導這輛共享乘車麵包車，即後來被稱為“ Robotjitney”，後來是“ Vansit”，這是城市運輸的未來。我預見這些車輛是21世紀的下一代過境解決方案Surpas

Sam俱樂部在AI上押注以消除收據檢查並增強零售Apr 22, 2025 am 11:29 AM

革新結帳體驗 Sam's Club的創新性“ Just Go”系統建立在其現有的AI驅動“掃描和GO”技術的基礎上，使會員可以在購物旅行期間通過Sam's Club應用程序進行掃描。

Nvidia的AI Omniverse在GTC 2025擴展Apr 22, 2025 am 11:28 AM

NVIDIA在GTC 2025上的增強可預測性和新產品陣容 NVIDIA是AI基礎架構的關鍵參與者，正在專注於提高其客戶的可預測性。這涉及一致的產品交付，達到績效期望以及

探索Google的功能Apr 22, 2025 am 11:26 AM

Google的Gemma 2：強大，高效的語言模型 Google的Gemma語言模型家族以效率和性能而慶祝，隨著Gemma 2的到來而擴展。此最新版本包括兩種模型：270億個參數VER

下一波《 Genai：與Kirk Borne博士的觀點》 -Analytics VidhyaApr 22, 2025 am 11:21 AM

這一領先的數據劇集以數據科學家，天體物理學家和TEDX演講者Kirk Borne博士為特色。 Borne博士是大數據，AI和機器學習的著名專家，為當前狀態和未來的Traje提供了寶貴的見解

AI適合跑步者和運動員：我們取得了出色的進步Apr 22, 2025 am 11:12 AM

這次演講中出現了一些非常有見地的觀點——關於工程學的背景信息，這些信息向我們展示了為什麼人工智能如此擅長支持人們的體育鍛煉。我將從每位貢獻者的觀點中概括出一個核心思想，以展示三個設計方面，這些方面是我們探索人工智能在體育運動中應用的重要組成部分。邊緣設備和原始個人數據關於人工智能的這個想法實際上包含兩個組成部分——一個與我們放置大型語言模型的位置有關，另一個與我們人類語言和我們的生命體徵在實時測量時“表達”的語言之間的差異有關。 Alexander Amini 對跑步和網球都很了解，但他還