首頁  >  文章  >  科技週邊  >  力壓GPT-4o!新王Claude 3.5 Sonnet來了,直接免費可用

力壓GPT-4o!新王Claude 3.5 Sonnet來了,直接免費可用

王林
王林原創
2024-06-22 01:08:30901瀏覽
如今,大模型領域更捲了!

前腳 OpenAI 發布 GPT4o,硬控全場,後腳就被最大的競爭對手 Anthropic 超越了。

力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用

剛剛,Anthropic 發布了全新大模型 Claude 3.5 Sonnet,號稱是迄今為止最聰明的模型

力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用

據介紹,Claude 3.5 Sonnet 是 Anthropic 即將推出的 Claude 3.5 系列的首個版本。該模型提高了整個領域的智慧水平,在絕大多數基準評估中都超越了競品大模型和自家前代最強 Claude 3 Opus。同時,運行速度、成本與自家前代 Claude 3 Sonnet 相當。
力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用
地址:https://claude.ai/

目前,Claude 3.5 Sonnet 已經在Claude.ai 和Claude iOS 應用程式上免費提供,而Claude ProTeam 計劃規劃的速率訪問它。

此外,Claude 3.5 Sonnet 已經可以直接透過 Anthropic API、亞馬遜雲端科技 Bedrock 等管道使用。 每百萬個輸入 token 的價格為 3 美元,每百萬個輸出 token 的價格為 15 美元,上下文視窗為 200k token

力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用

力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用

                           Claude、GPT、Gemini三個模型迭代中發佈時間軸。

Anthropic 稱其目標是每隔幾個月大幅改善效能、速度和成本之間的權衡曲線。今年稍後將發布 Claude 3.5 Haiku 和 Claude 3.5 Opus。

除了開發下一代大模型之外,Anthropic 正在開發新的模式和功能,以支援更多企業用例,包括與企業應用程式的整合。團隊也正在探索諸如 Memory 之類的功能,使得模型能夠記住使用者的偏好和指定的互動歷史,從而實現更個人化和高效的體驗。

比GPT-4o 更聰明
比Claude 3 OpusC 快兩倍

C 快兩倍力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用
C 快兩倍
能力(HumanEval) 設定了新的行業基準
。它在理解細微差別、幽默和複雜指令方面表現出顯著的進步,並且擅長以自然、親切的語氣撰寫高品質的內容。


Claude 3.5 Sonnet 的運行速度是 Claude 3 Opus 的兩倍。這種性能的提升加上實惠的價格,使 Claude 3.5 Sonnet 成為複雜任務的理想選擇。

在內部代理編碼評估中,Claude 3.5 Sonnet 解決了 64% 的問題,優於 Claude 3 Opus(解決了 38%)。 Anthropic  評估測試了 Claude 3.5 Sonnet 根據自然語言描述的需求,修復錯誤或增加功能到開源程式碼庫中的能力。

在獲得指導和相關工具後,Claude 3.5 Sonnet 可以獨立編寫、編輯和執行程式碼,並具有複雜的推理和故障排除功能。 Claude 3.5 Sonnet 可以輕鬆處理程式碼轉換,這對於更新舊版應用程式和遷移程式碼庫特別有效。
下表為 Claude 3.5 Sonnet 與其他模型的比較,評估基準包括推理、閱讀理解、數學、科學和編碼。在所有這些基準測試中,Claude 3.5 Sonnet 的表現均優於先前的前沿模型 Claude 3 Opus。

力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用

我們也可以看到表中 Claude3.5 與 GPT-4o 的對比數據,除了數學方面,得分都比 GPT-4o 高或逼近

迄今為止最強視覺模型

Anthropic 表示,
Claude 3.5 Sonnet 是其最強的視覺模型,在所有標準之前都超越了標準前標33 Opus Njpus。

尤其是在需要視覺推理的任務中表現更為明顯,例如解釋圖表、圖形或從不完美的圖像中轉錄文本,這是零售、物流和金融服務行業的核心功能。在這些領域,人工智慧可以從圖像、圖形或插圖中收集到比單獨文字中更多的見解。 力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用

🎜🎜🎜下圖為 Claude 3.5 Sonnet 與 Claude 3 Opus、GPT-4o、Gemini 1.5 Pro 在視覺數學推理、科學圖表、視覺問答、圖表 QA、文件視覺 QA 任務中的表現比較。 🎜🎜🎜🎜
Artifacts—— 使用 Claude 的新方式

Anthropic 也在 Claude.ai 上推出了 Artifacts,這是一項擴展用戶與 Claude 互動方式的新功能。當使用者要求 Claude 產生程式碼片段、文字文件或網站設計等內容時,這些工件會出現在他們的對話旁邊的專用視窗中。這創造了一個動態工作空間,他們可以在其中即時查看、編輯和建立 Claude 的創作,將人工智慧生成的內容無縫整合到他們的專案和工作流程中。

Artifacts 預覽功能標誌著 Claude 從對話式 AI 向協作工作環境的演變,並將很快擴展到支援團隊協作。在不久的將來,團隊將能夠安全地將他們的知識、文件和正在進行的工作集中在一個共享空間中,而 Claude 則按需充當隊友。

最後,Anthropic 表示他們對模型進行了嚴格的測試,並致力於減少其被濫用的可能性。

Anthropic 安全團隊對Claude 3.5 Sonnet 在化學、生物、放射性和核(CBRN)風險、網路安全和自主能力領域進行了一系列的評估,最後將Claude 3.5 Sonnet 分類為AI 安全等級2( ASL-2)模型,顯示它不會構成災難性傷害的風險。

此外,作為對安全和透明度承諾的一部分,Anthropic 還與外部專家合作測試和完善這一最新模型中的安全機制。

官博地址:https://www.anthropic.com/news/claude-3-5-sonnet

以上是力壓GPT-4o!新王Claude 3.5 Sonnet來了,直接免費可用的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn