首頁  >  文章  >  科技週邊  >  2023 年 6 個最佳大型語言模型

2023 年 6 個最佳大型語言模型

WBOY
WBOY原創
2024-06-14 17:47:26852瀏覽

現在是人工智慧季節,科技公司正在大量生產大型語言模型,就像麵包店裡的麵包一樣。新型號發布得很快,而且追蹤變得越來越困難。

但在眾多新版本中,只有少數模型上升到了頂峰,並證明自己是大型語言模型空間中真正的競爭者。隨著 2023 年底的臨近,我們匯總了您應該嘗試的六種最令人印象深刻的大型語言模型。

1. OpenAI 的 GPT-4

The 6 Best Large Language Models in 2023

GPT-4 是迄今為止最先進的公開可用的大型語言模型。 GPT-4 由OpenAI 開發並於2023 年3 月發布,是2018 年開始的生成式預訓練Transformer 系列的最新迭代。之一世界上的模型。

雖然尚未得到官方證實,但消息人士估計GPT-4 可能包含驚人的1.76 兆個參數,大約是其前身GPT-3.5 的十倍,是Google 旗艦產品PaLM 2 的五倍。如此龐大的規模啟用 GPT-4 的多模式功能,使其能夠處理文字和圖像作為輸入。因此,除了文字之外,GPT-4 還可以解釋和描述圖表和螢幕截圖等視覺資訊。其多模態性質提供了對現實世界數據更人性化的理解。

在科學基準測試中,GPT-4 在各種測試中顯著優於其他當代模型。雖然基準測試本身並不能完全展示模型的優勢,但現實世界的用例表明 GPT-4 非常擅長直觀地解決實際問題。 GPT-4 目前的收費為每月 20 美元,可透過 ChatGPT 的 Plus 計劃存取。

2. Anthropic 的 Claude 2

The 6 Best Large Language Models in 2023

雖然不如 GPT-4 流行,但 Anthropic AI 開發的 Claude 2 可以與 GPT -4 的技術基準和實際性能相匹配幾個領域。在一些標準化測驗中,包括選擇性考試,Claude 2 的表現優於 GPT-4。與 GPT -4 的 8k 和 32k 令牌模型相比,AI 語言模型在大約 100,000 個令牌時還具有極其優越的上下文視窗。儘管較大的上下文長度並不總是意味著更好的性能,但 Claude 2 擴展的容量提供了明顯的優勢,例如消化整本 75,000 字的書籍進行分析。

在整體表現方面,GPT-4 仍然優越,但我們的內部測驗顯示 Claude 2 在多項創意寫作任務中超過了它。根據我們的評估,Claude 2 在程式設計和數學技能方面也落後於 GPT-4,但擅長提供類似人類的創意答案。當我們提示此列表中的所有模型編寫或重寫創意作品時,十分之六,我們選擇了 Claude 2 的結果,因為它的結果聽起來很自然,類似於人類。目前,Claude 2 可透過 Claude AI 聊天機器人免費使用。還有一個 20 美元的付費計劃可以訪問額外的功能。

儘管財務支援比 OpenAI 和 Microsoft 等巨頭少,但 Anthropic 的 Claude 2 AI 模型在與流行的 GPT 模型和 Google 的 PaLM 系列的競爭中擁有自己的優勢。對於資源較少的 AI 來說,Claude 2 的競爭力令人印象深刻。如果被迫押注哪種現有模型在不久的將來最有可能與 GPT 競爭,Claude 2 似乎是最安全的賭注。儘管在資金方面處於劣勢,但 Claude 2 的先進功能表明它甚至可以與資金雄厚的龐然大物正面交鋒(儘管值得注意的是,谷歌已經為 Anthropic 做出了幾項重大貢獻)。該型號的性能超出了其重量級別,並顯示出作為新興挑戰者的前景。

3. OpenAI 的 GPT-3.5

The 6 Best Large Language Models in 2023

雖然 GPT-4 的發布黯然失色,但 GPT-3.5 及其 1750 億個參數不容小覷。透過專注於性能、準確性和安全性的迭代微調和升級,GPT-3.5 較原始的 GPT-3 模型有了很大的進步。儘管它缺乏 GPT -4 的多模態能力,並且在上下文長度和參數數量方面落後,但 GPT-3.5 仍然具有很強的能力,GPT-4 是唯一能夠果斷超越其全面性能的模型。

儘管是 GPT 系列中的第二梯隊模型,GPT-3.5 仍然可以保持自己的地位,甚至在多個基準測試中超越 Google 和 Meta 的旗艦模型。在與 Google PaLM 2 的數學和程式設計技能並行測驗中,差異並不明顯,GPT-3.5 在某些情況下甚至具有輕微優勢。 GPT-3.5 在幽默和敘事寫作等更具創造性的任務中取得了決定性的領先。

因此,雖然GPT-4 標誌著人工智慧領域的一個新里程碑,但GPT-3.5 仍然是一個令人印象深刻的強大模型,能夠與最先進的替代方案競爭,有時甚至超越它們。它的持續改進確保了它即使與更華麗的下一代車型相比也能保持相關性。

4. Google 的PaLM 2

The 6 Best Large Language Models in 2023

在評估AI 模型的功能時,經過驗證的公式是閱讀技術報告並檢查基準分數,但要結合你所學到的一切都加鹽並親自測試模型。儘管看起來違反直覺,但基準測試結果並不總是與某些人工智慧模型的實際性能相符。理論上,Google 的 PaLM 2 應該是 GPT-4 殺手,官方測試結果表明它在某些基準測試中與 GPT-4 相符。然而,在日常使用中,卻出現了不同的情況。

在邏輯推理、數學和創造力方面,PaLM 2 不如 GPT-4。它在一系列創意寫作任務上也落後於 Anthropic 的 Claude。然而,儘管 Google 的 PaLM 2 未能名副其實地成為 GPT-4 殺手,但它本身仍然是一個強大的語言模型,具有巨大的功能。圍繞它的大部分負面情緒源於與 GPT-4 等模型的比較,而不是完全糟糕的表現。

PaLM 2 擁有 3,400 億個參數,是世界上最大的模型之一。它特別擅長多語言任務,並擁有強大的數學和程式設計能力。儘管不是最擅長的,PaLM 2 在寫作等創意任務上也相當有效率。因此,儘管基準測試描繪了一幅樂觀的圖景,但並未完全實現,PaLM 2 仍然展示了令人印象深刻的人工智慧技能,即使沒有全面超越所有競爭對手。

5. TII 的 Falcon-180B

The 6 Best Large Language Models in 2023

除非您一直跟上 AI 語言模型發布的快速步伐,否則您可能從未遇到過 Falcon-180B。由阿聯酋技術創新研究所開發的 Falcon-180 擁有 1800 億個參數,是目前最強大的開源語言模型之一,儘管它缺乏 GPT 模型的知名度或 Meta 的 Llama 2 的廣泛使用。可以與同類中最好的產品正面交鋒。

基準測試結果顯示,Falcon-180B 的效能優於大多數開源模型,並可與 PaLM 2 和 GPT-3.5 等商業巨頭競爭。在測試數學、編碼、推理和創意寫作任務時,它甚至有時超過了 GPT-3.5 和 PaLM 2。如果對 GPT-4、GPT-3.5 和 Falcon-180B 進行排名,我們會將 Falcon-180B 完全置於 GPT-4 和 GPT-3.5 之間,因為它在多個用例中的優勢。

雖然我們不能自信地說它在整體表現上優於 GPT-3.5,但它本身就證明了這一點。雖然晦澀難懂,但該模型值得關注,因為它可以匹配或超過更知名的替代方案的功能。您可以在 Hugging Face(一個開源 LLM 平台)上嘗試 Falcon-180B 模型。

6. Meta AI 的Llama 2

The 6 Best Large Language Models in 2023

Llama 2 是Meta AI 的700 億參數大語言模型,建立在其前身Llama 1 的基礎上。 ,但Llama 2 明顯在基準測試和實際使用中優於大多數公開的開源法學碩士。 Falcon-180B 是一個例外。

我們針對 GPT-4、GPT-3.5、Claude 2 和 PaLM 2 測試了 Llama 2,以評估其功能。毫不奇怪,GPT-4 幾乎在所有參數上都優於 Llama 2。然而,Llama 2 在多項評估中仍能與 GPT-3.5 和 PaLM 2 競爭。雖然聲稱 Llama 2 優於 PaLM 2 並不準確,但 Llama 2 解決了困擾 PaLM 2 的許多問題,包括編碼任務。 Claude 2 和 GPT-3.5 在某些領域擊敗了 Llama 2,但僅在有限數量的任務中明顯更好。

因此,雖然開源 Llama 2 的功能沒有超過最大的專有模型,但其性能超出了其重量等級。作為一個公開可用的模型,它表現出了令人印象深刻的性能,在特定評估中可與 PaLM 2 等人工智慧巨頭相媲美。 Llama 2 讓我們一窺開源語言模式的未來潛力。

AI 模型之間的效能差距正在縮小

儘管 AI 領域正在飛速發展,但 OpenAI 的 GPT-4 仍然處於領先地位。然而,雖然 GPT-4 在規模和性能方面仍然無與倫比,但像 Claude 2 這樣的模型表明,只要有足夠的技能,較小的模型就可以在某些領域競爭。谷歌的PaLM 2儘管沒有達到一些崇高的期望,但仍然展示了強大的功能。 Falcon-180B 證明,只要有足夠的資源,開源計畫就可以與產業巨頭並肩作戰。

以上是2023 年 6 個最佳大型語言模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn