搜尋
首頁科技週邊人工智慧為何說小語言模式是AI界的下一大熱門?

譯者| 布加迪

已審校| 重樓

#。 #在AI領域,科技巨擘們一直在競相建構越來越龐大的語言模型,如今出現了一個令人驚訝的新趨勢##就是大。隨著大語言模型(LLM)方面的進展出現了停滯的跡象,研究人員和開發人員日益開始將注意力轉向小語言模型(SLM)#。這緊湊、高效、適應性強的AI模型正在挑戰 #越大越好」這個觀念,有望改變我們對待AI開發的方式。

為何說小語言模式是AI界的下一大熱門?

LLM是否開始停滯?

Vellum#和HuggingFace最近發布的效能比較結果表明,LLM之間的效能差距正在迅速縮小。這趨勢在多項選擇題、推理和數學問題等特定任務中體現得#特別 #;在這些任務中,各大模型之間的效能差異很小。 例如在多項選擇題中,Claude 3 Opus##GPT-4

Gemini Ultra

#準確率#都在83%#以上,而在推理任務中,Claude 3 OpusGPT-4Gemini 1.5 Pro的準確率超過92%意思#的是,#較小的模型(例如Mixtral 8x7B#和Llama 2 - 70B在某些方面也顯示出

了讓人驚訝

的結果,例如推理和多項選擇題在這些方面小模型的表現勝過一些大模型。這表明模型的大小可能不是決定效能的唯一因素,而架構、訓練資料和微調技術等其他方面可能發揮重要作用。 Uber AI前負責人、《重啟人工智慧》Rebooting AI一書的作者Gary Marcus表示:「如果看一下最近發表的十幾篇文章,它們大體上

都與

GPT-4處於同一個水準。 ##AIMarcus週四接受了IT外媒《VentureBeat#的採訪。 「其中一些比GPT-4好一點,但沒有大的飛躍。

一年多的時間裡#並沒有任何大飛躍。 隨著性能差距繼續縮小,多的模型顯示出相當有競爭力的結果,這引發了LLM是否真的開始#停滯的問題。如果這種趨勢持續下去,可能會對語言模型的未來開發和部署產生重大影響,#人們關注的心可能會由一味增加模型大小轉

###探索更有效######、######更專######門化### ###的######架構######上。 ############

LLM方法的缺點

#雖然不可否認##LLM #功能強大,但也有明顯的缺點。首先,訓練LLM需要大量的數據,需要數十億甚至數萬億個參數。這使得訓練過程極其耗費資源,訓練和運行LLM所需的算 和能耗是驚人的。這導致了成本高企,使得小組織或個人很難參與核心LLM開發。在去年麻省理工學院組織的一次活動上,OpenAI執行長##Sam Altman表示,訓練GPT-4的成本至少為1億美元。

處理LLM所

所需的工具和技術的複雜性也將一條陡峭的學習曲線擺在開發人員的面前,進一步限制了可訪問性。從模型訓練到建置和部署,開發人員面臨的週期很長,這減慢了開發和試驗的速度。劍橋大學最近的一篇論文顯示,公司部署單單一個機器學習模型可能要花90天或更長#。

LLM的另一個重要問題是

它們傾向於產生幻覺—#生成看似合理但實際上並不真實的輸出。這源自於LLM被訓練成基於訓練資料中的模式來預測下一個最有可能的單字的方式,而不是#真正了解訊息因此,LLM可以自信地做出虛假陳述,編造事實或以荒謬的方式組合不相關的概念。偵測與減輕這幻覺現象#是發展可靠的語言模型##面對#的老大難問題

Marcus警告:「如果你用LLM來解決重大問題,不想侮辱客戶#、得到錯誤的醫療訊息,或用它來駕駛汽車。解釋和調試,解釋和調試對於

模型的輸出建立信任#至關重要。訓練資料和演算法中的偏差可能導致不公平、不準確甚至有害的輸出。正如我們在GoogleGemini#中看到,使LLM# 安全」而可靠的技術也會降低其效能。此外,LLM的集中性質引發了對權力和控制權集中在少數大型科技公司手中的擔憂。 小語言模型(SLM)登場

這時候小語言模型登場了

SLMLLM的精簡版,參數更少,設計更簡單。 它們所需的資料和訓練時間更短,只需幾分鐘或幾個小時,而LLM需要幾天。這使得SLM部署在本地或小型設備上來得高效更簡單。 SLM的主要優點之一是它們適合特定的應用環境由於

它們關注的範圍更狹小,需要更少的數據,所以大型通用模型更容易針對特定領域或任務進行微調。這種客製化使公司能夠創建對其特定需求而言非常有效的SLM,例如情緒分析、命名實體辨識或特定領域的問題回答。與使用通用模型相比,SLM的專門化特性可以提升其在這些目標應用環境的效能和效率。

SLM的另一個好處是有望增強隱私和安全性。使用更小的程式碼庫和更簡單的架構,SLM更容易審計,並且不太可能出現意外漏洞。這使得它們對於處理敏感資料的應用環境相當有吸引力,例如在醫療保健或金融領域,資料外洩可能釀成嚴重後果。此外,SLM的運算需求減少,使得它們更適合在本地設備或本地伺服器上運行,而不是依賴雲端基礎設施。這種本地處理可以進一步提高資料安全性,降低資料傳輸過程中暴露風險。

LLM#相比,SLM在特定領域內更不容易出現未被發現的幻覺。 SLM通常使用預期領域或應用環境特有的更狹窄、更有針對性的資料集進行訓練,這有助於模型學習與其任務最相關的模式、詞彙表和資訊。這就降低產生不相關、意外或不一致輸出的可能性。 由於使用更少的參數和更精簡的架構,SLM不太容易捕獲和放大訓練資料中的雜訊或錯誤。

AI初創公司HuggingFace的執行長Clem Delangue表示,高達99%的用例可以使用SLM來解決,並預測2024年將會是SLM年。 HuggingFace的平台使開發人員能夠建立、訓練和部署機器學習模型,該公司今年稍早宣布與Google建立策略合作夥伴關係。兩家公司隨後將HuggingFace整合到Google的Vertex AI中,讓開發人員可以透過GoogleVertex Model Garden快速部署數千個模型。

GoogleGemma受到追捧

#在最初將LLM方面的優勢拱手讓給OpenAI之後,Google#正積極抓住SLM機會。早在2月份,Google就推出了Gemma,這是一系列新的小語言模型,旨在提高效率和用戶友善性。與其他SLM一樣,Gemma型號可以在各種普通設備上運行,例如智慧型手機、平板電腦或筆記型電腦,不需要特殊的硬體或全面的最佳化。

Gemma發布以來,經過訓練的模型上個月在HuggingFace上的下載量已經超過40萬次,而且已湧現出了幾個令人興奮的項目。比如說,Cerule是一個功能強大的圖像和語言模型,它結合了Gemma 2B和Google的SigLIP,#使用大量的圖像和文字資料集進行了訓練。 Cerule利用高效的資料選擇技術,可以在不需要大量資料或運算的情況下實現高效能。這意味著Cerule可能非常適合新興的邊緣運算用例。

另一個例子是CodeGemma,它是Gemma的專門版,專注於編和數學推理。 CodeGemma為各種編相關的活動提供了三種不同的模型,使高階程式設計##工具對開發人員來說更容易存取、更有效率。

小語言模型的巨大潛力

隨著AI社群繼續探索小語言模型的潛力,更快的開發週期、更高的效率以及能夠根據特定需求自訂模型等優點變得越來越明顯。 SLM有望透過帶來具有成本效益、具有針對性的解決方案,普及AI訪問,並推動產業創新。在邊緣部署SLM為金融、娛樂、汽車系統、教育、電子商務和醫療保健等行業領域的即時、個人化和安全應用系統帶來了新的可能性。

透過在本地處理資料並減少對雲端基礎設施的依賴,結合SLM的邊緣運算可以縮短回應時間、增強資料隱私和改進使用者體驗。這種去中心化的AI方法有望#改變企業與科技進行#互動方式,在真實世界中創造更個人化直覺的體驗。由於LLM面臨與運算資源相關的挑戰,可能遇到效能瓶頸,因此,LLM的興起有望使##AI生態系統繼續驚人的步伐發展

原文標題:#Why small language models are the next big thing in AI#,作者:James Thomason

#

以上是為何說小語言模式是AI界的下一大熱門?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
烹飪創新:人工智能如何改變食品服務烹飪創新:人工智能如何改變食品服務Apr 12, 2025 pm 12:09 PM

AI增強食物準備 在新生的使用中,AI系統越來越多地用於食品製備中。 AI驅動的機器人在廚房中用於自動化食物準備任務,例如翻轉漢堡,製作披薩或組裝SA

Python名稱空間和可變範圍的綜合指南Python名稱空間和可變範圍的綜合指南Apr 12, 2025 pm 12:00 PM

介紹 了解Python函數中變量的名稱空間,範圍和行為對於有效編寫和避免運行時錯誤或異常至關重要。在本文中,我們將研究各種ASP

視覺語言模型(VLMS)的綜合指南視覺語言模型(VLMS)的綜合指南Apr 12, 2025 am 11:58 AM

介紹 想像一下,穿過​​美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

聯發科技與kompanio Ultra和Dimenty 9400增強優質陣容聯發科技與kompanio Ultra和Dimenty 9400增強優質陣容Apr 12, 2025 am 11:52 AM

繼續使用產品節奏,本月,Mediatek發表了一系列公告,包括新的Kompanio Ultra和Dimenty 9400。這些產品填補了Mediatek業務中更傳統的部分,其中包括智能手機的芯片

本週在AI:沃爾瑪在時尚趨勢之前設定了時尚趨勢本週在AI:沃爾瑪在時尚趨勢之前設定了時尚趨勢Apr 12, 2025 am 11:51 AM

#1 Google推出了Agent2Agent 故事:現在是星期一早上。作為AI驅動的招聘人員,您更聰明,而不是更努力。您在手機上登錄公司的儀表板。它告訴您三個關鍵角色已被採購,審查和計劃的FO

生成的AI遇到心理摩托車生成的AI遇到心理摩托車Apr 12, 2025 am 11:50 AM

我猜你一定是。 我們似乎都知道,心理障礙由各種chat不休,這些chat不休,這些chat不休,混合了各種心理術語,並且常常是難以理解的或完全荒謬的。您需要做的一切才能噴出fo

原型:科學家將紙變成塑料原型:科學家將紙變成塑料Apr 12, 2025 am 11:49 AM

根據本週發表的一項新研究,只有在2022年製造的塑料中,只有9.5%的塑料是由回收材料製成的。同時,塑料在垃圾填埋場和生態系統中繼續堆積。 但是有幫助。一支恩金團隊

AI分析師的崛起:為什麼這可能是AI革命中最重要的工作AI分析師的崛起:為什麼這可能是AI革命中最重要的工作Apr 12, 2025 am 11:41 AM

我最近與領先的企業分析平台Alteryx首席執行官安迪·麥克米倫(Andy Macmillan)的對話強調了這一在AI革命中的關鍵但不足的作用。正如Macmillan所解釋的那樣,原始業務數據與AI-Ready Informat之間的差距

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器