首頁  >  文章  >  科技週邊  >  不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了

不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了

WBOY
WBOY原創
2024-06-22 02:06:40356瀏覽
不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了
AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

本文作者肖鎮中是德國馬克思普朗克-智慧系統研究所和圖賓根大學的博士生,Robert Bamler 是圖賓根大學機器學習方向的教授,Bernhard Schölkopf 是馬克思普朗克-智慧系統研究所的所長,劉威楊是馬普所劍橋大學聯合計畫的研究員。

不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了

論文地址:https://arxiv.org/abs/2406.04344

在傳統的機器學習場景如分類和回歸問題中,給定訓練資料不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了,我們透過最佳化參數不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了學到一個函數模型不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了來精確描述訓練集和測試集中不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了的關係。其中不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了是基於數值的函數,它的參數不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了通常是連續空間中的數值向量或矩陣,優化演算法透過計算數值梯度迭代更新不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了從而達到學習的效果。

與其用數值,我們是否能用自然語言來表示一個模型?這種基於自然語言的非數值模型又該如何做推理和訓練

Verbalized Machine Learning (VML;言語化的機器學習) 回答了這些問題,並提出了一種基於自然語言的機器學習全新範式。 VML 把大語言模型 (LLM) 當作自然語言空間中的通用近似函數 (universial function approximator)不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了,資料不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了和參數不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了都是自然語言空間中的字串。在做推理時,我們可以將給定的輸入資料不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了和參數不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了提交給 LLM,LLM 的回答就是推理的答案不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了

對於任意任務和資料不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了,我們如何得到不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了?在基於數值的傳統機器學習中,我們透過計算損失函數的梯度,將現有的模型參數往損失下降的方向更新,從而得到不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了的最佳化函數:

不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了

其中不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了分別為學習率和損失函數。

在 VML 的設定中,由於資料不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了和參數不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了都是字串且 LLM 被當作是黑箱的推理引擎,所以我們無法透過數值計算來最佳化不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了。但既然我們已經將 LLM 用作自然語言空間中的通用近似函數去近似模型函數,而不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了的優化器不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了也是一個函數,我們為何不也用 LLM 去近似它?因此,言語化的不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了最佳化函數可寫

不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了

其中不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了為一個數量為不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了的批次的訓練資料和模型預測結果,不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了為最佳化函數的參數(同為自然語言)。

不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了

                                                 圖 1:VML 的訓練演算法。

不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了

                            圖 2:VML 中模型與最佳化器的自然語言模版範例。

圖 1 顯示了 VML 的完整演算法。可以看見其跟傳統機器學習演算法基本上相同,唯一的區別是資料和參數是在自然語言空間裡的字串, 以及模型不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了和優化器不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了都是透過 LLM 在自然語言空間中進行推理。圖 2 為迴歸任務中模型不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了和最佳化器不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了的具體模板範例。

跟傳統機器學習比,VML 的優點包括:(1)用自然語言簡單的描述就可以對模型加入歸納偏置(inductive bias);(2)由於不需要預設模型的函數族(function family),最佳化器不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了可以在訓練過程中自動對模型的函數族進行選擇;(3)最佳化函數對模型參數的每一步更新都會提供自然語言的解釋,同時模型的描述和推理也是自然語言且可解釋的。

實驗展示

多項式迴歸

多項式迴歸
不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了。在第一步優化時,優化器說它發現🎜比🎜有更大的值域,而且它們似乎存在正相關性,所以它決定將模型更新為簡單的線性迴歸模型。

在第二步優化時,優化器說當前模型的不良表現讓它意識到線性模型的假設過於簡單了,同時它發現不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了之間存在非線性關係, 因此它決定將模型更新為二次函數。

第三步最佳化時,最佳化器的焦點從函數族選擇轉換成二次函數的參數修改。最終模型學到了真實函數很接近的結果。

不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了

                             

非線性二維平面分類

如圖4 所示,模型的初始參數平面是個圓”加入歸納偏置。在第一步優化中,優化器說它是基於提供的先驗,將模型更新為了一個圓方程式。接下來的最佳化步驟中,優化器都在根據訓練資料調整圓方程式的圓心和半徑。直到第四十一步,優化器說目前模型似乎擬合得很好了,於是停止了模型的更新。 不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了

同時,我們也可以看見在不加歸納偏置的情況下,VML 也能學到一個基於決策樹的不錯的模型,但相比之下訓練損失的波動更大。

不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了

                               圖 4: VML 在非線性中對點分類任務中的訓練流程的記錄。

醫療圖像二分類

如果大模型接受多模態輸入,如圖片和文字,那麼 VML 也可以用在圖片任務上。在這個實驗中,我們使用了 GPT-4o 和 PneumoniaMNIST 資料集,做了一個 X 光片肺炎檢測的任務。

如圖5 所示,我們初始化了兩個模型,模型的初始參數不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了都為圖片二分類的定義, 但其中一個添加了一句話“輸入是用於肺炎檢測的X 光圖片”的歸納偏移作為先驗。在訓練了五十步後,兩個模型都達到了 75% 左右的準確度,其中有先驗的模型準確度要稍微高一點點。

仔細觀察第五十步後的模型參數,我們可以看到加了歸納偏置的模型描述中包含了很多與肺炎相關的醫學詞彙,例如「感染」、「發炎」;而沒有加歸納偏壓的模型描述中只有肺部X 光片的特徵描述,例如「透明度」、「對稱」。

同時,這些模型所學到的描述,都是可以被具備專業知識的醫生驗證的。這種可解釋且可人工檢驗的機器學習模型在以安全為重的醫療場景下十分有價值。

不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了

                             不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了
結語

該文章中介紹了一種基於大語言模型的機器學習新範式的語言化回歸在該文章中並在該文章中引入了一種基於大語言模型的機器。和分類任務上展示了VML 的有效性和可解釋性的特徵。

以上是不做數值運算、純靠嘴砲也能機器學習?基於自然語言的全新ML範式來了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn