封閉式學習背後的數學

封閉式學習背後的數學

Feb 26, 2025 am 12:03 AM

現代大語言模型（LLMS）的關鍵特徵（LLMS）

內部文化學習（ICL）允許變形金剛根據輸入提示中的示例進行適應。使用幾個任務示例，很少有提示有效地證明了所需的行為。但是，變形金剛如何實現這種適應？本文探討了ICL背後的潛在機制。

The Math Behind In-Context Learning

ICL的核心是：給定的示例對（（x，y）），注意機制可以學習算法以將新查詢（x）映射到其輸出（y）？

> SoftMax的注意力和最近的鄰居搜索

softmax的注意公式是：

The Math Behind In-Context Learning

引入反向溫度參數，

c ，修改了注意力分配：

The Math Behind In-Context Learning

AS

> c 接近無窮大，注意變成了一個旋轉向量，僅關注最相似的令牌 - 實際上是最近的鄰居搜索。使用有限的c ，注意與高斯內核平滑相似。這表明ICL可能會在輸入輸出對上實現最近的鄰居算法。 的含義和進一步的研究

了解變壓器如何學習算法（如最近的鄰居）為汽車打開門。 Hollmann等。在合成數據集上展示了訓練變壓器，以學習整個汽車管道，從單個通行證中預測新數據的最佳模型和超參數。

最近的研究（Garg等，2022，Oswald等，2023）將變形金剛的ICL與梯度下降聯繫起來。線性注意力，省略軟件操作：

>類似於預處理的梯度下降（PGD）：>

The Math Behind In-Context Learning

一層線性注意執行一個PGD步驟。

結論 The Math Behind In-Context Learning 注意機制可以實現學習算法，通過從演示對學習來啟用ICL。儘管多個注意層和MLP的相互作用很複雜，但研究闡明了ICL的力學。本文提供了這些見解的高級概述。

>

進一步閱讀：

>內部的學習和歸納負責人
>變形金剛可以在文化中學習什麼？簡單函數類別的案例研究
變形金剛通過梯度下文學習
變形金剛學習實施預處理的梯度下降

確認

>本文的靈感來自密歇根大學2024年秋季研究生課程。任何錯誤都是作者的。

以上是封閉式學習背後的數學的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

及時工程中的思想圖是什麼

及時工程中的思想圖是什麼Apr 13, 2025 am 11:53 AM

介紹在迅速的工程中，“思想圖”是指使用圖理論來構建和指導AI的推理過程的新方法。與通常涉及線性S的傳統方法不同

優化您的組織與Genai代理商的電子郵件營銷

優化您的組織與Genai代理商的電子郵件營銷Apr 13, 2025 am 11:44 AM

介紹恭喜！您經營一家成功的業務。通過您的網頁，社交媒體活動，網絡研討會，會議，免費資源和其他來源，您每天收集5000個電子郵件ID。下一個明顯的步驟是

Apache Pinot實時應用程序性能監視

Apache Pinot實時應用程序性能監視Apr 13, 2025 am 11:40 AM

介紹在當今快節奏的軟件開發環境中，確保最佳應用程序性能至關重要。監視實時指標，例如響應時間，錯誤率和資源利用率可以幫助MAIN

Chatgpt擊中了10億用戶？ Openai首席執行官說：'短短幾週內翻了一番

Chatgpt擊中了10億用戶？ Openai首席執行官說：'短短幾週內翻了一番Apr 13, 2025 am 11:23 AM

“您有幾個用戶？”他扮演。阿爾特曼回答說：“我認為我們上次說的是每週5億個活躍者，而且它正在迅速增長。” “你告訴我，就像在短短幾週內翻了一番，”安德森繼續說道。 “我說那個私人

pixtral -12b：Mistral AI＆＃039;第一個多模型模型 - 分析Vidhya

pixtral -12b：Mistral AI＆＃039;第一個多模型模型 - 分析VidhyaApr 13, 2025 am 11:20 AM

介紹 Mistral發布了其第一個多模式模型，即Pixtral-12b-2409。該模型建立在Mistral的120億參數Nemo 12B之上。是什麼設置了該模型？現在可以拍攝圖像和Tex

生成AI應用的代理框架 - 分析Vidhya

生成AI應用的代理框架 - 分析VidhyaApr 13, 2025 am 11:13 AM

想像一下，擁有一個由AI驅動的助手，不僅可以響應您的查詢，還可以自主收集信息，執行任務甚至處理多種類型的數據（TEXT，圖像和代碼）。聽起來有未來派？在這個a

生成AI在金融部門的應用

生成AI在金融部門的應用Apr 13, 2025 am 11:12 AM

介紹金融業是任何國家發展的基石，因為它通過促進有效的交易和信貸可用性來推動經濟增長。交易的便利和信貸

在線學習和被動攻擊算法指南

在線學習和被動攻擊算法指南Apr 13, 2025 am 11:09 AM

介紹數據是從社交媒體，金融交易和電子商務平台等來源的前所未有的速度生成的。處理這種連續的信息流是一個挑戰，但它提供了

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼（黃色晶體）

3 週前By尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.最佳圖形設置

3 週前By尊渡假赌尊渡假赌尊渡假赌

刺客信條陰影：貝殼謎語解決方案

2 週前ByDDD

R.E.P.O.如果您聽不到任何人，如何修復音頻

3 週前By尊渡假赌尊渡假赌尊渡假赌

WWE 2K25：如何解鎖Myrise中的所有內容

4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

mPDF

mPDF

mPDF是一個PHP庫，可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件，並處理不同的語言。與原始腳本如HTML2FPDF相比，它的速度較慢，並且在使用Unicode字體時產生的檔案較大，但支援CSS樣式等，並進行了大量增強。支援幾乎所有語言，包括RTL（阿拉伯語和希伯來語）和CJK（中日韓）。支援嵌套的區塊級元素（如P、DIV），

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

VSCode Windows 64位元下載

VSCode Windows 64位元下載

微軟推出的免費、功能強大的一款IDE編輯器

EditPlus 中文破解版

EditPlus 中文破解版

體積小，語法高亮，不支援程式碼提示功能

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具，用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

熱門話題

gmail信箱登陸入口在哪裡

7485

15

1377

52

steam的賬戶名稱是什麼格式

77

11

win11激活密鑰永久

51

19

NYT連接提示和答案

19

38