封闭式学习背后的数学

封闭式学习背后的数学

Feb 26, 2025 am 12:03 AM

现代大语言模型（LLMS）的关键特征（LLMS）

内部文化学习（ICL）允许变形金刚根据输入提示中的示例进行适应。使用几个任务示例，很少有提示有效地证明了所需的行为。但是，变形金刚如何实现这种适应？本文探讨了ICL背后的潜在机制。

The Math Behind In-Context Learning

ICL的核心是：给定的示例对（（x，y）），注意机制可以学习算法以将新查询（x）映射到其输出（y）？

> SoftMax的注意力和最近的邻居搜索

softmax的注意公式是：

The Math Behind In-Context Learning

引入反向温度参数，

c ，修改了注意力分配：

The Math Behind In-Context Learning

AS

> c 接近无穷大，注意变成了一个旋转向量，仅关注最相似的令牌 - 实际上是最近的邻居搜索。使用有限的c ，注意与高斯内核平滑相似。这表明ICL可能会在输入输出对上实现最近的邻居算法。 的含义和进一步的研究

了解变压器如何学习算法（如最近的邻居）为汽车打开门。 Hollmann等。在合成数据集上展示了训练变压器，以学习整个汽车管道，从单个通行证中预测新数据的最佳模型和超参数。

最近的研究（Garg等，2022，Oswald等，2023）将变形金刚的ICL与梯度下降联系起来。线性注意力，省略软件操作：

>类似于预处理的梯度下降（PGD）：>

The Math Behind In-Context Learning

一层线性注意执行一个PGD步骤。

结论 The Math Behind In-Context Learning 注意机制可以实现学习算法，通过从演示对学习来启用ICL。尽管多个注意层和MLP的相互作用很复杂，但研究阐明了ICL的力学。本文提供了这些见解的高级概述。

>

进一步阅读：

>内部的学习和归纳负责人
>变形金刚可以在文化中学习什么？简单函数类别的案例研究
变形金刚通过梯度下文学习
变形金刚学习实施预处理的梯度下降

确认

>本文的灵感来自密歇根大学2024年秋季研究生课程。任何错误都是作者的。

以上是封闭式学习背后的数学的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

10个生成AI编码扩展，在VS代码中，您必须探索

10个生成AI编码扩展，在VS代码中，您必须探索Apr 13, 2025 am 01:14 AM

嘿，编码忍者！您当天计划哪些与编码有关的任务？在您进一步研究此博客之前，我希望您考虑所有与编码相关的困境，这是将其列出的。完毕？ - 让＆＃8217

烹饪创新：人工智能如何改变食品服务

烹饪创新：人工智能如何改变食品服务Apr 12, 2025 pm 12:09 PM

AI增强食物准备在新生的使用中，AI系统越来越多地用于食品制备中。 AI驱动的机器人在厨房中用于自动化食物准备任务，例如翻转汉堡，制作披萨或组装SA

Python名称空间和可变范围的综合指南

Python名称空间和可变范围的综合指南Apr 12, 2025 pm 12:00 PM

介绍了解Python功能中变量的名称空间，范围和行为对于有效编写和避免运行时错误或异常至关重要。在本文中，我们将研究各种ASP

视觉语言模型（VLMS）的综合指南

视觉语言模型（VLMS）的综合指南Apr 12, 2025 am 11:58 AM

介绍想象一下，穿过美术馆，周围是生动的绘画和雕塑。现在，如果您可以向每一部分提出一个问题并获得有意义的答案，该怎么办？您可能会问：“您在讲什么故事？

联发科技与kompanio Ultra和Dimenty 9400增强优质阵容

联发科技与kompanio Ultra和Dimenty 9400增强优质阵容Apr 12, 2025 am 11:52 AM

继续使用产品节奏，本月，Mediatek发表了一系列公告，包括新的Kompanio Ultra和Dimenty 9400。这些产品填补了Mediatek业务中更传统的部分，其中包括智能手机的芯片

本周在AI：沃尔玛在时尚趋势之前设定了时尚趋势

本周在AI：沃尔玛在时尚趋势之前设定了时尚趋势Apr 12, 2025 am 11:51 AM

＃1 Google推出了Agent2Agent 故事：现在是星期一早上。作为AI驱动的招聘人员，您更聪明，而不是更努力。您在手机上登录公司的仪表板。它告诉您三个关键角色已被采购，审查和计划的FO

生成的AI遇到心理摩托车

生成的AI遇到心理摩托车Apr 12, 2025 am 11:50 AM

我猜你一定是。我们似乎都知道，心理障碍包括各种chat不休，这些chat不休，这些chat不休，混合了各种心理术语，并且常常是难以理解的或完全荒谬的。您需要做的一切才能喷出fo

原型：科学家将纸变成塑料

原型：科学家将纸变成塑料Apr 12, 2025 am 11:49 AM

根据本周发表的一项新研究，只有在2022年制造的塑料中，只有9.5％的塑料是由回收材料制成的。同时，塑料在垃圾填埋场和生态系统中继续堆积。但是有帮助。一支恩金团队

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么（黄色晶体）

3 周前By尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.最佳图形设置

3 周前By尊渡假赌尊渡假赌尊渡假赌

刺客信条阴影：贝壳谜语解决方案

2 周前ByDDD

R.E.P.O.如果您听不到任何人，如何修复音频

3 周前By尊渡假赌尊渡假赌尊渡假赌

WWE 2K25：如何解锁Myrise中的所有内容

4 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript开发工具

SublimeText3汉化版

SublimeText3汉化版

中文版，非常好用

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具

mPDF

mPDF

mPDF是一个PHP库，可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件，并处理不同的语言。与原始脚本如HTML2FPDF相比，它的速度较慢，并且在使用Unicode字体时生成的文件较大，但支持CSS样式等，并进行了大量增强。支持几乎所有语言，包括RTL（阿拉伯语和希伯来语）和CJK（中日韩）。支持嵌套的块级元素（如P、DIV），

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器

热门话题

gmail邮箱登陆入口在哪里

7478

15

1377

52

steam的账户名称是什么格式

77

11

win11激活密钥永久

50

19

NYT连接提示和答案

19

33