被GPT带飞的In-Context Learning发展现状如何？这篇综述梳理明白了-人工智能-PHP中文网

首页

科技周边

人工智能

被GPT带飞的In-Context Learning发展现状如何？这篇综述梳理明白了

PHPz

Apr 11, 2023 pm 05:10 PM

模型论文

随着语言模型和语料库规模的逐渐扩大，大型语言模型（LLM）展现出更多的潜力。近来一些研究表明，LLM 可以使用 in-context learning（ICL）执行一系列复杂任务，例如解决数学推理问题。

来自北京大学、上海 AI Lab 和加州大学圣巴巴拉分校的十位研究者近期发布了一篇关于 in-context learning 的综述论文，详细梳理了 ICL 研究的当前进展。

被GPT带飞的In-Context Learning发展现状如何？这篇综述梳理明白了

论文地址：https://arxiv.org/pdf/2301.00234v1.pdf

in-context learning 的核心思路是类比学习，下图描述了语言模型如何使用 ICL 进行决策。

被GPT带飞的In-Context Learning发展现状如何？这篇综述梳理明白了

首先，ICL 需要一些样例来形成演示语境，这些样例通常用自然语言模板编写。然后，ICL 将查询问题和演示语境相联系，形成 prompt，并且将其输入语言模型进行预测。与监督学习需要使用反向梯度更新模型参数的训练阶段不同，ICL 不需要参数更新即可使预训练语言模型直接执行预测任务，并且模型有望学习演示样例中隐藏的模式，并据此做出正确的预测。

作为一种新的范式，ICL 有很多吸引人的优势。首先，演示样例用自然语言格式编写，这为与大语言模型关联提供了一个可解释的接口。通过改变演示样例和模板（Liu et al., 2022; Lu et al., 2022; Wu et al., 2022; Wei et al., 2022c），这种范式使将人类知识纳入语言模型变得更加容易。第二，in-context learning 类似于人类通过类比学习的决策过程。第三，与监督式训练相比，ICL 是一个无需训练的学习框架。这不仅可以大大降低模型适应新任务的计算成本，而且还可以使语言模型即服务（LMaaS，Sun et al., 2022）成为可能，并轻松应用于大规模的现实任务。

尽管 ICL 有着大好的前景，但仍存在许多值得探究的问题，包括它的性能。例如原始的 GPT-3 模型就具备一定的 ICL 能力，但一些研究发现，通过预训练期间的适应，这种能力还可以获得显著的提升。此外，ICL 的性能对特定的设置很敏锐，包括 prompt 模板、语境样例的选择和样例顺序等。此外，ICL 的工作机制虽然看似合理，但仍不够清晰明了，能够初步解释其工作机制的研究也不多。

本篇综述论文总结道，ICL 的强大性能依赖于两个阶段：

培养大型语言模型 ICL 能力的训练阶段；
大型语言模型根据特定任务演示进行预测的推理阶段。

在训练阶段，语言模型直接按照语言建模目标进行训练，例如从左到右的生成。尽管这些模型并没有专门针对 in-context learning 进行优化，但 ICL 的能力依旧令人惊喜。现有的 ICL 研究基本以训练良好的语言模型为主干。

在推理阶段，由于输入和输出的 label 都是用可解释的自然语言模板表征的，因此 ICL 性能可以从多个角度得到优化。该综述论文进行了详细的描述和比较，并选择合适的例子进行演示，针对不同的任务设计具体的评分方法。

这篇综述论文的大致内容和结构如下图所示，包括：ICL 的正式定义 (§3)、warmup 方法 (§4)、prompt 设计策略 (§5) 和评分函数 (§6)。

被GPT带飞的In-Context Learning发展现状如何？这篇综述梳理明白了

此外，§7 深入阐述了当前为揭开 ICL 背后工作原理所做的探索。§8 进一步为 ICL 提供了有用的评估与资源，§9 介绍了能显示出 ICL 有效性的潜在应用场景。最后，§10 总结了 ICL 领域存在的挑战和潜在的方向，为该领域的进一步发展提供参考。

感兴趣的读者可以阅读论文原文，了解更多研究细节。

以上是被GPT带飞的In-Context Learning发展现状如何？这篇综述梳理明白了的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：51CTO.COM。如有侵权，请联系admin@php.cn删除

个人黑客将是一只非常凶猛的熊May 11, 2025 am 11:09 AM

网络攻击正在发展。通用网络钓鱼电子邮件的日子已经一去不复返了。网络犯罪的未来是超个性化的，利用了容易获得的在线数据和AI来制作高度针对性的攻击。想象一个知道您的工作的骗子

教皇狮子座XIV揭示了AI如何影响他的名字选择May 11, 2025 am 11:07 AM

新当选的教皇狮子座（Leo Xiv）在对红衣主教学院的就职演讲中，讨论了他的同名人物教皇里奥XIII的影响，他的教皇（1878-1903）与汽车和汽车和汽车公司的黎明相吻合

Fastapi -MCP初学者和专家教程-Analytics VidhyaMay 11, 2025 am 10:56 AM

本教程演示了如何使用模型上下文协议（MCP）和FastAPI将大型语言模型（LLM）与外部工具集成在一起。我们将使用FastAPI构建一个简单的Web应用程序，并将其转换为MCP服务器，使您的L

dia-1.6b tts：最佳文本到二元格生成模型 - 分析vidhyaMay 11, 2025 am 10:27 AM

探索DIA-1.6B：由两个本科生开发的开创性的文本对语音模型，零资金！这个16亿个参数模型产生了非常现实的语音，包括诸如笑声和打喷嚏之类的非语言提示。本文指南

AI可以使指导比以往任何时候都更有意义May 10, 2025 am 11:17 AM

我完全同意。我的成功与导师的指导密不可分。他们的见解，尤其是关于业务管理，构成了我的信念和实践的基石。这种经验强调了我对导师的承诺

AI发掘了采矿业的新潜力May 10, 2025 am 11:16 AM

AI 增强型矿业设备矿业作业环境恶劣且危险重重。人工智能系统通过将人类从最危险的环境中移除并增强人类能力，帮助提高整体效率和安全性。人工智能越来越多地用于为矿业作业中使用的自动驾驶卡车、钻机和装载机提供动力。这些 AI 驱动的车辆能够在危险环境中精确作业，从而提高安全性和生产力。一些公司已经开发出用于大型矿业作业的自动驾驶采矿车辆。在挑战性环境中运行的设备需要持续维护。然而，维护会使关键设备离线并消耗资源。更精确的维护意味着昂贵且必要的设备的正常运行时间增加以及显着的成本节约。 AI 驱动