搜索
首页科技周边人工智能您是否仍在使用Lora来微调LLM?

LoRA (低秩自适应 - arxiv.org/abs/2106.09685) 是一种经济高效微调大型语言模型 (LLM) 的流行技术。但 2024 年涌现出大量新的参数高效微调技术,各种 LoRA 替代方案层出不穷:SVF、SVFT、MiLoRA、PiSSA、LoRA-XS ?…… 其中大多数都基于我非常喜欢的一种矩阵技术:奇异值分解 (SVD)。让我们深入探讨。

LoRA

LoRA 的最初见解是,微调模型的所有权重是过度操作。相反,LoRA 冻结模型,只训练一对小的低秩“适配器”矩阵。请参见下面的插图(其中 W 是 Transformer LLM 中任何权重矩阵)。

Are You Still Using LoRA to Fine-Tune Your LLM?由于需要计算和存储的梯度要少得多,因此可以节省内存和计算周期。例如,这是一个使用 LoRA 微调以模拟海盗说话方式的 Gemma 8B 模型:只有 2200 万个参数可训练,85 亿个参数保持冻结状态。

Are You Still Using LoRA to Fine-Tune Your LLM?LoRA 非常流行。它甚至已作为单行 API 进入 Keras 等主流 ML 框架:

<code>gemma.backbone.enable_lora(rank=8)</code>

但是 LoRA 是最好的吗?研究人员一直在努力改进该公式。实际上,选择较小的“适配器”矩阵的方法有很多种。由于它们大多数巧妙地利用了矩阵的奇异值分解 (SVD),让我们暂停一下,进行一些数学运算。

SVD:简单的数学

SVD 是理解矩阵结构的一个好工具。该技术将矩阵分解为三个:W = USVT,其中 U 和 V 是正交的(即基变换),S 是排序的奇异值的对角矩阵。这种分解总是存在的。

Are You Still Using LoRA to Fine-Tune Your LLM?在“教科书式”SVD 中,U 和 V 是方阵,而 S 是一个矩形矩阵,对角线上是奇异值,后面是零。实际上,您可以使用方阵 S 和矩形 U 或 V——参见图片——截断的部分只是乘以零。这种“经济型”SVD 是常用库(例如 numpy.linalg.svd)中使用的。

那么我们如何利用这一点更有效地选择要训练的权重呢?让我们快速浏览五种最近基于 SVD 的低秩微调技术,并附带注释说明。

SVF

LoRA 最简单的替代方法是对模型的权重矩阵使用 SVD,然后直接微调奇异值。奇怪的是,这是最新的技术,称为 SVF,发表在 Transformers² 论文中 (arxiv.org/abs/2501.06252v2)。

Are You Still Using LoRA to Fine-Tune Your LLM?SVF 在参数方面比 LoRA 经济得多。此外,它使微调模型具有可组合性。有关这方面的更多信息,请参见此处我的 Transformers² 说明,但是组合两个 SVF 微调模型只是一个加法运算:

Are You Still Using LoRA to Fine-Tune Your LLM?SVFT

如果您需要更多可训练参数,SVFT 论文 (arxiv.org/abs/2405.19597) 探讨了多种方法,首先是在对角线上添加更多可训练权重。

Are You Still Using LoRA to Fine-Tune Your LLM?它还评估了其他多种替代方案,例如将它们随机分散到“M”矩阵中。

Are You Still Using LoRA to Fine-Tune Your LLM?更重要的是,SVFT 论文证实,拥有比对角线更多的可训练值是有用的。请参见下面的微调结果。

Are You Still Using LoRA to Fine-Tune Your LLM?接下来是几种将奇异值分成两组“大”和“小”的技术。但在我们继续之前,让我们暂停一下,进行更多 SVD 数学运算。

更多 SVD 数学

SVD 通常被视为分解成三个矩阵 W=USVT,但它也可以被认为是许多秩 1 矩阵的加权和,由奇异值加权:

Are You Still Using LoRA to Fine-Tune Your LLM?如果您想证明这一点,请一方面使用 USVT 形式和矩阵乘法的公式来表达单个矩阵元素 Wjk,另一方面使用 Σ siuiviT 形式,使用 S 是对角线的事实进行简化,并注意它是一样的。

在此表示中,很容易看出您可以将总和分成两部分。并且由于您可以始终对奇异值进行排序,因此您可以将其分成“大”和“小”奇异值。

回到三矩阵形式 W=USVT,这就是分割的样子:

Are You Still Using LoRA to Fine-Tune Your LLM?基于此公式,两篇论文探讨了如果您只调整大的奇异值或只调整小的奇异值会发生什么,即 PiSSA 和 MiLoRA。

PiSSA

PiSSA(主奇异值和奇异向量自适应,arxiv.org/abs/2404.02948)声称您应该只调整大的主值。机制如下所示:

Are You Still Using LoRA to Fine-Tune Your LLM?摘自论文:“PiSSA 旨在通过调整主要奇异分量来近似完全微调,这些分量被认为捕捉了权重矩阵的本质。相反,MiLoRA 旨在适应新任务,同时最大限度地保留基础模型的知识。”

PiSSA 论文还有一个有趣的发现:完全微调容易过度拟合。使用低秩微调技术,您可能会在绝对值上获得更好的结果。

Are You Still Using LoRA to Fine-Tune Your LLM?MiLoRA

另一方面,MiLoRA(次要奇异分量 LoRA arxiv.org/abs/2406.09044)声称您应该只调整小的主值。它使用与 PiSSA 类似的机制:

Are You Still Using LoRA to Fine-Tune Your LLM?令人惊讶的是,MiLoRA 似乎占据了上风,至少在微调数学数据集时是这样,这些数据集可能与原始预训练相当一致。可以说,PiSSA 应该更适合将 LLM 的行为从其预训练中进一步弯曲。

Are You Still Using LoRA to Fine-Tune Your LLM?LoRA-XS

最后,我想提到 LoRA-XS (arxiv.org/abs/2405.17604)。与 PiSSA 非常相似,但机制略有不同。它还显示出比 LoRA 少得多的参数也能获得良好的结果。

Are You Still Using LoRA to Fine-Tune Your LLM?该论文提供了数学解释,说明在两种情况下这种设置是“理想的”:

  • 从 SVD 中截断底部的主要值仍然可以很好地近似权重矩阵
  • 微调数据分布接近预训练数据分布

在我看来,两者都值得怀疑,所以我不会详细介绍数学。一些结果:

Are You Still Using LoRA to Fine-Tune Your LLM?根本假设似乎是奇异值分为“大”和“小”两种,但事实是这样吗?我在 Colab 上快速检查了 Gemma2 9B。底线:99% 的奇异值在 0.1 – 1.1 范围内。我不确定将它们分成“大”和“小”是否有意义。

Are You Still Using LoRA to Fine-Tune Your LLM?结论

还有许多其他参数高效的微调技术。值得一提的是:

  • DoRA (arxiv.org/abs/2402.09353),它将权重分成大小和方向,然后调整这些权重。
  • AdaLoRA (arxiv.org/abs/2303.10512),它具有复杂的机制,可以为给定的可训练权重预算找到最佳调整秩。

我的结论:为了超越具有 10 倍参数的 LoRA 标准,我喜欢 Transformers² 的 SVF 的简单性。如果您需要更多可训练权重,SVFT 是一种简单的扩展。两者都使用所有奇异值(全秩,无奇异值修剪),并且仍然很便宜?。祝您微调愉快!

注意:所有插图均由作者创作或从 arxiv.org 论文中提取,用于评论和讨论。

以上是您是否仍在使用Lora来微调LLM?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
无法使用chatgpt!解释可以立即测试的原因和解决方案[最新2025]无法使用chatgpt!解释可以立即测试的原因和解决方案[最新2025]May 14, 2025 am 05:04 AM

ChatGPT无法访问?本文提供多种实用解决方案!许多用户在日常使用ChatGPT时,可能会遇到无法访问或响应缓慢等问题。本文将根据不同情况,逐步指导您解决这些问题。 ChatGPT无法访问的原因及初步排查 首先,我们需要确定问题是出在OpenAI服务器端,还是用户自身网络或设备问题。 请按照以下步骤进行排查: 步骤1:检查OpenAI官方状态 访问OpenAI Status页面 (status.openai.com),查看ChatGPT服务是否正常运行。如果显示红色或黄色警报,则表示Open

计算ASI的风险始于人类的思想计算ASI的风险始于人类的思想May 14, 2025 am 05:02 AM

2025年5月10日,麻省理工学院物理学家Max Tegmark告诉《卫报》,AI实验室应在释放人工超级智能之前模仿Oppenheimer的三位一体测试演算。 “我的评估是'康普顿常数',这是一场比赛的可能性

易于理解的解释如何编写和撰写歌词和推荐工具易于理解的解释如何编写和撰写歌词和推荐工具May 14, 2025 am 05:01 AM

AI音乐创作技术日新月异,本文将以ChatGPT等AI模型为例,详细讲解如何利用AI辅助音乐创作,并辅以实际案例进行说明。我们将分别介绍如何通过SunoAI、Hugging Face上的AI jukebox以及Python的Music21库进行音乐创作。 通过这些技术,每个人都能轻松创作原创音乐。但需注意,AI生成内容的版权问题不容忽视,使用时务必谨慎。 让我们一起探索AI在音乐领域的无限可能! OpenAI最新AI代理“OpenAI Deep Research”介绍: [ChatGPT]Ope

什么是chatgpt-4?对您可以做什么,定价以及与GPT-3.5的差异的详尽解释!什么是chatgpt-4?对您可以做什么,定价以及与GPT-3.5的差异的详尽解释!May 14, 2025 am 05:00 AM

ChatGPT-4的出现,极大地拓展了AI应用的可能性。相较于GPT-3.5,ChatGPT-4有了显着提升,它具备强大的语境理解能力,还能识别和生成图像,堪称万能的AI助手。在提高商业效率、辅助创作等诸多领域,它都展现出巨大的潜力。然而,与此同时,我们也必须注意其使用上的注意事项。 本文将详细解读ChatGPT-4的特性,并介绍针对不同场景的有效使用方法。文中包含充分利用最新AI技术的技巧,敬请参考。 OpenAI发布的最新AI代理,“OpenAI Deep Research”详情请点击下方链

解释如何使用chatgpt应用程序!日本支持和语音对话功能解释如何使用chatgpt应用程序!日本支持和语音对话功能May 14, 2025 am 04:59 AM

CHATGPT应用程序:与AI助手释放您的创造力!初学者指南 ChatGpt应用程序是一位创新的AI助手,可处理各种任务,包括写作,翻译和答案。它是一种具有无限可能性的工具,可用于创意活动和信息收集。 在本文中,我们将以一种易于理解的方式解释初学者,从如何安装chatgpt智能手机应用程序到语音输入功能和插件等应用程序所独有的功能,以及在使用该应用时要牢记的要点。我们还将仔细研究插件限制和设备对设备配置同步

如何使用中文版Chatgpt?注册程序和费用的说明如何使用中文版Chatgpt?注册程序和费用的说明May 14, 2025 am 04:56 AM

ChatGPT中文版:解锁中文AI对话新体验 ChatGPT风靡全球,您知道它也提供中文版本吗?这款强大的AI工具不仅支持日常对话,还能处理专业内容,并兼容简体中文和繁体中文。无论是中国地区的使用者,还是正在学习中文的朋友,都能从中受益。 本文将详细介绍ChatGPT中文版的使用方法,包括账户设置、中文提示词输入、过滤器的使用、以及不同套餐的选择,并分析潜在风险及应对策略。此外,我们还将对比ChatGPT中文版和其他中文AI工具,帮助您更好地了解其优势和应用场景。 OpenAI最新发布的AI智能

5 AI代理神话,您需要停止相信5 AI代理神话,您需要停止相信May 14, 2025 am 04:54 AM

这些可以将其视为生成AI领域的下一个飞跃,这为我们提供了Chatgpt和其他大型语言模型聊天机器人。他们可以代表我们采取行动,而不是简单地回答问题或产生信息

易于理解使用Chatgpt创建和管理多个帐户的非法性的解释易于理解使用Chatgpt创建和管理多个帐户的非法性的解释May 14, 2025 am 04:50 AM

使用chatgpt有效的多个帐户管理技术|关于如何使用商业和私人生活的详尽解释! Chatgpt在各种情况下都使用,但是有些人可能担心管理多个帐户。本文将详细解释如何为ChatGpt创建多个帐户,使用时该怎么做以及如何安全有效地操作它。我们还介绍了重要的一点,例如业务和私人使用差异,并遵守OpenAI的使用条款,并提供指南,以帮助您安全地利用多个帐户。 Openai

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具