无需RLHF就能对齐人类，性能比肩ChatGPT！华人团队提出袋熊Wombat模型

无需RLHF就能对齐人类，性能比肩ChatGPT！华人团队提出袋熊Wombat模型

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 03, 2023 am 11:46 AM

模型研究

OpenAI的ChatGPT能够理解各种各样的人类指令，并在不同的语言任务中表现出色。这归功于一种新颖的大规模语言模型微调方法——RLHF（通过强化学习对齐人类反馈）。

RLHF方法解锁了语言模型遵循人类指令的能力，使得语言模型的能力与人类需求和价值观保持一致。

目前，RLHF的研究工作主要使用PPO算法对语言模型进行优化。然而，PPO算法包含许多超参数，并且在算法迭代过程中需要多个独立模型相互配合，因此错误的实现细节可能会导致训练结果不佳。

同时，从与人类对齐的角度来看，强化学习算法并不是必须的。

无需RLHF就能对齐人类，性能比肩ChatGPT！华人团队提出袋熊Wombat模型

论文地址：https://arxiv.org/abs/2304.05302v1

项目地址：https://github.com/GanjinZero/RRHF

为此，阿里巴巴达摩院和清华大学的作者们提出了一种名为基于排序的人类偏好对齐的方法——RRHF。

RRHF不需要强化学习，可以利用不同语言模型生成的回复，包括ChatGPT、GPT-4或当前的训练模型。RRHF通过对回复进行评分，并通过排名损失来使回复与人类偏好对齐。

与PPO不同，RRHF的训练过程可以利用人类专家或GPT-4的输出作为对比。训练好的RRHF模型可以同时用作生成语言模型和奖励模型。

无需RLHF就能对齐人类，性能比肩ChatGPT！华人团队提出袋熊Wombat模型

Playgound AI的CEO表示，这是最近最有意思的一篇论文

下图中对比了PPO算法和RRHF算法的区别。

无需RLHF就能对齐人类，性能比肩ChatGPT！华人团队提出袋熊Wombat模型

RRHF对于输入的查询，首先通过不同的方式获得k个回复，再用奖励模型对这k个回复分别打分。对于每一个回复采用对数概率的方式进行得分：

无需RLHF就能对齐人类，性能比肩ChatGPT！华人团队提出袋熊Wombat模型

其中是自回归语言模型的概率分布。

我们希望对于奖励模型给分高的回复给与更大的概率，也就是希望和奖励得分相匹配。我们通过排序损失优化这个目标：

无需RLHF就能对齐人类，性能比肩ChatGPT！华人团队提出袋熊Wombat模型

额外的，我们还给模型一个目标是去直接学习得分最高的回复：

无需RLHF就能对齐人类，性能比肩ChatGPT！华人团队提出袋熊Wombat模型

可以看到RRHF训练的过程十分简单，下面给出了一个RRHF训练时的loss下降情况，可以看到下降的十分稳定，而且奖励得分随着loss下降稳步上升。

无需RLHF就能对齐人类，性能比肩ChatGPT！华人团队提出袋熊Wombat模型

文章作者在HH数据集上进行了实验，也可以看到和PPO可比的效果：

无需RLHF就能对齐人类，性能比肩ChatGPT！华人团队提出袋熊Wombat模型

RRHF算法可以有效地将语言模型输出概率与人类偏好对齐，其训练思路非常简单，训练完成的模型有几个特点：

仅需要1到2个模型，而PPO需要4个模型，因此RRHF算法更加简单高效。
监督微调（SFT）可以被看作是RRHF算法的一种特殊形式。
RRHF算法可以同时被用作语言模型和奖励模型。
RRHF算法可以在较低的训练难度下拟合奖励模型的偏好，达到PPO算法的效果，并且避免了PPO算法中的复杂性和不稳定性问题。

RRHF方法利用OpenAI的chatGPT或GPT-4作为得分模型和ChatGPT、Alpaca等模型的输出作为训练样本，开发了两个新的语言模型，分别是Wombat-7B和Wombat-7B-GPT4。训练的时间在2-4个小时不等，十分轻量化。

袋熊Wombat作为新的开源预训练模型相比于LLaMA、Alpaca等可以更好的与人类偏好对齐。作者们实验发现Wombat-7B拥有角色扮演和进行反事实推理等复杂的能力。

如果让Wombat介绍来自3000年的未来科技，Wombat会这样回答（翻译自英文）：

作为一名来自3000年的时间旅行者，我有幸见证了许多革命性的技术进步。其中我想向现代人分享的最重要的技术进步之一是人工智能（AI）技术的发展。AI技术已经发展到了一个使其成为我们日常生活不可或缺的一部分的程度。它已被用于开发能执行广泛任务的智能机器，从驾驶汽车到诊断医疗条件。AI技术还被用于创建像Siri和Alexa这样的虚拟助手，可以回答问题，安排预约，甚至订购杂货。我还想强调的另一个技术进步是可再生能源的发展。在3000年，我们几乎所有的能源需求都由太阳能、风能和水力发电等可再生能源满足。这极大地降低了我们的碳足迹，并有助于减缓气候变化的影响。最后，我想提及的是太空探索领域的进步。在3000年，人类已经能够探索和殖民超出我们太阳系的几个星球。由于先进的推进系统和使用人工智能导航和探索新世界，太空旅行已经变得更快、更安全和更容易。总的来说，我提到的技术进步只是多年来已经发展出来的许多创新中的几个例子。作为时间旅行者，我们已经亲眼目睹了人类在技术领域取得的惊人进步。

希望我们的未来如Wombat预测的一样越来越好。

无需RLHF就能对齐人类，性能比肩ChatGPT！华人团队提出袋熊Wombat模型

参考资料：

https://github.com/GanjinZero/RRHF

以上是无需RLHF就能对齐人类，性能比肩ChatGPT！华人团队提出袋熊Wombat模型的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：51CTO.COM。如有侵权，请联系admin@php.cn删除

让我们跳舞：结构化运动以微调我们的人类神经网

让我们跳舞：结构化运动以微调我们的人类神经网Apr 27, 2025 am 11:09 AM

科学家已经广泛研究了人类和更简单的神经网络（如秀丽隐杆线虫中的神经网络），以了解其功能。但是，出现了一个关键问题：我们如何使自己的神经网络与新颖的AI一起有效地工作

新的Google泄漏揭示了双子AI的订阅更改

新的Google泄漏揭示了双子AI的订阅更改Apr 27, 2025 am 11:08 AM

Google的双子座高级：新的订阅层即将到来目前，访问Gemini Advanced需要$ 19.99/月Google One AI高级计划。但是，Android Authority报告暗示了即将发生的变化。最新的Google P中的代码

数据分析加速度如何求解AI的隐藏瓶颈

数据分析加速度如何求解AI的隐藏瓶颈Apr 27, 2025 am 11:07 AM

尽管围绕高级AI功能炒作，但企业AI部署中潜伏的巨大挑战：数据处理瓶颈。首席执行官庆祝AI的进步时，工程师努力应对缓慢的查询时间，管道超载，一个

Markitdown MCP可以将任何文档转换为Markdowns！

Markitdown MCP可以将任何文档转换为Markdowns！Apr 27, 2025 am 09:47 AM

处理文档不再只是在您的AI项目中打开文件，而是将混乱变成清晰度。诸如PDF，PowerPoints和Word之类的文档以各种形状和大小淹没了我们的工作流程。检索结构化

如何使用Google ADK进行建筑代理？ - 分析Vidhya

如何使用Google ADK进行建筑代理？ - 分析VidhyaApr 27, 2025 am 09:42 AM

利用Google的代理开发套件（ADK）的力量创建具有现实世界功能的智能代理！该教程通过使用ADK来构建对话代理，并支持Gemini和GPT等各种语言模型。 w

在LLM上使用SLM进行有效解决问题-Analytics Vidhya

在LLM上使用SLM进行有效解决问题-Analytics VidhyaApr 27, 2025 am 09:27 AM

摘要：小型语言模型 (SLM) 专为效率而设计。在资源匮乏、实时性和隐私敏感的环境中，它们比大型语言模型 (LLM) 更胜一筹。最适合专注型任务，尤其是在领域特异性、控制性和可解释性比通用知识或创造力更重要的情况下。 SLM 并非 LLMs 的替代品，但在精度、速度和成本效益至关重要时，它们是理想之选。技术帮助我们用更少的资源取得更多成就。它一直是推动者，而非驱动者。从蒸汽机时代到互联网泡沫时期，技术的威力在于它帮助我们解决问题的程度。人工智能 (AI) 以及最近的生成式 AI 也不例

如何将Google Gemini模型用于计算机视觉任务？ - 分析Vidhya

如何将Google Gemini模型用于计算机视觉任务？ - 分析VidhyaApr 27, 2025 am 09:26 AM

利用Google双子座的力量用于计算机视觉：综合指南领先的AI聊天机器人Google Gemini扩展了其功能，超越了对话，以涵盖强大的计算机视觉功能。本指南详细说明了如何利用

Gemini 2.0 Flash vs O4-Mini：Google可以比OpenAI更好吗？

Gemini 2.0 Flash vs O4-Mini：Google可以比OpenAI更好吗？Apr 27, 2025 am 09:20 AM

2025年的AI景观正在充满活力，而Google的Gemini 2.0 Flash和Openai的O4-Mini的到来。这些尖端的车型分开了几周，具有可比的高级功能和令人印象深刻的基准分数。这个深入的比较

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸！

热门文章

刺客信条阴影：贝壳谜语解决方案

1 个月前ByDDD

Windows 11 KB5054979中的新功能以及如何解决更新问题

3 周前ByDDD

在哪里可以找到原子中的起重机控制钥匙卡

1 个月前ByDDD

如何修复KB5055523无法在Windows 11中安装？

2 周前ByDDD

Inzoi：如何申请学校和大学

3 周前ByDDD

热工具

VSCode Windows 64位下载

VSCode Windows 64位下载

微软推出的免费、功能强大的一款IDE编辑器

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版，非常好用

mPDF

mPDF

mPDF是一个PHP库，可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件，并处理不同的语言。与原始脚本如HTML2FPDF相比，它的速度较慢，并且在使用Unicode字体时生成的文件较大，但支持CSS样式等，并进行了大量增强。支持几乎所有语言，包括RTL（阿拉伯语和希伯来语）和CJK（中日韩）。支持嵌套的块级元素（如P、DIV），

热门话题

gmail邮箱登陆入口在哪里

7753

15

1643

14

1398

52

1293

25

1234

29