ChatGPT中有这样一个核心训练方法,名叫“人类反馈强化学习(RLHF)”。
它可以让模型更安全、输出结果更遵循人类意图。
现在,来自谷歌Research和UC伯克利的研究人员发现,将该方法用在AI绘画上,“治疗”图像跟输入不完全匹配的情况,效果也奇好——
可以实现高达47%的改进。
△ 左为Stable Diffusion,右为改进后效果
这一刻,AIGC领域中两类大火的模型,似乎找到了某种“共鸣”。
如何将RLHF用于AI绘画?
RLHF,全称“Reinforcement Learning from Human Feedback”,是OpenAI和DeepMind于2017年合作开发的一种强化学习技术。
正如其名,RLHF就是用人类对模型输出结果的评价(即反馈)来直接优化模型,在LLM中,它可以使得“模型价值观”更符合人类价值观。
而在AI图像生成模型中,它可以让生成图像与文本提示得到充分对齐。
具体而言,首先,收集人类反馈数据。
在这里,研究人员一共生成了27000余个“文本图像对”,然后让一些人类来打分。
为了简单起见,文本提示只包括以下四种类别,分别关乎数量、颜色、背景和混合选项;人类的反馈则只分“好”、“坏”与“不知道(skip)”。
其次,学习奖励函数。
这一步,就是利用刚刚获得的人类评价组成的数据集,训练出奖励函数,然后用该函数来预测人类对模型输出的满意度(公式红色部分)。
这样,模型就知道自己的结果究竟有几分符合文本。
除了奖励函数,作者还提出了一个辅助任务(公式蓝色部分)。
也就是当图像生成完成后,模型再给一堆文本,但其中只有一个是原始文本,让奖励模型“自己检查”图像是否跟该文本相匹配。
这种逆向操作可以让效果得到“双重保险”(可以辅助下图中的step2进行理解)。
最后,就是微调了。
即通过奖励加权最大似然估计(reward-weighted likelihood maximization)(下公式第一项),更新文本-图像生成模型。
为了避免过拟合,作者对预训练数据集上的NLL值(公式第二项)进行了最小化。这种做法类似于InstructionGPT (ChatGPT的“直系前辈”)。
效果提升47%,但清晰度下滑5%
如下一系列效果所示,相比原始的Stable Diffusion,用RLHF微调过后的模型可以:
(1)更正确地get文本里的“两只”和“绿色”;
(2)不会忽略“大海”作为背景的要求;
(3)想要红老虎,能给出“更红”的结果。
从具体数据来看,微调后的模型人类满意度为50%,相比原来的模型(3%),得到了47%的提高。
不过,代价是失去了5%的图像清晰度。
从下图我们也能很清楚的看到,右边的狼明显比左边的糊一些:
对此,作者表示,使用更大的人类评价数据集和更好的优化 (RL) 方法,可以改善这种情况。
关于作者
本文一共9位作者。
一作为谷歌AI研究科学家Kimin Lee,韩国科学技术院博士,博士后研究在UC伯克利大学展开。
华人作者三位:
Liu Hao,UC伯克利在读博士生,主要研究兴趣为反馈神经网络。
Du Yuqing,同UC伯克利博士在读,主要研究方向为无监督强化学习方法。
Shixiang Shane Gu (顾世翔),通讯作者,本科师从三巨头之一Hinton,博士毕业于剑桥大学。
△ 顾世翔
值得一提的是,写这篇文章时他还是谷歌人,如今已经跳槽至OpenAI,并在那里直接向ChatGPT负责人报告。
论文地址:
https://arxiv.org/abs/2302.12192
参考链接:[1]https://www.php.cn/link/4d42d2f5010c1c13f23492a35645d6a7
[2]https://openai.com/blog/instruction-following/
以上是ChatGPT核心方法可用于AI绘画,效果飞升47%,通讯作者:已跳槽OpenAI的详细内容。更多信息请关注PHP中文网其他相关文章!

软AI(被定义为AI系统,旨在使用近似推理,模式识别和灵活的决策执行特定的狭窄任务 - 试图通过拥抱歧义来模仿类似人类的思维。 但是这对业务意味着什么

答案很明确 - 只是云计算需要向云本地安全工具转变,AI需要专门为AI独特需求而设计的新型安全解决方案。 云计算和安全课程的兴起 在

企业家,并使用AI和Generative AI来改善其业务。同时,重要的是要记住生成的AI,就像所有技术一样,都是一个放大器 - 使得伟大和平庸,更糟。严格的2024研究O

解锁嵌入模型的力量:深入研究安德鲁·NG的新课程 想象一个未来,机器可以完全准确地理解和回答您的问题。 这不是科幻小说;多亏了AI的进步,它已成为R

大型语言模型(LLM)和不可避免的幻觉问题 您可能使用了诸如Chatgpt,Claude和Gemini之类的AI模型。 这些都是大型语言模型(LLM)的示例,在大规模文本数据集上训练的功能强大的AI系统

最近的研究表明,根据行业和搜索类型,AI概述可能导致有机交通下降15-64%。这种根本性的变化导致营销人员重新考虑其在数字可见性方面的整个策略。 新的

埃隆大学(Elon University)想象的数字未来中心的最新报告对近300名全球技术专家进行了调查。由此产生的报告“ 2035年成为人类”,得出的结论是,大多数人担心AI系统加深的采用


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

SublimeText3汉化版
中文版,非常好用

Atom编辑器mac版下载
最流行的的开源编辑器

VSCode Windows 64位 下载
微软推出的免费、功能强大的一款IDE编辑器

禅工作室 13.0.1
功能强大的PHP集成开发环境

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中