谷歌发布能让 AI 自主判断输出准确性的模型训练框架 ASPIRE-人工智能-PHP中文网

首页

科技周边

人工智能

谷歌发布能让 AI 自主判断输出准确性的模型训练框架 ASPIRE

王林

Jan 23, 2024 pm 05:36 PM

谷歌ai大语言模型

可令 AI 自我判断输出内容正确性，谷歌公布模型训练框架 ASPIRE

谷歌近日发布新闻稿，宣布推出ASPIRE训练框架，专为大语言模型设计。该框架旨在提升AI模型的选择性预测能力。

可令 AI 自我判断输出内容正确性，谷歌公布模型训练框架 ASPIRE

谷歌提到，当下大语言模型在自然语言理解和生成内容方面发展迅速，已被用于构建各种创新应用，但要应用于高风险决策类场合依然不妥。这是由于模型预测具有不确定性及“幻觉”可能，因此谷歌开发了一款 ASPIRE 训练框架，为系列模型引入了“可信度”机制，即 —— 模型会输出一系列答案，每个答案都会具有正确概率评分。

可令 AI 自我判断输出内容正确性，谷歌公布模型训练框架 ASPIRE

▲ 图源谷歌新闻稿（下同）

在技术层面，该训练框架可划分为三个阶段：特定任务调整、答案采样和自我评估学习。

其中“特定任务调整”阶段是对已接受过基础训练的大型语言模型进行深入训练，专注于强化模型的预测能力。研究人员主要为模型引入一系列可调参数，在特定任务的训练数据集上微调预训练语言模型，从而提升模型预测性能，让模型能够更好地解决特定问题。

可令 AI 自我判断输出内容正确性，谷歌公布模型训练框架 ASPIRE

第二阶段为“答案采样”，经过特定微调后，模型可以利用先前学习到的可调参数，为每个训练问题生成不同的答案，并创建用于自我评估学习的数据集，生成一系列可信度较高的答案。研究人员同时使用 “集束搜索（Beam Search）”方法及 Rouge-L 算法来评估答案的质量，并将生成的答案及评分重新输入给模型开启第三阶段。

可令 AI 自我判断输出内容正确性，谷歌公布模型训练框架 ASPIRE

而在第三阶段“自我评估学习”中，研究人员为模型添加一组可调参数，专门用于提升模型自我评估能力。该阶段的目标是让模型学会“自己判断输出的答案准确性”，从而让大语言模型在生成答案时，还会附上答案的正确概率评分。

谷歌研究人员使用 CoQA、TriviaQA 和 SQuAD 三个问答数据集来验证 ASPIRE 训练框架的成果，据称“经过 ASPIRE 调整的 OPT-2.7B 小模型，表现远超更大的 OPT-30B 模型”。而这项实验结果也同时表明，只要经过适当的调整，即使是小语言模型，在部分场景下也可以超越大语言模型。

可令 AI 自我判断输出内容正确性，谷歌公布模型训练框架 ASPIRE

研究人员总结称，ASPIRE 框架训练能够显著提升大语言模型输出准确率，即使是较小的模型，也可以在经过微调后进行“准确且有自信”的预测。

以上是谷歌发布能让 AI 自主判断输出准确性的模型训练框架 ASPIRE的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：51CTO.COM。如有侵权，请联系admin@php.cn删除

谷歌三件套指的是哪三个软件Sep 30, 2022 pm 01:54 PM

谷歌三件套指的是：1、google play商店，即下载各种应用程序的平台，类似于移动助手，安卓用户可以在商店下载免费或付费的游戏和软件；2、Google Play服务，用于更新Google本家的应用和Google Play提供的其他第三方应用；3、谷歌服务框架（GMS），是系统软件里面可以删除的一个APK程序，通过谷歌平台上架的应用和游戏都需要框架的支持。

为什么中国不卖google手机Mar 30, 2023 pm 05:31 PM

中国不卖google手机的原因：谷歌已经全面退出中国市场了，所以不能在中国销售，在国内是没有合法途径销售。在中国消费市场中，消费者大都倾向于物美价廉以及功能实用的产品，所以竞争实力本就因政治因素大打折扣的谷歌手机主体市场一直不在中国大陆。

谷歌超强AI超算碾压英伟达A100！TPU v4性能提升10倍，细节首次公开Apr 07, 2023 pm 02:54 PM

虽然谷歌早在2020年，就在自家的数据中心上部署了当时最强的AI芯片——TPU v4。但直到今年的4月4日，谷歌才首次公布了这台AI超算的技术细节。论文地址：https://arxiv.org/abs/2304.01433相比于TPU v3，TPU v4的性能要高出2.1倍，而在整合4096个芯片之后，超算的性能更是提升了10倍。另外，谷歌还声称，自家芯片要比英伟达A100更快、更节能。与A100对打，速度快1.7倍论文中，谷歌表示，对于规模相当的系统，TPU v4可以提供比英伟达A100强1.

谷歌并未放弃TensorFlow，将于2023年发布新版，明确四大支柱Apr 12, 2023 am 11:52 AM

2015 年，谷歌大脑开放了一个名为「TensorFlow」的研究项目，这款产品迅速流行起来，成为人工智能业界的主流深度学习框架，塑造了现代机器学习的生态系统。从那时起，成千上万的开源贡献者以及众多的开发人员、社区组织者、研究人员和教育工作者等都投入到这一开源软件库上。然而七年后的今天，故事的走向已经完全不同：谷歌的 TensorFlow 失去了开发者的拥护。因为 TensorFlow 用户已经开始转向 Meta 推出的另一款框架 PyTorch。众多开发者都认为 TensorFlow 已经输掉

LLM之战，谷歌输了！越来越多顶尖研究员跳槽OpenAIApr 07, 2023 pm 05:48 PM

前几天，谷歌差点遭遇一场公关危机，Bert一作、已跳槽OpenAI的前员工Jacob Devlin曝出，Bard竟是用ChatGPT的数据训练的。随后，谷歌火速否认。而这场争议，也牵出了一场大讨论：为什么越来越多Google顶尖研究员跳槽OpenAI？这场LLM战役它还能打赢吗？知友回复莱斯大学博士、知友「一堆废纸」表示，其实谷歌和OpenAI的差距，是数据的差距。「OpenAI对LLM有强大的执念，这是Google这类公司完全比不上的。当然人的差距只是一个方面，数据的差距以及对待数据的态度才

参数少量提升，性能指数爆发！谷歌：大语言模型暗藏「神秘技能」Apr 11, 2023 pm 11:16 PM

由于可以做一些没训练过的事情，大型语言模型似乎具有某种魔力，也因此成为了媒体和研究员炒作和关注的焦点。当扩展大型语言模型时，偶尔会出现一些较小模型没有的新能力，这种类似于「创造力」的属性被称作「突现」能力，代表我们向通用人工智能迈进了一大步。如今，来自谷歌、斯坦福、Deepmind和北卡罗来纳大学的研究人员，正在探索大型语言模型中的「突现」能力。解码器提示的 DALL-E神奇的「突现」能力自然语言处理（NLP）已经被基于大量文本数据训练的语言模型彻底改变。扩大语言模型的规模通常会提高一系列下游N

四分钟对打300多次，谷歌教会机器人打乒乓球Apr 10, 2023 am 09:11 AM

让一位乒乓球爱好者和机器人对打，按照机器人的发展趋势来看，谁输谁赢还真说不准。机器人拥有灵巧的可操作性、腿部运动灵活、抓握能力出色…… 已被广泛应用于各种挑战任务。但在与人类互动紧密的任务中，机器人的表现又如何呢？就拿乒乓球来说，这需要双方高度配合，并且球的运动非常快速，这对算法提出了重大挑战。在乒乓球比赛中，首要的就是速度和精度，这对学习算法提出了很高的要求。同时，这项运动具有高度结构化（具有固定的、可预测的环境）和多智能体协作（机器人可以与人类或其他机器人一起对打）两大特点，使其成为研究人

超5800亿美元！微软谷歌神仙打架，让英伟达市值飙升，约为5个英特尔Apr 11, 2023 pm 04:31 PM

ChatGPT在手，有问必答。你可知，与它每次对话的计算成本简直让人泪目。此前，分析师称ChatGPT回复一次，需要2美分。要知道，人工智能聊天机器人所需的算力背后烧的可是GPU。这恰恰让像英伟达这样的芯片公司豪赚了一把。2月23日，英伟达股价飙升，使其市值增加了700多亿美元，总市值超5800亿美元，大约是英特尔的5倍。在英伟达之外，AMD可以称得上是图形处理器行业的第二大厂商，市场份额约为20%。而英特尔持有不到1%的市场份额。ChatGPT在跑，英伟达在赚随着ChatGPT解锁潜在的应用案

See all articles