Google, AI가 출력 정확도를 독립적으로 판단할 수 있는 모델 훈련 프레임워크인 ASPIRE 출시-일체 포함-php.cn

집

기술 주변기기

일체 포함

Google, AI가 출력 정확도를 독립적으로 판단할 수 있는 모델 훈련 프레임워크인 ASPIRE 출시

王林

Jan 23, 2024 pm 05:36 PM

Googleai대규모 언어 모델

可令 AI 自我判断输出内容正确性，谷歌公布模型训练框架 ASPIRE

Google은 최근 대규모 언어 모델을 위해 특별히 설계된 ASPIRE 교육 프레임워크의 출시를 알리는 보도 자료를 발표했습니다. 이 프레임워크는 AI 모델의 선택적 예측 기능을 향상시키는 것을 목표로 합니다.

可令 AI 自我判断输出内容正确性，谷歌公布模型训练框架 ASPIRE

Google은 자연어 이해 및 콘텐츠 생성 분야에서 대규모 언어 모델이 빠르게 발전하고 있으며 다양한 혁신적인 애플리케이션을 구축하는 데 사용되었지만 위험도가 높은 의사 결정 상황에 적용하는 것은 여전히 부적절하다고 언급했습니다. 이는 모델 예측의 "환각" 가능성과 불확실성 때문입니다. 따라서 Google은 일련의 모델에 "신뢰성" 메커니즘을 도입하는 ASPIRE 교육 프레임워크를 개발했습니다. 즉, 모델은 일련의 답변을 출력합니다. , 각각의 답변은 모두 정답일 확률 점수를 갖습니다 .

可令 AI 自我判断输出内容正确性，谷歌公布模型训练框架 ASPIRE

▲ 이미지 출처 Google 보도 자료(아래 동일)

기술적 수준에서 교육 프레임워크는 과제별 조정, 답변 샘플링, 자체 평가 학습의 세 단계로 나눌 수 있습니다.

"특정 작업 조정" 단계는 기본 훈련을 받은 대형 언어 모델을 심층적으로 훈련하는 단계로,

모델의 예측 역량 강화에 중점을 둡니다. 연구자들은 주로 모델에 일련의 조정 가능한 매개변수를 도입하고 특정 작업의 훈련 데이터 세트에 대해 사전 훈련된 언어 모델을 미세 조정함으로써 모델의 예측 성능을 향상시키고 모델이 특정 문제를 더 잘 해결할 수 있도록 합니다.

可令 AI 自我判断输出内容正确性，谷歌公布模型训练框架 ASPIRE

두 번째 단계는 "답안 샘플링"입니다. 특정 미세 조정 후 모델은 이전에 학습된 조정 가능한 매개변수를 사용하여 각 교육 질문에 대해 서로 다른 답변을 생성하고 자체 평가 학습을 위한 데이터 세트를 생성할 수 있습니다. 신뢰성이 높은 일련의 답변.

또한 연구원들은 "Beam Search" 방법과 Rouge-L 알고리즘을 사용하여 답변의 품질을 평가하고 생성된 답변과 점수를 모델에 다시 입력하여 3단계를 시작했습니다.

可令 AI 自我判断输出内容正确性，谷歌公布模型训练框架 ASPIRE

"자체 평가 학습"의 세 번째 단계에서 연구원들은 모델의 자체 평가 기능을 향상시키기 위해 특별히 모델에 조정 가능한 매개변수 세트를 추가했습니다.

이 단계의 목표는 모델이 "출력 답변의 정확성을 스스로 판단"하는 방법을 학습하여 대규모 언어 모델이 답변을 생성할 때 답변의 올바른 확률 점수도 첨부하는 것입니다.

Google 연구원들은 ASPIRE 훈련 프레임워크의 결과를 검증하기 위해 CoQA, TriviaQA 및 SQuAD라는 세 가지 질문 및 답변 데이터 세트를 사용했습니다. "ASPIRE로 조정된 OPT-2.7B 소형 모델은 더 큰 OPT- 30B 모델." 실험 결과는 또한 적절한 조정을 통해 작은 언어 모델이라도 일부 시나리오에서는 큰 언어 모델을 능가할 수 있음을 보여줍니다.

可令 AI 自我判断输出内容正确性，谷歌公布模型训练框架 ASPIRE

연구원들은

ASPIRE 프레임워크 훈련이 대규모 언어 모델의 출력 정확도를 크게 향상시킬 수 있으며 심지어 더 작은 모델도 미세 조정 후 "정확하고 자신감 있는" 예측을 할 수 있다는 결론을 내렸습니다.

위 내용은 Google, AI가 출력 정확도를 독립적으로 판단할 수 있는 모델 훈련 프레임워크인 ASPIRE 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

谷歌三件套指的是哪三个软件Sep 30, 2022 pm 01:54 PM

谷歌三件套指的是：1、google play商店，即下载各种应用程序的平台，类似于移动助手，安卓用户可以在商店下载免费或付费的游戏和软件；2、Google Play服务，用于更新Google本家的应用和Google Play提供的其他第三方应用；3、谷歌服务框架（GMS），是系统软件里面可以删除的一个APK程序，通过谷歌平台上架的应用和游戏都需要框架的支持。

为什么中国不卖google手机Mar 30, 2023 pm 05:31 PM

中国不卖google手机的原因：谷歌已经全面退出中国市场了，所以不能在中国销售，在国内是没有合法途径销售。在中国消费市场中，消费者大都倾向于物美价廉以及功能实用的产品，所以竞争实力本就因政治因素大打折扣的谷歌手机主体市场一直不在中国大陆。

谷歌超强AI超算碾压英伟达A100！TPU v4性能提升10倍，细节首次公开Apr 07, 2023 pm 02:54 PM

虽然谷歌早在2020年，就在自家的数据中心上部署了当时最强的AI芯片——TPU v4。但直到今年的4月4日，谷歌才首次公布了这台AI超算的技术细节。论文地址：https://arxiv.org/abs/2304.01433相比于TPU v3，TPU v4的性能要高出2.1倍，而在整合4096个芯片之后，超算的性能更是提升了10倍。另外，谷歌还声称，自家芯片要比英伟达A100更快、更节能。与A100对打，速度快1.7倍论文中，谷歌表示，对于规模相当的系统，TPU v4可以提供比英伟达A100强1.

谷歌并未放弃TensorFlow，将于2023年发布新版，明确四大支柱Apr 12, 2023 am 11:52 AM

2015 年，谷歌大脑开放了一个名为「TensorFlow」的研究项目，这款产品迅速流行起来，成为人工智能业界的主流深度学习框架，塑造了现代机器学习的生态系统。从那时起，成千上万的开源贡献者以及众多的开发人员、社区组织者、研究人员和教育工作者等都投入到这一开源软件库上。然而七年后的今天，故事的走向已经完全不同：谷歌的 TensorFlow 失去了开发者的拥护。因为 TensorFlow 用户已经开始转向 Meta 推出的另一款框架 PyTorch。众多开发者都认为 TensorFlow 已经输掉

LLM之战，谷歌输了！越来越多顶尖研究员跳槽OpenAIApr 07, 2023 pm 05:48 PM

前几天，谷歌差点遭遇一场公关危机，Bert一作、已跳槽OpenAI的前员工Jacob Devlin曝出，Bard竟是用ChatGPT的数据训练的。随后，谷歌火速否认。而这场争议，也牵出了一场大讨论：为什么越来越多Google顶尖研究员跳槽OpenAI？这场LLM战役它还能打赢吗？知友回复莱斯大学博士、知友「一堆废纸」表示，其实谷歌和OpenAI的差距，是数据的差距。「OpenAI对LLM有强大的执念，这是Google这类公司完全比不上的。当然人的差距只是一个方面，数据的差距以及对待数据的态度才

参数少量提升，性能指数爆发！谷歌：大语言模型暗藏「神秘技能」Apr 11, 2023 pm 11:16 PM

由于可以做一些没训练过的事情，大型语言模型似乎具有某种魔力，也因此成为了媒体和研究员炒作和关注的焦点。当扩展大型语言模型时，偶尔会出现一些较小模型没有的新能力，这种类似于「创造力」的属性被称作「突现」能力，代表我们向通用人工智能迈进了一大步。如今，来自谷歌、斯坦福、Deepmind和北卡罗来纳大学的研究人员，正在探索大型语言模型中的「突现」能力。解码器提示的 DALL-E神奇的「突现」能力自然语言处理（NLP）已经被基于大量文本数据训练的语言模型彻底改变。扩大语言模型的规模通常会提高一系列下游N

四分钟对打300多次，谷歌教会机器人打乒乓球Apr 10, 2023 am 09:11 AM

让一位乒乓球爱好者和机器人对打，按照机器人的发展趋势来看，谁输谁赢还真说不准。机器人拥有灵巧的可操作性、腿部运动灵活、抓握能力出色…… 已被广泛应用于各种挑战任务。但在与人类互动紧密的任务中，机器人的表现又如何呢？就拿乒乓球来说，这需要双方高度配合，并且球的运动非常快速，这对算法提出了重大挑战。在乒乓球比赛中，首要的就是速度和精度，这对学习算法提出了很高的要求。同时，这项运动具有高度结构化（具有固定的、可预测的环境）和多智能体协作（机器人可以与人类或其他机器人一起对打）两大特点，使其成为研究人

超5800亿美元！微软谷歌神仙打架，让英伟达市值飙升，约为5个英特尔Apr 11, 2023 pm 04:31 PM

ChatGPT在手，有问必答。你可知，与它每次对话的计算成本简直让人泪目。此前，分析师称ChatGPT回复一次，需要2美分。要知道，人工智能聊天机器人所需的算力背后烧的可是GPU。这恰恰让像英伟达这样的芯片公司豪赚了一把。2月23日，英伟达股价飙升，使其市值增加了700多亿美元，总市值超5800亿美元，大约是英特尔的5倍。在英伟达之外，AMD可以称得上是图形处理器行业的第二大厂商，市场份额约为20%。而英特尔持有不到1%的市场份额。ChatGPT在跑，英伟达在赚随着ChatGPT解锁潜在的应用案

See all articles