AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 '심호흡'이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!
프롬프트 단어에 "심호흡"을 추가하면 AI 대형 모델의 수학 점수가 8.4점 더 높아집니다!
Google DeepMind 팀의 최근 발견은 모두가 이미 잘 알고 있는 "단계별로 생각하자"(단계적으로 생각하자)와 결합된 이 새로운 "주문"(심호흡을 하세요)을 사용한다는 것입니다. ), 대형 모델은 GSM8K 데이터로 세트 점수가 71.8점에서 80.2점으로 향상되었습니다.
그리고 이 가장 효과적인 프롬프트 단어는 AI 자체에 의해 발견되었습니다.
심호흡을 하면 냉각팬의 속도가 빨라진다는 농담도 있습니다
새로 고액 연봉을 받는 엔지니어도 일이 오래가지 못할 수 있으니 정신을 차려야 한다고 생각하는 사람도 있습니다. 장기
관련 논문"Large Language Model is an Optimizer"이 다시 한 번 센세이션을 일으켰습니다.
구체적으로 Big-Bench Hard 데이터 세트에서 빅 모델 자체가 디자인한 프롬프트 단어가 최대 50% 향상되었습니다.
어떤 사람들은 "모델마다 가장 좋은 프롬프트 단어가 다릅니다"에도 중점을 둡니다.
논문에서는 프롬프트 단어 디자인 작업뿐만 아니라 선형 회귀 및 여행하는 세일즈맨 문제와 같은 고전적인 최적화 작업에 대한 대형 모델의 능력도 테스트되었습니다.
모델마다 최적의 프롬프트 단어가 다릅니다
최적화 문제는 어디에나 있습니다. 도함수와 기울기를 기반으로 하는 알고리즘은 강력한 도구이지만 실제 응용 프로그램에서는 기울기를 적용할 수 없는 상황이 자주 발생합니다.
이 문제를 해결하기 위해 팀은 프롬프트 단어에 의한 최적화(Optimization by PROmpting)라는 새로운 방법 OPRO을 개발했습니다.
최적화 문제를 공식적으로 정의하고 프로그램으로 해결하는 대신 자연어를 통해 최적화 문제를 설명하고 새로운 솔루션을 생성하려면 대형 모델이 필요합니다.
그래프 흐름 요약은 대형 모델에 대한 재귀 호출입니다.
최적화의 각 단계에서 이전에 생성된 솔루션과 점수가 입력으로 사용되고, 대규모 모델은 새로운 솔루션과 점수를 생성한 후 다음 최적화 단계에서 사용할 프롬프트 단어에 추가합니다.
논문에서는 주로 Google의 PaLM 2과 Bard의 text-bison 버전을 평가 모델로 사용했습니다.
옵티마이저로는 GPT-3.5, GPT-4 등 4가지 모델을 사용하겠습니다
연구 결과 프롬프트 단어 스타일과 모델별로 디자인된 적용 가능한 프롬프트 단어 스타일도 서로 다른 것으로 나타났습니다
이전 최적의 프롬프트 단어에서 GPT 시리즈의 AI가 디자인한 것은 "정답을 얻을 수 있도록 단계별로 해결해 봅시다."
이 프롬프트 단어는 APE 방법을 사용하여 디자인되었으며, ICLR 2023에서 GPT-3(text-davinci-002)에서 인간이 설계한 버전보다 성능이 뛰어난 "단계별로 생각해보자"라는 논문이 발표되었습니다.
Google 기반 PaLM 2 및 Bard에서는 이번 벤치마크 테스트에서 APE 버전이 인간 버전보다 성능이 나빴습니다
OPRO 방식으로 디자인된 새로운 프롬프트 단어 중 " 심호흡하세요" 및 "이 문제를 분해하세요" 가 PaLM에 가장 좋은 효과를 줍니다.
Bard 대형 모델의 텍스트-바이슨 버전의 경우 더 자세한 프롬프트 단어를 제공하는 경향이 더 큽니다
또한 이 논문은 수학적 최적화 프로그램에서 대형 모델의 잠재력을 보여줍니다
선형 회귀 지속적인 최적화 문제의 예입니다.
여행하는 외판원 문제를 이산 최적화 문제의 예로 들 수 있습니다.
힌트만 있으면 대규모 모델이 좋은 솔루션을 찾을 수 있으며 때로는 손으로 디자인한 휴리스틱과 일치하거나 초과할 수도 있습니다.
그러나 팀은 대형 모델이 아직 기존의 경사 기반 최적화 알고리즘을 대체할 수 없다고 믿습니다. 노드 수가 많은 순회 판매원 문제와 같이 문제 규모가 큰 경우 OPRO 방법의 성능은 이상적이지 않습니다.
팀에서는 향후 개선 방향에 대한 아이디어를 제시했습니다. 그들은 현재의 대형 모델이 오류 사례를 효과적으로 활용할 수 없으며 단순히 오류 사례를 제공하는 것만으로는 대형 모델이 오류의 원인을 포착할 수 없다고 믿습니다
오류 사례에 대한 보다 풍부한 피드백을 결합하고 높은 수준의 최적화 궤적을 요약하는 것이 유망한 방향입니다. 주요 기능 차이점 품질과 낮은 품질의 생성 단서 사이.
이 정보는 최적화 모델이 과거에 생성된 힌트를 더 효과적으로 개선하는 데 도움이 될 수 있으며 힌트 최적화에 필요한 샘플 수를 더욱 줄일 수 있습니다.
논문은 다수의 최적 힌트 단어를 공개합니다
논문은 Google과 DeepMind 부서가 합병되었지만 저자는 주로 Quoc Le, Zhou Dengyong을 포함하여 원래 Google Brain 팀 출신입니다.
저희는 코넬대학교 박사학위를 취득한 푸단 동문 Chengrun Yang과 UC Berkeley 박사학위를 취득한 Shanghai Jiao Tong University 동문 Chen Xinyan입니다.
팀은 또한 영화 추천, 영화 이름 스푸핑 등 실용적인 시나리오를 포함하여 실험에서 얻은 최고의 프롬프트 단어를 논문에 많이 제공했습니다. 필요하신 분들은 직접 참고하시면 됩니다
논문주소 : https://arxiv.org/abs/2309.03409
위 내용은 AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 '심호흡'이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

AI 식품 준비 여전히 초기 사용 중이지만 AI 시스템은 음식 준비에 점점 더 많이 사용되고 있습니다. AI 구동 로봇은 부엌에서 햄버거를 뒤집기, 피자 만들기 또는 SA 조립과 같은 음식 준비 작업을 자동화하는 데 사용됩니다

소개 파이썬 기능에서 변수의 네임 스페이스, 범위 및 동작을 이해하는 것은 효율적으로 작성하고 런타임 오류 또는 예외를 피하는 데 중요합니다. 이 기사에서는 다양한 ASP를 탐구 할 것입니다

소개 생생한 그림과 조각으로 둘러싸인 아트 갤러리를 걷는 것을 상상해보십시오. 이제 각 작품에 질문을하고 의미있는 대답을 얻을 수 있다면 어떨까요? “어떤 이야기를하고 있습니까?

제품 케이던스를 계속하면서 이번 달 Mediatek은 새로운 Kompanio Ultra and Dimensity 9400을 포함한 일련의 발표를했습니다. 이 제품은 스마트 폰 용 칩을 포함하여 Mediatek 비즈니스의 전통적인 부분을 채우고 있습니다.

#1 Google은 Agent2agent를 시작했습니다 이야기 : 월요일 아침입니다. AI 기반 채용 담당자로서 당신은 더 똑똑하지 않고 더 똑똑하지 않습니다. 휴대 전화에서 회사의 대시 보드에 로그인합니다. 세 가지 중요한 역할이 공급되고, 검증되며, 예정된 FO가 있음을 알려줍니다.

나는 당신이되어야한다고 생각합니다. 우리 모두는 Psychobabble이 다양한 심리적 용어를 혼합하고 종종 이해할 수 없거나 완전히 무의미한 모듬 채터로 구성되어 있다는 것을 알고 있습니다. 당신이 fo를 뿌리기 위해해야 할 일

이번 주 발표 된 새로운 연구에 따르면 2022 년에 제조 된 플라스틱의 9.5%만이 재활용 재료로 만들어졌습니다. 한편, 플라스틱은 계속해서 매립지와 생태계에 전 세계에 쌓이고 있습니다. 그러나 도움이 진행 중입니다. 엥인 팀

최근 Enterprise Analytics 플랫폼 Alteryx의 CEO 인 Andy MacMillan과의 대화는 AI 혁명 에서이 비판적이면서도 저평가 된 역할을 강조했습니다. MacMillan에서 설명했듯이 원시 비즈니스 데이터와 AI-Ready Informat의 격차


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

WebStorm Mac 버전
유용한 JavaScript 개발 도구

맨티스BT
Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

SublimeText3 Linux 새 버전
SublimeText3 Linux 최신 버전

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기
