찾다
기술 주변기기일체 포함약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

내가 깨어났을 때, 머신러닝 커뮤니티는 충격에 빠졌습니다.

최신 연구에 따르면 GPT-3에게 "단계적으로 생각해보자"라고 말하는 것만으로도 이전에 답할 수 없었던 질문에 올바르게 답할 수 있다는 사실이 밝혀졌습니다.

예를 들면 다음과 같습니다.

공 16개 중 절반은 골프공이고, 이 골프공 중 절반은 파란색입니다. 파란색 골프공은 모두 몇 개인가요?

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

(질문은 어렵지 않습니다. , 하지만 이는 제로샷 학습이므로 AI 훈련 단계에서 유사한 문제가 본 적이 없다는 의미입니다. )

GPT-3에게 "답이 무엇입니까"라고 직접 쓰라고 요청하면 이렇게 됩니다. 틀린 답을 주다: 8.

그러나 단계별로 생각하게 하는 "주문"을 추가한 후 GPT-3는 먼저 생각의 단계를 출력하고 마지막으로 정답인 4를 제공합니다!

그리고 이것은 우연이 아닙니다. 연구 팀은 논문에서 완전히 검증되었다고 말했습니다.

위의 질문은 특히 언어 모델의 수학적 문제 해결 능력을 테스트하는 클래식 MutiArith 데이터 세트에서 나온 것입니다. GPT-3은 원래 제로 샘플 시나리오에서 정확도가 17%에 불과했습니다.

이 문서에는 가장 효과적인 프롬프트 단어 9개가 요약되어 있습니다. 그 중 GPT-3가 단계별로 생각하도록 하는 데 사용되는 처음 6개는 정확도를 70% 이상 높였습니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

가장 간단한 문장인 "생각해보자"도 57.5%까지 올라갈 수 있습니다.

유치원 아줌마가 아이를 달래는 느낌...

이 기술은 GPT-3에 마법적인 수정이 필요하지 않은 것 같습니다. 누군가 OpenAI 공식 데모에서 성공적으로 재현했으며 심지어 중국어로 변경하기도 했습니다.

영어 질문에 대한 중국어 힌트, GPT-3는 올바른 중국어 답변을 제공합니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

이 논문을 소셜 네트워크에 처음 전달한 Google 연구원은 필요한 모든 것이 새로 추가되었다고 말했습니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

이걸 보고 각계각층의 덩치 큰 놈들이 엉뚱한 생각을 갖고 놀리기 시작했습니다.

AI에게 "할 수 있다, 나는 당신을 믿는다"라고 격려하면 어떻게 될까요?

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

AI를 위협하면서 "시간이 얼마 남지 않았다"라던가 "시간이 얼마 남지 않았다"고 하면 어떻게 될까요? 머리에 총을 박아라"?

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

AI에게 "조심히 운전해"라고 말하는 것이 자율주행의 해결책이 될까요?

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

일부에서는 이것이 SF의 줄거리와 거의 같다고 제안하기도 했습니다. 이야기 "은하수를 여행하는 히치하이커를 위한 안내서" 일반 인공지능을 달성하는 열쇠는 그것을 올바르게 수행하는 방법을 아는 것입니다. AI에게 질문하세요.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

이 마법 같은 현상은 어떻게 진행되고 있는 걸까요?

언어 대형 모델은 제로 샘플 추론기입니다

이 현상의 발견은 제로 샘플을 탐구하는 Google Brain과 도쿄 대학의 공동 연구에서 이루어졌습니다. -현장에서 대규모 언어 모델 성능의 샘플 역할.

논문 제목 "Language Model Is a Zero-Sample Reasoner"는 GPT-3의 "Language Model Is a Few-Sample Learner"에 대한 찬사이기도 합니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

사용된 방법은 올해 1월 구글 브레인 팀이 제안한 Chain of Thought Prompting(CoT)에 속합니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

초기 CoT는 퓨샷 학습에 적용되었으며, 질문을 하면서 AI가 가이드할 수 있도록 단계별 답변 예시를 제공했습니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

이 최신 연구에서는 제로 샘플 CoT를 제안합니다. 주요 변경 사항은 예제 부분을 단순화하는 것입니다.

  • 첫 번째 단계는 질문 줄기를 "Q: xxx, A: xxx" 형식으로 다시 작성하는 것입니다. 여기서 트리거 문장 A는 언어 모델의 사고 과정을 추출할 수 있습니다.
  • 두 번째 단계는 추가 실험으로, "답은..."이라는 프롬프트를 추가하여 언어 모델이 최종 답을 제공하도록 유도합니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

이 작업의 가장 큰 장점은 보편적이며 다양한 문제 유형에 대한 전용 예제를 제공할 필요가 없다는 것입니다.

이 논문은 12가지 테스트를 포함하여 다양한 문제에 대해 충분한 실험을 수행했습니다.

  • 6개의 수학 문제 테스트 세트, SingleEq, AddSub, SVAMP 및 더 까다로운 MultiArith, AQUA-RAT, GSM8K.
  • 2개의 상식 추론 테스트 세트, CommonsenseQA 및 StrategyQA.
  • 2개의 기호 추론 테스트 세트, 마지막 문자 연결 및 동전 뒤집기.
  • 그리고 BIG-bench의 날짜 이해 문제와 순서가 잘못된 물체를 추적하는 작업입니다.

일반 제로샷 학습과 비교하여 제로샷 CoT는 10가지에서 더 나은 결과를 얻습니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

Δ오른쪽 값은 추가 실험 결과입니다

더 어려운 MultiArith 및 GSM8K 수학 테스트에서는 최신 버전의 GPT-3 Text-davinci-002( 175B).

최고의 결과를 얻기 위해 8번의 시도를 한다면 정확도는 93%까지 더욱 향상될 수 있습니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

오류 결과 분석에서도 연구원들은 많은 질문에서 AI의 추론 과정이 실제로는 정확하지만 답변이 고유한 답변으로 수렴되지 않는 경우 여러 대안이 제공된다는 사실도 발견했습니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

논문 끝에서 연구팀은 이 연구가 제로 샘플 CoT의 기준이 될 수 있을 뿐만 아니라, 미세 조정된 데이터 세트를 구축하기 전에 학계가 이를 깨닫고 소수 샘플 프롬프트 템플릿, 대규모 언어 모델 중요성의 제로 샘플 기능을 완전히 탐색합니다.

연구팀은 도쿄대학교 마쓰오 연구소 출신입니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

마츠오 유타카 교수는 소프트뱅크 이사회 최초의 인공지능 전문가이기도 하다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

팀원 중 Gu Shixiang 객원 교수는 Google Brain 팀 출신입니다. Gu Shixiang은 3대 거물 중 하나인 Hinton 밑에서 학사 학위를 취득하고, 케임브리지 대학교에서 박사 학위를 취득했습니다.

약간의 "마법"을 추가하는 것이 AI 분야에서 새로운 트렌드가 되었습니다

제로 샘플 CoT가 작동하는 이유는 아직 탐구되지 않았습니다.

그러나 누군가 이 방법이 GPT-3(text-davinci-002)에만 효과적인 것 같다고 실험적으로 결론을 내렸습니다. 그는 버전 001을 시도했지만 거의 효과를 발견하지 못했습니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

그는 자신이 한 일의 예를 나열했습니다.

질문: 머신앤러닝의 각 단어의 마지막 글자를 연결해주세요.

메시지가 표시될 때 GPT-3에서 제공하는 대답은 두 단어의 모든 문자를 연결하는 것입니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

이에 대해 저자 중 한 명인 Gu Shixiang은 실제로 "주문"은 GPT-3 초기 버전과 개선 버전 모두에 영향을 미치며 이러한 결과는 GPT-3에도 반영된다고 답했습니다. 종이.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

어떤 사람들은 딥러닝이 "마법의 주문"을 찾는 게임이 되었는지 의문을 제기하기도 했습니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

동시에 민원팀에서 마커스를 다시 만났습니다.

그는 또한 GPT-3가 "주문"의 축복을 받았음에도 불구하고 샐리의 소가 다시 살아날지 알 수 없었던 실패 사례를 열거했습니다...

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

그러나 AI에 약간의 마법을 추가하고 즉각적인 개선을 달성하는 이와 같은 사례가 드물지 않다는 점은 주목할 가치가 있습니다.

일부 네티즌들은 GPT-3를 사용할 때 중간 명령어 몇 개만 추가하면 오히려 더 만족스러운 결과를 얻을 수 있다고 공유하기도 했습니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

이전에 Google과 MIT의 연구원들은 훈련 언어 모델이 디버깅할 때 프로그래머와 같은 "중단점"을 갖는 한 모델의 코드를 읽고 수행하는 능력을 변경할 필요가 없다는 것을 발견했습니다. 연산이 즉시 향상됩니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

원칙도 매우 간단합니다. 즉, 계산 단계가 많은 프로그램에서 모델이 각 단계를 텍스트로 인코딩하고 이를 "스티커 메모"라는 임시 레지스터에 기록하도록 합니다.

결과적으로 모델의 계산 과정이 더욱 명확해지고 질서정연해지며 성능도 자연스럽게 크게 향상됩니다.

이 실험에서 테스트에 사용된 Instruct GPT-3도 있는데, 이것도 대표적인 예입니다.

GPT-3가 인간의 피드백을 통해 학습하도록 하는 것만으로도 잘못된 질문에 답하는 상황을 크게 개선할 수 있습니다.

구체적으로 말하면 먼저 인간의 시연 답변을 사용하여 모델을 미세 조정한 다음 특정 질문에 대한 여러 가지 출력 데이터 세트를 수집하고 여러 답변 세트를 수동으로 정렬하고 이 데이터 세트에 대한 보상 모델을 교육합니다. .

마지막으로 RM을 보상 함수로 사용하는 PPO(Proximal Policy Optimization) 알고리즘은 강화 학습 방법으로 보상을 극대화하기 위해 GPT-3 정책을 미세 조정합니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

이 주제를 촉발한 Twitter 블로거 Aran을 포함해, "Unreal Engine"을 추가하면 AI 생성 이미지의 품질이 치솟을 수 있다는 사실을 처음 발견한 사람이 바로 이 사람이었습니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

전 Google 로봇 사장인 Eric Zhang도 강화 학습이 비슷한 사고 방식을 사용하여 컴퓨팅 효율성을 향상시킬 수 있다는 사실을 이전에 발견했습니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

AI에서 사용하는 이런 기술은 보통 뇌를 사용할 때 사용하는 기술이 아니라고 하는 분들도 계시죠?

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

사실 벤지오는 이전부터 AI의 운영 모델을 제안하기 위해 뇌과학에서 출발했습니다. .인간의 두뇌 모드와 같아야합니다.

인간의 인지 작업은 시스템 1 인지와 시스템 2 인지로 나눌 수 있습니다.

시스템 1 인지 작업은 무의식적으로 완료되는 작업을 말합니다. 예를 들어, 당신은 손에 쥐고 있는 것이 무엇인지 즉시 확인할 수 있지만, 이 과정을 어떻게 완료했는지 다른 사람에게 설명할 수는 없습니다.

시스템 2 인지 작업은 인간의 두뇌가 특정 단계에 따라 완료해야 하는 인지를 말합니다. 예를 들어 덧셈과 뺄셈 계산을 하면 최종 답에 어떻게 도달했는지 명확하게 설명할 수 있습니다.

이번에 추가된 "주문"은 AI가 한 단계 더 나아가 단계적으로 생각하는 법을 배울 수 있도록 하는 것입니다.

이러한 추세에 맞서 일부 학자들은 "힌트 엔지니어링이 피처 엔지니어링을 대체하고 있다"고 믿고 있습니다.

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

그러면 "큐 워드 헌터"가 차세대 NLP 연구자들의 별명이 될까요?

약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다

논문 주소:​​https://www.php.cn/link/cc9109aa1f048c36d154d902612982e2​

참조 링크:

[1]https://twitter.com/arankomatsuzaki/status/1529278580189908993

[2]https://evjang.com/2021/10/23/generalization.html

위 내용은 약간의 설득으로 GPT-3 정확도를 61%까지 높일 수 있습니다! 구글과 도쿄대학의 연구는 충격적이다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
Microsoft Work Trend Index 2025는 작업장 용량 변형을 보여줍니다Microsoft Work Trend Index 2025는 작업장 용량 변형을 보여줍니다Apr 24, 2025 am 11:19 AM

AI의 빠른 통합으로 악화 된 직장의 급성장 용량 위기는 점진적인 조정을 넘어 전략적 변화를 요구합니다. 이것은 WTI의 발견에 의해 강조됩니다. 직원의 68%가 작업량으로 어려움을 겪고 BUR로 이어

AI가 이해할 수 있습니까? 중국의 객실 논쟁은 아니오라고 말하지만 맞습니까?AI가 이해할 수 있습니까? 중국의 객실 논쟁은 아니오라고 말하지만 맞습니까?Apr 24, 2025 am 11:18 AM

John Searle의 중국 방 주장 : AI 이해에 대한 도전 Searle의 사고 실험은 인공 지능이 진정으로 언어를 이해할 수 있는지 또는 진정한 의식을 가질 수 있는지 직접 의문을 제기합니다. Chines를 무시하는 사람을 상상해보십시오

중국의 '스마트'AI 조수는 Microsoft Recall의 개인 정보 결함을 반향합니다중국의 '스마트'AI 조수는 Microsoft Recall의 개인 정보 결함을 반향합니다Apr 24, 2025 am 11:17 AM

중국의 기술 거대 기업은 서부에 비해 AI 개발 과정에서 다른 과정을 차트하고 있습니다. 기술 벤치 마크 및 API 통합에만 초점을 맞추는 대신 "스크린 인식"AI 비서 우선 순위를 정합니다.

Docker는 AI 모델 및 MCP 도구에 친숙한 컨테이너 워크 플로를 제공합니다.Docker는 AI 모델 및 MCP 도구에 친숙한 컨테이너 워크 플로를 제공합니다.Apr 24, 2025 am 11:16 AM

MCP : AI 시스템이 외부 도구에 액세스 할 수 있도록 권한을 부여합니다 MCP (Model Context Protocol)를 사용하면 AI 애플리케이션이 표준화 된 인터페이스를 통해 외부 도구 및 데이터 소스와 상호 작용할 수 있습니다. MCP를 통해 MCP는 인류에 의해 개발되고 주요 AI 제공 업체가 지원하는 언어 모델 및 에이전트가 사용 가능한 도구를 발견하고 적절한 매개 변수로 전화 할 수 있습니다. 그러나 환경 충돌, 보안 취약점 및 일관되지 않은 교차 ​​플랫폼 동작을 포함하여 MCP 서버 구현에는 몇 가지 과제가 있습니다. Forbes 기사 "Anthropic의 모델 컨텍스트 프로토콜은 AI 에이전트 개발의 큰 단계입니다."저자 : Janakiram MSVDocker는 컨테이너화를 통해 이러한 문제를 해결합니다. Docker Hub Infrastructure를 구축했습니다

6 억 달러 규모의 스타트 업을 구축하기 위해 6 개의 AI Street-Smart 전략 사용6 억 달러 규모의 스타트 업을 구축하기 위해 6 개의 AI Street-Smart 전략 사용Apr 24, 2025 am 11:15 AM

최첨단 기술을 활용하고 비즈니스 통제력을 발휘하여 통제력을 유지하면서 수익성이 높고 확장 가능한 회사를 창출하는 비전 기업가가 사용하는 6 가지 전략. 이 안내서는

Google 사진 업데이트 모든 사진에 대한 멋진 Ultra HDR 잠금 해제Google 사진 업데이트 모든 사진에 대한 멋진 Ultra HDR 잠금 해제Apr 24, 2025 am 11:14 AM

Google 사진의 새로운 Ultra HDR 도구 : 이미지 향상을위한 게임 체인저 Google Photos는 강력한 Ultra HDR 변환 도구를 도입하여 표준 사진을 활기차고 높은 동기 범위 이미지로 변환했습니다. 이 향상은 사진가 a

Descope는 AI 에이전트 통합을위한 인증 프레임 워크를 구축합니다Descope는 AI 에이전트 통합을위한 인증 프레임 워크를 구축합니다Apr 24, 2025 am 11:13 AM

기술 아키텍처는 새로운 인증 문제를 해결합니다 에이전트 Identity Hub는 문제를 해결합니다. 많은 조직이 AI 에이전트 구현을 시작한 후에 만 ​​기존 인증 방법이 기계 용으로 설계되지 않았다는 것을 발견 한 후에 만 ​​발견합니다.

Google Cloud 다음 2025 및 현대 작업의 연결된 미래Google Cloud 다음 2025 및 현대 작업의 연결된 미래Apr 24, 2025 am 11:12 AM

(참고 : Google은 회사 인 Moor Insights & Strategy의 자문 고객입니다.) AI : 실험에서 Enterprise Foundation까지 Google Cloud Next 2025는 실험 기능에서 엔터프라이즈 기술의 핵심 구성 요소까지 AI의 진화를 보여주었습니다.

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

mPDF

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

SublimeText3 Linux 새 버전

SublimeText3 Linux 새 버전

SublimeText3 Linux 최신 버전

에디트플러스 중국어 크랙 버전

에디트플러스 중국어 크랙 버전

작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음