Microsoft는 '인간의 학습 과정을 모방하고 AI 추론 능력을 향상시킨다'고 주장하면서 '실수로부터 배우기' 모델 훈련 방법을 출시했습니다.-일체 포함-php.cn

집

기술 주변기기

일체 포함

Microsoft는 '인간의 학습 과정을 모방하고 AI 추론 능력을 향상시킨다'고 주장하면서 '실수로부터 배우기' 모델 훈련 방법을 출시했습니다.

王林

Nov 07, 2023 pm 05:13 PM

gpt-4대규모 언어 모델

Microsoft Research Asia는 최근 북경대학교, 시안교통대학교 및 기타 대학과 협력하여 "LeMA(Learning from Mistakes)"라는 인공지능 훈련 방법을 제안했습니다. 이 방법은 인간의 학습 과정을 모방해 인공지능의 추론 능력을 향상시킬 수 있다고 주장한다. 현재 자연어 처리(NLP) 작업에는 OpenAI GPT-4, 구글 aLM-2 등 대형 언어 모델이 사용되고 있다. 체인(CoT) 추론 수학적 퍼즐 작업의 성능이 좋습니다.

단, 관련 문제를 다룰 때 LLaMA-2, Baichuan-2 등 오픈소스 대형 모델의 강화가 필요합니다. 이러한 대규모 오픈소스 언어 모델의 사고 연쇄 추론 능력을 향상시키기 위해 微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力” 연구팀은 LeMA 방법을 제안했습니다. 이 방법은 주로 인간의 학습 과정을 모방하고 "실수로부터 학습"

하여 모델의 추론 능력을 향상시킵니다.

▲ 사진 출처 관련 논문

이 사이트에서 微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力” 연구원의 방법은 '오답'과 '수정 정답'이 포함된 한 쌍의 데이터를 이용하여 해당 모델을 미세 조정하는 것으로 확인되었습니다.

. 연구진은 관련 데이터를 얻기 위해 5가지 대형 언어 모델(LLaMA, GPT 시리즈 포함)의 오답과 추론 과정을 수집한 뒤 GPT-4를 '수정자'로 활용해 정답을 제공했다.

수정된 정답에는 원래 추론 과정의 잘못된 부분, 원래 추론 과정의 오류 이유, 정답을 얻기 위해 원래 방법을 수정하는 방법 등 세 가지 유형의 정보가 포함되어 있는 것으로 알려졌습니다.

연구원들은 GSM8K와 MATH를 사용하여 5개의 오픈 소스 대형 모델에 대한 LeMa 훈련 방법의 효과를 테스트했습니다. 결과에 따르면 개선된 LLaMA-2-70B 모델에서 GSM8K의 정확도는 각각 83.5%와 81.4%인 반면, MATH의 정확도는 각각 25.0%와 23.6%입니다

현재 연구자들은 관련 정보를 수집했습니다 LeMA GitHub에 공개되어 있습니다. 관심 있는 친구는

여기를 클릭하여 점프

할 수 있습니다.

위 내용은 Microsoft는 '인간의 학습 과정을 모방하고 AI 추론 능력을 향상시킨다'고 주장하면서 '실수로부터 배우기' 모델 훈련 방법을 출시했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

Alteryx는 무엇입니까? | 분석 VidhyaApr 15, 2025 am 11:03 AM

Alteryx : 올인원 데이터 분석 솔루션 통계 데이터 만 단서로 복잡한 미스터리를 다루는 것을 상상해보십시오. 데이터 전문가는 매일 비슷한 도전에 직면합니다. Alteryx는 솔루션으로, 사용자가 데이터 복잡성을 정복 할 수 있도록 권한을 부여합니다.

라마 3.1 대 라마 3 : 어느 것이 더 낫습니까?Apr 15, 2025 am 10:53 AM

메타의 라마 3.1 70B 및 라마 3 70B : 상세한 비교 Meta는 최근 70b 매개 변수 모델을 포함하여 LLAMA 3.1을 더 크고 작은 변형과 함께 출시했습니다. 이 업그레이드는 불과 3 개월 전에 LLAMA 3 릴리스를 따릅니다. 라마 3.1

7 ai ppt 제조업체는 무료로 시작할 수 있습니다!Apr 15, 2025 am 10:51 AM

프리젠 테이션 파워 : 7 무료 AI 기반 PowerPoint 메이커 최종 1 년간의 학생이든, 뛰어난 캡 스톤 프로젝트를 제작하든 바쁜 전문 저글링 회의 및 프레젠테이션이든 첫 인상을주는 것이 가장 중요합니다.

Power Bi Semantic 모델은 무엇입니까?Apr 15, 2025 am 10:46 AM

소개 시나리오를 상상해보십시오. 귀하의 팀은 다양한 소스의 대규모 데이터 세트에 압도 당합니다. 의미있는 프레젠테이션을 위해이 정보를 통합, 정렬 및 분석하는 것은 어려운 일입니다. 이곳은 파워 바이 의미 론적 모델 (PBISM) EX

Llama Index 및 Monsterapi를 사용하여 AI 에이전트를 구축하는 방법Apr 15, 2025 am 10:44 AM

AI 에이전트 : Llamaindex와 Monsterapi에 의해 구동되는 AI의 미래 AI 에이전트는 우리가 기술과 어떻게 상호 작용하는지 혁명을 일으킬 준비가되어 있습니다. 이러한 자율 시스템은 인간 행동을 모방하고, 추론, 의사 결정이 필요한 작업을 수행하며,

인간의 개입없이 LLM을 훈련시키는 7 가지 방법Apr 15, 2025 am 10:38 AM

자율 AI 잠금 해제 : 7 자체 훈련 LLM을위한 7 가지 방법 AI 시스템이 복잡한 개념을 독립적으로 마스터하는 어린이들과 마찬가지로 AI 시스템이 인간의 개입없이 배우고 진화하는 미래를 상상해보십시오. 이것은 공상 과학이 아닙니다. 그것은 자기의 약속입니다

AI 및 NLG로 재무보고 혁신 - 분석 VidhyaApr 15, 2025 am 10:35 AM

AI 기반 재무보고 : 자연어 생성을 통한 통찰력 혁명 오늘날의 역동적 인 비즈니스 환경에서, 정확하고시기 적절한 재무 분석은 전략적 의사 결정에 가장 중요합니다. 전통적인 재무보고

이 Google Deepmind 로봇이 2028 년 올림픽에서 플레이할까요?Apr 15, 2025 am 10:16 AM

Google Deepmind의 탁구 로봇 : 스포츠 및 로봇 공학의 새로운 시대 파리 2024 올림픽은 끝났을 지 모르지만 Google Deepmind 덕분에 스포츠와 로봇 공학의 새로운 시대가 시작되었습니다. 그들의 획기적인 연구 ( "인간 수준의 경쟁 달성

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

VSCode Windows 64비트 다운로드

Microsoft에서 출시한 강력한 무료 IDE 편집기

에디트플러스 중국어 크랙 버전

작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

SublimeText3 Linux 새 버전

SublimeText3 Linux 최신 버전

드림위버 CS6

시각적 웹 개발 도구

DVWA

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는