微軟推出 '從錯誤中學習” 模型訓練法，號稱可'模仿人類學習過程，改善 AI 推理能力”

微軟推出 '從錯誤中學習” 模型訓練法，號稱可'模仿人類學習過程，改善 AI 推理能力”

Nov 07, 2023 pm 05:13 PM

gpt-4大語言模型

微軟亞洲研究院聯合北京大學、西安交通大學等大學，最近提出了一種名為「從錯誤中學習（LeMA）」的人工智慧訓練方法。此方法聲稱能夠透過模仿人類學習的過程，來提升人工智慧的推理能力

微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力”

#當下OpenAI GPT-4 和GoogleaLM-2 等大語言模型在自然語言處理（NLP）任務，及思考鏈（chain-of-thought，CoT）推理的數學難題任務中都有不錯的表現。

但例如 LLaMA-2 及 Baichuan-2 等開源大模型，在處理相關問題時則有待加強。為了提升開源這些大語言模型的思考鏈推理能力，研究團隊提出了 LeMA 方法。這種方法主要是模仿人類的學習過程，透過“從錯誤中學習”，以改進模型的推理能力。

微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力”

▲ 圖源相關論文

本站發現，研究人員的方法是使用一對包含「錯誤解答」與「修正後正確答案」的數據來微調相關模型。為取得相關數據，研究人員收集了 5 個不同大語言模型（包括 LLaMA 及 GPT 系列）的錯誤答案和推理過程，再以 GPT-4 作為“訂正者”，提供修正後的正確答案。

據悉，修正後的正確答案包含三類訊息，分別是原推理過程中錯誤片段、原推理過程出錯的原因、以及如何修正原方法以獲得正確答案。

研究人員使用GSM8K和MATH測試了LeMa訓練法對5個開源大模型的效果。結果顯示，在改進後的LLaMA-2-70B模型中，GSM8K的準確率分別為83.5%和81.4%，而MATH的準確率分別為25.0%和23.6%

目前研究人員已將LeMA 的相關資料公開在GitHub 上，有興趣的朋友可以點此跳轉。

以上是微軟推出 '從錯誤中學習” 模型訓練法，號稱可'模仿人類學習過程，改善 AI 推理能力”的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

外推指南

外推指南Apr 15, 2025 am 11:38 AM

介紹假設有一個農民每天在幾週內觀察農作物的進展。他研究了增長率，並開始思考他的植物在幾週內可以生長的高度。從Th

軟AI的興起及其對當今企業的意義

軟AI的興起及其對當今企業的意義Apr 15, 2025 am 11:36 AM

軟AI（被定義為AI系統，旨在使用近似推理，模式識別和靈活的決策執行特定的狹窄任務 - 試圖通過擁抱歧義來模仿類似人類的思維。但是這對業務意味著什麼

為AI前沿的不斷發展的安全框架

為AI前沿的不斷發展的安全框架Apr 15, 2025 am 11:34 AM

答案很明確 - 只是雲計算需要向雲本地安全工具轉變，AI需要專門為AI獨特需求而設計的新型安全解決方案。雲計算和安全課程的興起在

生成AI的3種方法放大了企業家：當心平均值！

生成AI的3種方法放大了企業家：當心平均值！Apr 15, 2025 am 11:33 AM

企業家，並使用AI和Generative AI來改善其業務。同時，重要的是要記住生成的AI，就像所有技術一樣，都是一個放大器 - 使得偉大和平庸，更糟。嚴格的2024研究O

Andrew Ng的新簡短課程

Andrew Ng的新簡短課程Apr 15, 2025 am 11:32 AM

解鎖嵌入模型的力量：深入研究安德魯·NG的新課程想像一個未來，機器可以完全準確地理解和回答您的問題。這不是科幻小說；多虧了AI的進步，它已成為R

大語言模型（LLM）中的幻覺是不可避免的嗎？

大語言模型（LLM）中的幻覺是不可避免的嗎？Apr 15, 2025 am 11:31 AM

大型語言模型（LLM）和不可避免的幻覺問題您可能使用了諸如Chatgpt，Claude和Gemini之類的AI模型。這些都是大型語言模型（LLM）的示例，在大規模文本數據集上訓練的功能強大的AI系統

60％的問題 - AI搜索如何消耗您的流量

60％的問題 - AI搜索如何消耗您的流量Apr 15, 2025 am 11:28 AM

最近的研究表明，根據行業和搜索類型，AI概述可能導致有機交通下降15-64％。這種根本性的變化導致營銷人員重新考慮其在數字可見性方面的整個策略。新的

麻省理工學院媒體實驗室將人類蓬勃發展成為AI R＆D的核心

麻省理工學院媒體實驗室將人類蓬勃發展成為AI R＆D的核心Apr 15, 2025 am 11:26 AM

埃隆大學（Elon University）想像的數字未來中心的最新報告對近300名全球技術專家進行了調查。由此產生的報告“ 2035年成為人類”，得出的結論是，大多數人擔心AI系統加深的採用

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼（黃色晶體）

4 週前By尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.最佳圖形設置

4 週前By尊渡假赌尊渡假赌尊渡假赌

刺客信條陰影：貝殼謎語解決方案

2 週前ByDDD

R.E.P.O.如果您聽不到任何人，如何修復音頻

4 週前By尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.聊天命令以及如何使用它們

4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

mPDF

mPDF

mPDF是一個PHP庫，可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件，並處理不同的語言。與原始腳本如HTML2FPDF相比，它的速度較慢，並且在使用Unicode字體時產生的檔案較大，但支援CSS樣式等，並進行了大量增強。支援幾乎所有語言，包括RTL（阿拉伯語和希伯來語）和CJK（中日韓）。支援嵌套的區塊級元素（如P、DIV），

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

熱門話題

gmail信箱登陸入口在哪裡

7520

15

1378

52

steam的賬戶名稱是什麼格式

81

11

win11激活密鑰永久

54

19

NYT連接提示和答案

21

68