微软推出 '从错误中学习” 模型训练法，号称可'模仿人类学习过程，改善 AI 推理能力”-人工智能-PHP中文网

首页

科技周边

人工智能

微软推出 '从错误中学习” 模型训练法，号称可'模仿人类学习过程，改善 AI 推理能力”

王林

Nov 07, 2023 pm 05:13 PM

gpt-4大语言模型

微软亚洲研究院联合北京大学、西安交通大学等高校，最近提出了一种名为“从错误中学习（LeMA）”的人工智能训练方法。该方法声称能够通过模仿人类学习的过程，来提升人工智能的推理能力

微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力”

当下 OpenAI GPT-4 和谷歌 aLM-2 等大语言模型在自然语言处理（NLP）任务，及思维链（chain-of-thought，CoT）推理的数学难题任务中都有不错的表现。

但例如 LLaMA-2 及 Baichuan-2 等开源大模型，在处理相关问题时则有待加强。为了提升开源这些大语言模型的思维链推理能力，研究团队提出了 LeMA 方法。这种方法主要是模仿人类的学习过程，通过“从错误中学习”，以改进模型的推理能力。

微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力”

▲ 图源相关论文

本站发现，研究人员的方法是使用一对包含“错误解答”与“修正后正确答案”的数据来微调相关模型。为取得相关数据，研究人员收集了 5 个不同大语言模型（包括 LLaMA 及 GPT 系列）的错误答案和推理过程，再以 GPT-4 作为“订正者”，提供修正后的正确答案。

据悉，修正后的正确答案中包含三类信息，分别是原推理过程中错误片段、原推理过程出错的原因、以及如何修正原方法以获得正确答案。

研究人员使用GSM8K和MATH测试了LeMa训练法对5个开源大模型的效果。结果显示，在改进后的LLaMA-2-70B模型中，GSM8K的准确率分别为83.5%和81.4%，而MATH的准确率分别为25.0%和23.6%

目前研究人员已将 LeMA 的相关资料公开在 GitHub 上，感兴趣的小伙伴们可以点此跳转。

以上是微软推出 '从错误中学习” 模型训练法，号称可'模仿人类学习过程，改善 AI 推理能力”的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：51CTO.COM。如有侵权，请联系admin@php.cn删除

及时工程中的数值推理链是什么？Apr 17, 2025 am 10:08 AM

介绍及时工程在人工智能和自然语言处理的快速发展的领域至关重要。在其技术中，数值推理链（CONR）是增强AI的高效方法

Kaggle Grandmasters使用的顶级Python图书馆Apr 17, 2025 am 10:03 AM

解锁Kaggle Grandmasters的秘密：顶级Python图书馆揭示了 Kaggle是数据科学竞赛的主要平台，拥有精选的精英表演者：Kaggle Grandmasters。这些人一贯提供Innova

AI PC会改变您的工作场所的10种方法-Analytics VidhyaApr 17, 2025 am 09:59 AM

工作的未来：AI PC将如何彻底改变工作场所人工智能（AI）集成到个人计算机（AI PC）中代表了工作场所技术的重大飞跃。 AI PC，定义为AI的融合

如何在Excel中冷冻窗格？Apr 17, 2025 am 09:56 AM

Excel冻结窗格功能详解：高效处理大型数据集 Microsoft Excel是组织和分析数据的优秀工具之一，而“冻结窗格”功能更是其一大亮点。此功能允许您固定特定行或列，使其在浏览其余电子表格时保持可见，从而简化数据监控和比较。本文将深入探讨Excel冻结窗格功能的使用方法，并提供一些实用技巧和示例。功能概述 Excel的冻结窗格功能可在滚动浏览大型数据集时，保持特定行或列可见，方便数据监控和比较。提升导航效率，保持标题可见，简化大型电子表格中的数据比较。提供通过“视图”选项卡和“冻