搜索
首页科技周边人工智能可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

编辑 | 萝卜皮

在过去的几个世纪中,研究人员一直在寻找将不同领域知识联系起来的方法。随着人工智能的出现,我们现在有机会去探索跨领域(例如力学和生物学)或不同领域(例如失效力学和艺术)之间的关系

为了达到这个目标,麻省理工学院(MIT)原子与分子力学实验室(Laboratory for Atomistic and Molecular Mechanics,LAMM)的研究人员利用经过微调的大型语言模型(LLM)来获得多尺度材料失效的相关知识子集

这种方法的步骤是先使用通用的LLM从原始来源中提取问答对,然后对LLM进行微调。利用这个微调后的MechGPT LLM基础模型进行一系列计算实验,以探索其在知识检索、各种语言任务、假设生成以及跨不同领域连接知识方面的能力

尽管该模型具有一定的能力来回忆训练中的知识,但研究人员发现 LLM 对于通过本体知识图提取结构见解更加有意义。这些可解释的图形结构提供了解释性见解、新研究问题的框架以及知识的视觉表示,这些知识也可用于检索增强生成。

该研究以「MechGPT, a Language-Based Strategy for Mechanics and Materials Modeling That Connects Knowledge Across Scales, Disciplines and Modalities」为题,于 2023 年 10 月 19 日发布在《Applied Mechanics Reviews》。

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

对物理、生物和形而上学概念进行建模一直是许多学科研究人员关注的焦点。早期的科学家和工程师往往深深扎根于从科学到哲学、物理到数学以及艺术的多个领域(例如伽利略·伽利莱、列奥纳多·达·芬奇、约翰·沃尔夫冈·冯·歌德),但是随着科学的发展,专业化在如今已经占据主导地位。部分原因是跨领域积累了大量知识,这需要人类花大量的精力去研究实践。

现如今,大型语言模型(LLM)的出现对科学研究的范式提出了挑战。它不仅带来了基于人工智能/机器学习的新建模策略,还为跨领域连接知识、想法和概念提供了机会。这些模型可以补充传统的多尺度建模,用于分析和设计分层材料以及力学中的许多其他应用

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

图:工作流程示意图。(来源:论文)

在这里,LAMM 的研究人员以最近提出的 LLM 在力学和材料研究和开发中的用途为基础,并且基于 Llama-2 based OpenOrca-Platypus2-13B 的通用 LLM,开发了一个经过微调的 MechGPT 模型,该模型专注于模型材料失效、多尺度建模以及相关学科。

选择 OpenOrca-Platypus2-13B 模型的原因是因为它在推理、逻辑、数学/科学和其他学科等关键任务上表现出色,能够以适中的模型大小提供丰富的、可应用于多学科的知识和通用概念,并且具备高效的计算能力

LLM 在科学领域有着强大的应用。除了能够分析大量数据和复杂系统之外,在力学和材料科学领域,LLM 用于模拟和预测材料在不同条件下的行为,例如机械应力、温度和化学相互作用等。正如早期工作所示,通过在分子动力学模拟的大型数据集上训练 LLM,研究人员可以开发能够预测新情况下材料行为的模型,从而加速发现过程并减少实验测试的需要。

此类模型对于分析书籍和出版物等科学文本也非常有效,使研究人员能够从大量数据中快速提取关键信息和见解。这可以帮助科学家识别趋势、模式以及不同概念和想法之间的关系,并为进一步研究产生新的假设和想法。

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

请查看下图,这是用于构建MechGPT的自回归解码器transformer架构概述。 (来源:论文)

在这里,该团队将重点放在后者的开发上,并探索 MechGPT 的使用,这是基于 Transformer 的 LLM 系列中的一种生成人工智能工具,专门针对材料失效和相关的多尺度方法进行了训练,从而评估这些策略的潜力。

该研究提出的策略包括几个步骤。首先是蒸馏步骤,研究人员使用LLM从原始数据块中提取的文本(例如一个或多个PDF文件)生成问答对。接下来,在第二步中利用这些数据来微调模型。这项研究还专门训练了初始的MechGPT模型,在材料失效的原子建模领域展示了其在知识检索、通用语言任务和假设生成等方面的有用性

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

图:所使用的建模策略概述。(来源:论文)

这篇论文介绍了一个总体的建模策略,研究人员采用特定的语言建模策略来生成数据集,以从源中提取知识,并利用新颖的力学和材料数据集对模型进行训练。研究人员对MechGPT的三个版本进行了分析和讨论,这些版本的参数大小从130亿到700亿不等,上下文长度超过10,000个token

在对模型、提示以及训练方式进行一些一般性评论之后,研究人员应用该模型并在各种设置中测试其性能,包括使用 LLM 进行本体图生成和开发有关跨学科复杂主题的见解,以及代理建模,其中多个 LLM 以协作或对抗的方式交互,以产生对主题领域或问题回答的更深入的见解。

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

图:开发本体知识图表示,以在超音速断裂和蛋白质展开机制的背景下关联超弹性。(来源:论文)

同时,该团队进一步提供了不同抽象级别的语言模型和多粒子系统之间的概念比较,并解释了如何将新框架视为提取管理复杂系统的普遍关系的手段。

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

重写内容:上图展示了LLM和多粒子模拟之间的概念类比。(图源:论文)

总体而言,该研究提出的工作有助于开发更强大、更通用的人工智能模型,这些模型可以帮助推进科学研究并解决特定应用领域的复杂问题,从而可以深入评估模型的性能。与所有模型一样,它们必须经过仔细验证,它们的有用性存在于所提出的问题的背景、其优点和缺点以及帮助科学家推进科学和工程的更广泛的工具中。

而且,人工智能工具作为科学探究的工具,必须被视为理解、建模和设计我们周围世界的工具集合。随着人工智能工具的快速发展,它们在科学背景下的应用才刚刚开始带来新的机遇

论文链接:https://arxiv.org/ftp/arxiv/papers/2310/2310.10445.pdf

相关报道:https://twitter.com/llama_index/status/1723379654550245719

以上是可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:机器之心。如有侵权,请联系admin@php.cn删除
易于理解的解释如何使用ChatGpt提高库存管理效率!易于理解的解释如何使用ChatGpt提高库存管理效率!May 14, 2025 am 03:44 AM

即使对于中小型企业,易于实施!与Chatgpt和Excel的明智库存管理 库存管理是您业务的命脉。储存过多和库存的物品对现金流和客户满意度有严重影响。但是,目前的情况是,在成本方面引入全尺度库存管理系统很高。 您想关注的是Chatgpt和Excel的组合。在本文中,我们将逐步解释如何使用此简单方法简化库存管理。 自动化数据分析,需求预测和报告以显着提高运营效率等任务。而且,

易于理解的解释如何检查和切换chatgpt的版本!易于理解的解释如何检查和切换chatgpt的版本!May 14, 2025 am 03:43 AM

通过选择chatgpt版本明智地使用AI!对最新信息以及如何检查的详尽说明 Chatgpt是一种不断发展的AI工具,但其功能和性能因版本而异。在本文中,我们将以易于理解的方式解释每个版本的Chatgpt的功能,如何检查最新版本以及免费版本和付费版本之间的差异。选择最佳版本,并充分利用您的AI潜力。 单击此处以获取有关Openai最新AI代理OpenAi Deep Research⬇️的更多信息 [chatgpt] openai d

解释为什么您不能将信用卡与Chatgpt的付费计划一起使用以及如何处理的原因解释为什么您不能将信用卡与Chatgpt的付费计划一起使用以及如何处理的原因May 14, 2025 am 03:32 AM

ChatGPT付费订阅的信用卡支付故障排除指南 使用ChatGPT付费订阅时,信用卡支付可能会遇到问题。本文将探讨信用卡被拒的原因以及相应的解决方法,从用户自行解决的问题到需要联系信用卡公司的情况,提供详尽的指南,助您顺利使用ChatGPT付费订阅。 OpenAI发布的最新AI代理,“OpenAI Deep Research”详情请点击⬇️ 【ChatGPT】OpenAI Deep Research详解:使用方法及收费标准 目录 ChatGPT信用卡支付失败的原因 原因一:信用卡信息输入错误 原

易于理解的解释如何在Chatgpt中创建VBA宏!易于理解的解释如何在Chatgpt中创建VBA宏!May 14, 2025 am 02:40 AM

对于初学者和对业务自动化感兴趣的人,编写VBA脚本(Microsoft Office的扩展程序)可能会觉得很困难。但是,ChatGpt使简化和自动化业务流程变得容易。 本文以易于理解的方式解释了如何使用ChatGpt开发VBA脚本。我们将详细介绍特定的示例,包括从VBA的基础到使用ChatGpt集成,测试和调试的所有内容,以及要注意的好处和点。为了提高编程技能并提高业务效率,

我无法使用ChatGpt插件功能!解释在错误时该怎么做我无法使用ChatGpt插件功能!解释在错误时该怎么做May 14, 2025 am 01:56 AM

ChatGPT插件无法使用?这篇指南将帮助您解决问题!您是否遇到过ChatGPT插件无法使用或突然失效的情况?ChatGPT插件是提升用户体验的强大工具,但有时也会出现故障。本文将详细分析ChatGPT插件无法正常工作的原因,并提供相应的解决方法。从用户设置检查到服务器故障排查,我们涵盖了各种故障排除方案,助您高效利用插件完成日常任务。 OpenAI发布的最新AI代理——OpenAI Deep Research,详情请点击⬇️ [ChatGPT] OpenAI Deep Research详解:使

chatgpt是否不遵循字符计数规范?关于如何处理这个问题的详尽解释!chatgpt是否不遵循字符计数规范?关于如何处理这个问题的详尽解释!May 14, 2025 am 01:54 AM

在使用chatgpt编写句子时,有时您想指定字符数。但是,很难准确预测AI生成的句子的长度,并且匹配指定数量的字符并不容易。 在本文中,我们将解释如何创建一个句子,其中chatgpt中的字符数量。我们将介绍有效的及时写作,获取适合您目的的答案的技术,并教您处理角色限制的技巧。此外,我们将解释为什么Chatgpt不擅长指定角色的数量及其工作方式,以及要谨慎和对策的要点。 本文

关于Python切片操作的所有内容关于Python切片操作的所有内容May 14, 2025 am 01:48 AM

对于每个Python程序员,无论是在数据科学和机器学习的领域还是软件开发领域,Python切片操作都是最有效,最多功能和强大的操作之一。 Python切片语法

易于理解的解释如何使用Chatgpt创建报价!易于理解的解释如何使用Chatgpt创建报价!May 14, 2025 am 01:44 AM

AI技术的发展提高了业务效率。特别引起关注的是使用AI创建估计值。 Openai的AI助理Chatgpt有助于改善估计创建过程并提高准确性。 本文说明了如何使用chatgpt创建报价。我们将通过与Excel VBA的合作,系统开发项目的应用,AI实施的好处以及未来的前景来介绍效率提高。了解如何通过Chatgpt提高运营效率和生产力。 OP

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

WebStorm Mac版

WebStorm Mac版

好用的JavaScript开发工具

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具