Databricks DBRX教程：逐步指南-人工智能-PHP中文网

首页

科技周边

人工智能

Databricks DBRX教程：逐步指南

Jennifer Aniston

Mar 07, 2025 am 09:46 AM

Databricks 启动了DBRX，这是一种开创性的开源大型语言模型（LLM），建立在精致的Experts（MOE）体系结构上。与依赖单个神经网络的传统LLM不同，DBRX采用多个专业的“专家”网络，每个网络都针对特定的任务和数据类型进行了优化。与GPT-3.5和Llama 2相比，这种创新的方法可以提高性能和效率。DBRX在语言理解基准方面的得分为73.7％，超过了Llama 2的69.8％。本文深入研究了DBRX的功能，体系结构和用法。

理解数据链球dbrx

dbrx利用了基于变压器的纯解码体架构，该体系结构使用下一步的预测进行了训练。它的核心创新在于其精细的Moe建筑。这些“专家”是专业的LLM代理，具有特定于领域的知识和高级推理功能。 DBRX利用16个较小的专家，为每个输入选择4个子集。这种细粒度的方法是专家组合的65倍，是Mixtral和Grok-1等模型，可显着提高模型质量。 DBRX的关键功能包括：

参数大小：

培训数据：在精心策划的数据的12万亿代币上进行了预训练，至少提供了用于MPT模型的数据集的代币效率的两倍。支持上下文长度为32,000个令牌。
dbrx训练方法

>对竞争对手进行基准测试dbrx 与领先的开源LLM相比，Databricks强调了DBRX的卓越效率和性能：

Model Comparison	General Knowledge	Commonsense Reasoning	Databricks Gauntlet	Programming Reasoning	Mathematical Reasoning
DBRX vs LLaMA2-70B	9.8%	3.1%	14%	37.9%	40.2%
DBRX vs Mixtral Instruct	2.3%	1.4%	6.1%	15.3%	5.8%
DBRX vs Grok-1	0.7%	N/A	N/A	6.9%	4%
DBRX vs Mixtral Base	1.8%	2.5%	10%	29.9%	N/A

（在此处可视化其中一些结果的图。 利用dbrx：实用指南

> 在使用DBRX之前，请确保您的系统至少具有320GB的RAM。请按照以下步骤：

安装：

>安装

访问令牌：transformers>获得带有读取权限的拥抱脸访问令牌。pip install "transformers>=4.40.0"

模型加载：>使用以下代码（用令牌替换）：>

DBRX在各种任务中脱颖而出，包括文本完成，语言理解，查询优化，代码生成，说明，调试和脆弱性标识。> hf_YOUR_TOKEN（在此处将包括一个响应简单命令的图像显示dbrx。

>微调dbrx

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

tokenizer = AutoTokenizer.from_pretrained("databricks/dbrx-base", token="hf_YOUR_TOKEN")
model = AutoModelForCausalLM.from_pretrained("databricks/dbrx-base", device_map="auto", torch_dtype=torch.bfloat16, token="hf_YOUR_TOKEN")

input_text = "Databricks was founded in "
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")

outputs = model.generate(**input_ids, max_new_tokens=100)
print(tokenizer.decode(outputs[0]))

使用GitHub的开源LLM Foundry，可以进行微调DBRX。培训示例应格式化为字典：

。 Foundry支持来自拥抱面线，本地数据集和StreamingDataSet（.MDS）格式的数据集进行微调。每种方法的详细说明可在原始文章中找到。（对于简洁而言，省略了有关用于微调的YAML配置文件的更多详细信息）。

结论

Databricks DBRX代表了LLM技术的重大进步，利用其创新的MOE架构来提高速度，成本效益和性能。它的开源自然促进了进一步的发展和社区贡献。

以上是Databricks DBRX教程：逐步指南的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

为什么山姆·奥特曼（Sam Altman）和其他人现在将氛围用作AI最新进展的新规格May 06, 2025 am 11:12 AM

让我们讨论“共鸣”作为AI领域的评估度量的上升。该分析是我正在进行的《福布斯》列的一部分，探索了AI开发的复杂方面（请参见此处的链接）。 AI评估中的共鸣传统

在Waymo工厂建造Robotaxi的未来May 06, 2025 am 11:11 AM

Waymo的亚利桑那工厂：批量生产自动驾驶美洲虎及以后 Waymo位于亚利桑那州凤凰城附近，经营着最先进的设施，生产其自动jaguar i-pace电动SUV机队。这个239,000平方英尺的工厂开业

在S＆P Global的数据驱动转换内，AI处于核心May 06, 2025 am 11:10 AM

标准普尔全球首席数字解决方案官Jigar Kocherlakota讨论了公司的AI旅程，战略收购和未来的数字化转型。变革性的领导角色和未来的准备团队 Kocherlakota的角色

超级应用的兴起：在数字生态系统中蓬勃发展的4个步骤May 06, 2025 am 11:09 AM

从应用到生态系统：导航数字景观数字革命远远超出了社交媒体和AI。我们正在见证“所有应用程序”的兴起 - 综合数字生态系统整合了生活的各个方面。山姆A。

万事达卡和签证释放AI代理商为您购物May 06, 2025 am 11:08 AM

万事达卡代理工资：AI驱动的付款革新商业虽然Visa的AI驱动交易功能成为头条新闻，但万事达卡揭开了代理商的薪酬，是建立在代币化，信任和代理的基础上的更高级的AI本地支付系统

支持大胆：未来冒险的变革创新剧本May 06, 2025 am 11:07 AM

Future Ventures Fund IV：一项耗资2亿美元的新技术押注 Future Ventures最近关闭了其超额认购的IV，总计2亿美元。这项由史蒂夫·朱维森（Steve Jurvetson），玛丽娜·萨恩科（Maryanna Saenko）和尼科·恩里克斯（Nico Enriquez）管理的新基金代表

随着AI的使用飙升，公司从SEO转移到GEOMay 05, 2025 am 11:09 AM

随着AI应用的爆炸式增长，企业正从传统的搜索引擎优化(SEO)转向生成式引擎优化(GEO)。谷歌正引领这一转变。其“AI概述”功能已服务于超过十亿用户，在用户点击链接之前提供完整的答案。[^2] 其他参与者也在迅速崛起。ChatGPT、微软Copilot和Perplexity正在创造一种全新的“答案引擎”类别，完全绕过了传统的搜索结果。如果您的企业没有出现在这些AI生成的答案中，潜在客户可能永远不会发现您——即使您在传统的搜索结果中排名靠前。从SEO到GEO——这究竟意味着什么？几十年来