搜索
首页科技周边人工智能Databricks DBRX教程:逐步指南

Databricks 启动了DBRX,这是一种开创性的开源大型语言模型(LLM),建立在精致的Experts(MOE)体系结构上。 与依赖单个神经网络的传统LLM不同,DBRX采用多个专业的“专家”网络,每个网络都针对特定的任务和数据类型进行了优化。与GPT-3.5和Llama 2相比,这种创新的方法可以提高性能和效率。DBRX在语言理解基准方面的得分为73.7%,超过了Llama 2的69.8%。本文深入研究了DBRX的功能,体系结构和用法。

>

理解数据链球dbrx

dbrx利用了基于变压器的纯解码体架构,该体系结构使用下一步的预测进行了训练。它的核心创新在于其精细的Moe建筑。 这些“专家”是专业的LLM代理,具有特定于领域的知识和高级推理功能。 DBRX利用16个较小的专家,为每个输入选择4个子集。这种细粒度的方法是专家组合的65倍,是Mixtral和Grok-1等模型,可显着提高模型质量。 DBRX的关键功能包括:

参数大小:
    总共1320亿个参数,任何给定输入的360亿个活动。
  1. 培训数据:在精心策划的数据的12万亿代币上进行了预训练,至少提供了用于MPT模型的数据集的代币效率的两倍。 支持上下文长度为32,000个令牌。
  2. dbrx训练方法
  3. DBRX的培训涉及精心设计的课程和战略数据混合调整,以优化各种输入的性能。 该过程利用数据助剂的功能强大工具,包括Apache Spark,Databricks笔记本电脑和Unity目录。 预训练期间采用的关键技术包括旋转位置编码(绳索),封闭式线性单元(GLU),分组查询注意(GQA)和Tiktoken存储库中的GPT-4 Tokenizer。

>对竞争对手进行基准测试dbrx 与领先的开源LLM相比,Databricks强调了DBRX的卓越效率和性能:

Model Comparison General Knowledge Commonsense Reasoning Databricks Gauntlet Programming Reasoning Mathematical Reasoning
DBRX vs LLaMA2-70B 9.8% 3.1% 14% 37.9% 40.2%
DBRX vs Mixtral Instruct 2.3% 1.4% 6.1% 15.3% 5.8%
DBRX vs Grok-1 0.7% N/A N/A 6.9% 4%
DBRX vs Mixtral Base 1.8% 2.5% 10% 29.9% N/A

(在此处可视化其中一些结果的图。 Databricks DBRX Tutorial: A Step-by-Step Guide 利用dbrx:实用指南

> 在使用DBRX之前,请确保您的系统至少具有320GB的RAM。 请按照以下步骤:

安装:

>安装
    库:
  1. 访问令牌:transformers>获得带有读取权限的拥抱脸访问令牌。pip install "transformers>=4.40.0"
  2. >
  3. 模型加载:>使用以下代码(用令牌替换):>
  4. DBRX在各种任务中脱颖而出,包括文本完成,语言理解,查询优化,代码生成,说明,调试和脆弱性标识。> hf_YOUR_TOKEN(在此处将包括一个响应简单命令的图像显示dbrx。
>微调dbrx
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

tokenizer = AutoTokenizer.from_pretrained("databricks/dbrx-base", token="hf_YOUR_TOKEN")
model = AutoModelForCausalLM.from_pretrained("databricks/dbrx-base", device_map="auto", torch_dtype=torch.bfloat16, token="hf_YOUR_TOKEN")

input_text = "Databricks was founded in "
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")

outputs = model.generate(**input_ids, max_new_tokens=100)
print(tokenizer.decode(outputs[0]))

使用GitHub的开源LLM Foundry,可以进行微调DBRX。 培训示例应格式化为字典:

。 Foundry支持来自拥抱面线,本地数据集和StreamingDataSet(.MDS)格式的数据集进行微调。 每种方法的详细说明可在原始文章中找到。 (对于简洁而言,省略了有关用于微调的YAML配置文件的更多详细信息)。

Databricks DBRX Tutorial: A Step-by-Step Guide 结论

Databricks DBRX代表了LLM技术的重大进步,利用其创新的MOE架构来提高速度,成本效益和性能。 它的开源自然促进了进一步的发展和社区贡献。

以上是Databricks DBRX教程:逐步指南的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
为什么山姆·奥特曼(Sam Altman)和其他人现在将氛围用作AI最新进展的新规格为什么山姆·奥特曼(Sam Altman)和其他人现在将氛围用作AI最新进展的新规格May 06, 2025 am 11:12 AM

让我们讨论“共鸣”作为AI领域的评估度量的上升。该分析是我正在进行的《福布斯》列的一部分,探索了AI开发的复杂方面(请参见此处的链接)。 AI评估中的共鸣 传统

在Waymo工厂建造Robotaxi的未来在Waymo工厂建造Robotaxi的未来May 06, 2025 am 11:11 AM

Waymo的亚利桑那工厂:批量生产自动驾驶美洲虎及以后 Waymo位于亚利桑那州凤凰城附近,经营着最先进的设施,生产其自动jaguar i-pace电动SUV机队。 这个239,000平方英尺的工厂开业

在S&P Global的数据驱动转换内,AI处于核心在S&P Global的数据驱动转换内,AI处于核心May 06, 2025 am 11:10 AM

标准普尔全球首席数字解决方案官Jigar Kocherlakota讨论了公司的AI旅程,战略收购和未来的数字化转型。 变革性的领导角色和未来的准备团队 Kocherlakota的角色

超级应用的兴起:在数字生态系统中蓬勃发展的4个步骤超级应用的兴起:在数字生态系统中蓬勃发展的4个步骤May 06, 2025 am 11:09 AM

从应用到生态系统:导航数字景观 数字革命远远超出了社交媒体和AI。 我们正在见证“所有应用程序”的兴起 - 综合数字生态系统整合了生活的各个方面。 山姆A。

万事达卡和签证释放AI代理商为您购物万事达卡和签证释放AI代理商为您购物May 06, 2025 am 11:08 AM

万事达卡代理工资:AI驱动的付款革新商业 虽然Visa的AI驱动交易功能成为头条新闻,但万事达卡揭开了代理商的薪酬,是建立在代币化,信任和代理的基础上的更高级的AI本地支付系统

支持大胆:未来冒险的变革创新剧本支持大胆:未来冒险的变革创新剧本May 06, 2025 am 11:07 AM

Future Ventures Fund IV:一项耗资2亿美元的新技术押注 Future Ventures最近关闭了其超额认购的IV,总计2亿美元。 这项由史蒂夫·朱维森(Steve Jurvetson),玛丽娜·萨恩科(Maryanna Saenko)和尼科·恩里克斯(Nico Enriquez)管理的新基金代表

随着AI的使用飙升,公司从SEO转移到GEO随着AI的使用飙升,公司从SEO转移到GEOMay 05, 2025 am 11:09 AM

随着AI应用的爆炸式增长,企业正从传统的搜索引擎优化(SEO)转向生成式引擎优化(GEO)。 谷歌正引领这一转变。其“AI概述”功能已服务于超过十亿用户,在用户点击链接之前提供完整的答案。[^2] 其他参与者也在迅速崛起。ChatGPT、微软Copilot和Perplexity正在创造一种全新的“答案引擎”类别,完全绕过了传统的搜索结果。 如果您的企业没有出现在这些AI生成的答案中,潜在客户可能永远不会发现您——即使您在传统的搜索结果中排名靠前。 从SEO到GEO——这究竟意味着什么? 几十年来

大量赌注这些途径将推动当今的AI成为珍贵的AGI大量赌注这些途径将推动当今的AI成为珍贵的AGIMay 05, 2025 am 11:08 AM

让我们探索人工通用智能(AGI)的潜在途径。 该分析是我正在进行的《福布斯》列的AI进步的一部分,并深入研究了实现AGI和人工超智慧(ASI)的复杂性。 (请参阅相关艺术

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

功能强大的PHP集成开发环境