cari
RumahPeranti teknologiAIDatabricks DBRX Tutorial: Panduan Langkah demi Langkah

Databricks Unveils DBRX: A High-Performance, Open-Source Large Language Model

Databricks telah melancarkan DBRX, sebuah model bahasa besar sumber terbuka (LLM) yang dibina di atas senibina campuran campuran-eksperas (MOE) yang canggih. Tidak seperti LLM tradisional yang bergantung kepada rangkaian saraf tunggal, DBRX menggunakan pelbagai rangkaian "pakar" khusus, masing -masing dioptimumkan untuk tugas dan jenis data tertentu. Pendekatan inovatif ini membawa kepada prestasi dan kecekapan yang lebih baik berbanding dengan model seperti GPT-3.5 dan Llama 2. DBRX mempunyai skor 73.7% dalam penanda aras pemahaman bahasa, melepasi Llama 2's 69.8%. This article delves into DBRX's capabilities, architecture, and usage.

Understanding Databricks DBRX

DBRX leverages a transformer-based decoder-only architecture, trained using next-token prediction. Its core innovation lies in its fine-grained MoE architecture. These "experts" are specialized LLM agents, enhanced with domain-specific knowledge and advanced reasoning capabilities. DBRX utilizes 16 smaller experts, selecting a subset of 4 for each input. Pendekatan halus ini, dengan 65 kali lebih banyak kombinasi pakar daripada model seperti Mixtral dan Grok-1, dengan ketara meningkatkan kualiti model.

Key features of DBRX include:

  1. Parameter Size: A total of 132 billion parameters, with 36 billion active for any given input.
  2. Data Latihan: Pra-terlatih pada token 12 trilion besar-besaran data yang dikendalikan dengan teliti, yang menawarkan sekurang-kurangnya dua kali ganda keberkesanan token-untuk-token yang digunakan untuk model MPT. A context length of 32,000 tokens is supported.

DBRX Training Methodology

DBRX's training involved a carefully designed curriculum and strategic data mix adjustments to optimize performance across diverse inputs. The process leveraged Databricks' powerful tools, including Apache Spark, Databricks notebooks, and Unity Catalog. Teknologi utama yang digunakan semasa latihan pra-latihan termasuk pengekodan kedudukan berputar (tali), unit linear berpagar (GLU), dikumpulkan perhatian pertanyaan (GQA), dan tokenizer GPT-4 dari repositori tiktoken.

Benchmarking DBRX Against Competitors

Databricks highlights DBRX's superior efficiency and performance compared to leading open-source LLMs:

Model Comparison General Knowledge Commonsense Reasoning Databricks Gauntlet Programming Reasoning Mathematical Reasoning
DBRX vs LLaMA2-70B 9.8% 3.1% 14% 37.9% 40.2%
DBRX vs Mixtral Instruct 2.3% 1.4% 6.1% 15.3% 5.8%
DBRX vs Grok-1 0.7% N/A N/A 6.9% 4%
DBRX vs Mixtral Base 1.8% 2.5% 10% 29.9% N/A

(graf yang menggambarkan beberapa hasil ini akan dimasukkan di sini. URL imej: [] Databricks DBRX Tutorial: A Step-by-Step Guide )

Menggunakan DBRX: Panduan Praktikal

Sebelum menggunakan DBRX, pastikan sistem anda mempunyai sekurang -kurangnya 320GB RAM. Ikuti langkah -langkah ini:

  1. pemasangan: Pasang perpustakaan : transformers pip install "transformers>=4.40.0"
  2. Token akses: Dapatkan token akses muka yang memeluk dengan kebenaran baca.
  3. Model Loading: Gunakan kod berikut (ganti dengan token anda): hf_YOUR_TOKEN
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

tokenizer = AutoTokenizer.from_pretrained("databricks/dbrx-base", token="hf_YOUR_TOKEN")
model = AutoModelForCausalLM.from_pretrained("databricks/dbrx-base", device_map="auto", torch_dtype=torch.bfloat16, token="hf_YOUR_TOKEN")

input_text = "Databricks was founded in "
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")

outputs = model.generate(**input_ids, max_new_tokens=100)
print(tokenizer.decode(outputs[0]))
DBRX cemerlang dalam pelbagai tugas, termasuk penyelesaian teks, pemahaman bahasa, pengoptimuman pertanyaan, penjanaan kod, penjelasan, debugging, dan pengenalan kelemahan.

(imej yang mempamerkan DBRX bertindak balas terhadap perintah mudah akan dimasukkan di sini. URL Imej: [] Databricks DBRX Tutorial: A Step-by-Step Guide )

Fine-Tuning dbrx

Fine-penalaan DBRX mungkin menggunakan Foundry LLM sumber terbuka GitHub. Contoh latihan harus diformat sebagai kamus:

. Foundry menyokong penalaan halus dengan dataset dari hub muka yang memeluk, dataset tempatan, dan format streamingdataset (.mds). Arahan terperinci untuk setiap kaedah boleh didapati dalam artikel asal. (Butiran lanjut mengenai fail konfigurasi YAML untuk penalaan halus ditinggalkan untuk keringkasan). {'prompt': <prompt_text>, 'response': <response_text>}</response_text></prompt_text>

Kesimpulan

Databricks DBRX mewakili kemajuan yang signifikan dalam teknologi LLM, memanfaatkan seni bina MOE yang inovatif untuk meningkatkan kelajuan, keberkesanan kos, dan prestasi. Sumber sumbernya memupuk lagi pembangunan dan sumbangan komuniti.

Atas ialah kandungan terperinci Databricks DBRX Tutorial: Panduan Langkah demi Langkah. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Mengapa Sam Altman dan Lain -lain kini menggunakan getaran sebagai tolok baru untuk kemajuan terkini di AIMengapa Sam Altman dan Lain -lain kini menggunakan getaran sebagai tolok baru untuk kemajuan terkini di AIMay 06, 2025 am 11:12 AM

Mari kita bincangkan peningkatan penggunaan "getaran" sebagai metrik penilaian dalam bidang AI. Analisis ini adalah sebahagian daripada lajur Forbes saya yang berterusan mengenai kemajuan AI, meneroka aspek kompleks pembangunan AI (lihat pautan di sini). Getaran dalam penilaian AI Tradi

Di dalam kilang Waymo membina masa depan robotaxiDi dalam kilang Waymo membina masa depan robotaxiMay 06, 2025 am 11:11 AM

Kilang Arizona Waymo: Jaguars Memandu Sendiri Massa dan Beyond Terletak berhampiran Phoenix, Arizona, Waymo mengendalikan kemudahan canggih yang menghasilkan armada SUV elektrik Jaguar I-Pace autonomi. Kilang 239,000 kaki persegi ini, dibuka

Di dalam S & P Global Transformasi yang Didorong Data dengan AI di TerasDi dalam S & P Global Transformasi yang Didorong Data dengan AI di TerasMay 06, 2025 am 11:10 AM

Pegawai Penyelesaian Digital Ketua S & P Global, Jigar Kocherlakota, membincangkan perjalanan AI syarikat, pengambilalihan strategik, dan transformasi digital yang fokus pada masa depan. Peranan Kepimpinan Transformatif dan Pasukan Siap Masa Depan Peranan Kocherlakota

Kebangkitan Super-Apps: 4 langkah untuk berkembang dalam ekosistem digitalKebangkitan Super-Apps: 4 langkah untuk berkembang dalam ekosistem digitalMay 06, 2025 am 11:09 AM

Dari aplikasi ke ekosistem: Menavigasi landskap digital Revolusi digital melangkaui media sosial dan AI. Kami menyaksikan kebangkitan "segala aplikasi" -ekosistem digital yang mengintegrasikan semua aspek kehidupan. Sam a

MasterCard dan Visa melepaskan ejen AI untuk berbelanja untuk andaMasterCard dan Visa melepaskan ejen AI untuk berbelanja untuk andaMay 06, 2025 am 11:08 AM

Bayar Ejen MasterCard: Pembayaran berkuasa AI merevolusikan perdagangan Walaupun keupayaan urus niaga AI yang berkuasa Visa menjadi tajuk utama, MasterCard telah melancarkan Bayar Ejen, sistem pembayaran Ai-asli yang lebih maju yang dibina atas tokenisasi, kepercayaan, dan agentik

Backing the Bold: Buku Play Inovasi Transformatif Ventures Masa DepanBacking the Bold: Buku Play Inovasi Transformatif Ventures Masa DepanMay 06, 2025 am 11:07 AM

Dana Ventures Masa Depan IV: Taruhan $ 200 juta pada Teknologi Novel Ventures masa depan baru -baru ini menutup dana yang dilburkan IVnya, berjumlah $ 200 juta. Dana baru ini, yang dikendalikan oleh Steve Jurvetson, Maryanna Saenko, dan Nico Enriquez, mewakili Inv yang penting

Ketika penggunaan AI, syarikat beralih dari SEO ke GEOKetika penggunaan AI, syarikat beralih dari SEO ke GEOMay 05, 2025 am 11:09 AM

Dengan letupan aplikasi AI, perusahaan beralih dari pengoptimuman enjin carian tradisional (SEO) kepada pengoptimuman enjin generatif (GEO). Google mengetuai peralihan. Ciri "AI Gambaran Keseluruhan" telah berkhidmat lebih dari satu bilion pengguna, memberikan jawapan penuh sebelum pengguna mengklik pada pautan. [^2] Peserta lain juga meningkat dengan pesat. Chatgpt, Microsoft Copilot dan kebingungan mencipta kategori "enjin jawapan" baru yang sepenuhnya memintas hasil carian tradisional. Sekiranya perniagaan anda tidak muncul dalam jawapan yang dihasilkan oleh AI ini, pelanggan berpotensi tidak dapat menemui anda-walaupun anda berpangkat tinggi dalam hasil carian tradisional. Dari SEO ke GEO - apa sebenarnya maksudnya? Selama beberapa dekad

Pertaruhan besar di mana laluan ini akan mendorong AI hari ini untuk menjadi AGI yang berhargaPertaruhan besar di mana laluan ini akan mendorong AI hari ini untuk menjadi AGI yang berhargaMay 05, 2025 am 11:08 AM

Mari kita meneroka jalan yang berpotensi untuk kecerdasan umum buatan (AGI). Analisis ini adalah sebahagian daripada lajur Forbes saya yang berterusan mengenai kemajuan AI, menyelidiki kerumitan mencapai AGI dan Superintelligence Buatan (ASI). (Lihat Seni Berkaitan

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Versi Mac WebStorm

Versi Mac WebStorm

Alat pembangunan JavaScript yang berguna

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.

VSCode Windows 64-bit Muat Turun

VSCode Windows 64-bit Muat Turun

Editor IDE percuma dan berkuasa yang dilancarkan oleh Microsoft

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

DVWA

DVWA

Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini