cari
RumahPeranti teknologiAIJamba 1.5: Menampilkan Senibina Mamba-Transformer Hibrid

Jamba 1.5: Model bahasa hibrid yang kuat untuk pemprosesan konteks panjang

Jamba 1.5, model bahasa besar yang canggih dari makmal AI21, menawarkan keupayaan yang mengagumkan untuk mengendalikan konteks teks yang luas. Terdapat dalam dua versi - Jamba 1.5 besar (94 bilion parameter) dan Jamba 1.5 mini (12 bilion parameter) - ia memanfaatkan seni bina hibrid yang unik yang menggabungkan Model Space State (SSM) berstruktur Mamba dengan seni bina pengubah tradisional. Pendekatan inovatif ini membolehkan pemprosesan tetingkap konteks yang tidak pernah berlaku sebelum ini, lonjakan yang ketara untuk model sumber terbuka.

Jamba 1.5: Menampilkan Senibina Mamba-Transformer Hibrid

Ciri dan keupayaan utama:

  • Tingkap konteks besar -besaran: Proses sehingga token 256K, sesuai untuk dokumen yang panjang dan tugas -tugas yang kompleks.
  • Senibina hibrid: Menggabungkan kekuatan model pengubah dan Mamba untuk kecekapan dan prestasi yang optimum.
  • Kuantisasi yang efisien: Menggunakan Pakar Kuantisasi untuk mengurangkan jejak memori dan pemprosesan yang lebih cepat.
  • Sokongan berbilang bahasa: Fungsi dengan berkesan merentasi sembilan bahasa: Bahasa Inggeris, Sepanyol, Perancis, Portugis, Itali, Belanda, Jerman, Arab, dan Ibrani.
  • Aplikasi serba boleh: Sesuai untuk pelbagai tugas NLP, termasuk menjawab soalan, ringkasan, penjanaan teks, dan klasifikasi.
  • Penyebaran yang boleh diakses: Boleh didapati melalui AI21's Studio API, Hugging Face, dan Rakan Awan.

Butiran Senibina:

Jamba 1.5: Menampilkan Senibina Mamba-Transformer Hibrid

Aspek Perincian
Senibina asas Senibina Transformer-Mamba Hibrid dengan Modul Campuran-of-Experts (MOE)
Varian model Jamba-1.5-besar (parameter aktif 94B, jumlah 398B) dan Jamba-1.5-Mini (parameter aktif 12B, jumlah 52B)
Komposisi lapisan 9 blok, masing -masing dengan 8 lapisan; Nisbah 1: 7 pengubah ke lapisan Mamba
Campuran Pakar (MOE) 16 pakar, memilih Top 2 Per teratas
Dimensi tersembunyi 8192
Kepala perhatian 64 kepala pertanyaan, 8 kepala nilai kunci
Panjang konteks Sehingga token 256k
Teknik kuantisasi PakarInt8 untuk lapisan MOE dan MLP
Fungsi pengaktifan Pengaktifan Transformer dan Mamba Bersepadu
Kecekapan Dioptimumkan untuk kelebihan tinggi dan latensi rendah pada GPU 8x80GB

Mengakses dan menggunakan Jamba 1.5:

Jamba 1.5 mudah diakses melalui API studio AI21 dan memeluk muka. Model ini boleh disesuaikan dengan domain tertentu untuk meningkatkan prestasi. Contoh python menggunakan API AI21 disediakan di bawah:

Contoh Python:

 dari AI21 Import AI21Client
dari ai21.models.chat import chatmessage

Mesej = [chatmessage (kandungan = "Apa tokenizer dalam 2-3 baris?", Role = "User")]
pelanggan = AI21Client (API_KEY = '') # Ganti '' dengan kekunci API anda
response = client.chat.completions.create (
    mesej = mesej,
    Model = "Jamba-1.5-Mini",
    stream = benar
)
untuk sebahagian tindak balas:
    cetak (chunk.choices [0] .delta.content, end = "") 

Jamba 1.5: Menampilkan Senibina Mamba-Transformer HibridJamba 1.5: Menampilkan Senibina Mamba-Transformer HibridJamba 1.5: Menampilkan Senibina Mamba-Transformer Hibrid

Kesimpulan:

Jamba 1.5 mewakili kemajuan yang ketara dalam model bahasa yang besar, yang menawarkan gabungan kuasa dan kecekapan yang menarik. Keupayaannya untuk mengendalikan konteks yang sangat panjang, ditambah dengan aplikasi serba boleh dan pilihan penempatan yang boleh diakses, menjadikannya alat yang berharga untuk pelbagai tugas NLP.

Soalan Lazim (Soalan Lazim): (Sama seperti yang asal, tetapi diubahsuai untuk kesesatan)

  • S1: Apakah Jamba 1.5? A: Model bahasa pengubah hibrid-Mamba yang besar dengan parameter 94b (besar) atau 12b (mini), dioptimumkan untuk pengajaran berikut dan pemprosesan konteks panjang.
  • S2: Bagaimanakah Jamba 1.5 mengendalikan konteks panjang dengan cekap? A: Melalui Senibina Hibrid dan Pakar Kuantisasi, membolehkan tetingkap konteks token 256k dengan penggunaan memori yang dikurangkan.
  • S3: Apakah kuantisasi PakarT8? A: Teknik mampatan menggunakan ketepatan INT8 dalam lapisan MOE dan MLP untuk kecekapan yang lebih baik.
  • S4: Adakah Jamba 1.5 tersedia secara terbuka? A: Ya, di bawah lesen Model Terbuka Jamba, boleh diakses melalui muka yang memeluk.

Atas ialah kandungan terperinci Jamba 1.5: Menampilkan Senibina Mamba-Transformer Hibrid. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Penggodaman peribadi akan menjadi beruang yang cukup sengitPenggodaman peribadi akan menjadi beruang yang cukup sengitMay 11, 2025 am 11:09 AM

Cyberattacks berkembang. Sudahlah hari -hari e -mel phishing generik. Masa depan jenayah siber adalah hiper-peribadi, memanfaatkan data dalam talian yang sedia ada dan AI untuk membuat serangan yang sangat disasarkan. Bayangkan seorang penipu yang mengetahui pekerjaan anda, f anda

Pope Leo XIV mendedahkan bagaimana AI mempengaruhi pilihan namanyaPope Leo XIV mendedahkan bagaimana AI mempengaruhi pilihan namanyaMay 11, 2025 am 11:07 AM

Dalam alamat sulungnya ke Kolej Kardinal, kelahiran Chicago Robert Francis Prevost, Paus Leo XIV yang baru dipilih, membincangkan pengaruhnya, Paus Leo XIII, yang Papacy (1878-1903) bertepatan dengan subuh kereta dan

Tutorial Fastapi -MCP untuk Pemula dan Pakar - Analytics VidhyaTutorial Fastapi -MCP untuk Pemula dan Pakar - Analytics VidhyaMay 11, 2025 am 10:56 AM

Tutorial ini menunjukkan cara mengintegrasikan model bahasa besar anda (LLM) dengan alat luaran menggunakan Protokol Konteks Model (MCP) dan FastAPI. Kami akan membina aplikasi web yang mudah menggunakan Fastapi dan mengubahnya menjadi pelayan MCP, membolehkan l anda

Dia-1.6b TTS: Model Generasi Teks-ke-Dialog Terbaik-Analisis VidhyaDia-1.6b TTS: Model Generasi Teks-ke-Dialog Terbaik-Analisis VidhyaMay 11, 2025 am 10:27 AM

Terokai Dia-1.6b: Model teks-ke-ucapan yang dibangunkan oleh dua mahasiswa dengan pembiayaan sifar! Model parameter 1.6 bilion ini menghasilkan ucapan yang sangat realistik, termasuk isyarat nonverbal seperti ketawa dan bersin. Panduan artikel ini

3 cara ai dapat membuat bimbingan lebih bermakna dari sebelumnya3 cara ai dapat membuat bimbingan lebih bermakna dari sebelumnyaMay 10, 2025 am 11:17 AM

Saya sepenuh hati bersetuju. Kejayaan saya adalah berkaitan dengan bimbingan mentor saya. Wawasan mereka, terutamanya mengenai pengurusan perniagaan, membentuk dasar kepercayaan dan amalan saya. Pengalaman ini menggariskan komitmen saya kepada mentor

AI menggali potensi baru dalam industri perlombonganAI menggali potensi baru dalam industri perlombonganMay 10, 2025 am 11:16 AM

Peralatan perlombongan AI yang dipertingkatkan Persekitaran operasi perlombongan adalah keras dan berbahaya. Sistem kecerdasan buatan membantu meningkatkan kecekapan dan keselamatan keseluruhan dengan menghapuskan manusia dari persekitaran yang paling berbahaya dan meningkatkan keupayaan manusia. Kecerdasan buatan semakin digunakan untuk menguasai trak autonomi, latihan dan pemuat yang digunakan dalam operasi perlombongan. Kenderaan berkuasa AI ini boleh beroperasi dengan tepat dalam persekitaran berbahaya, dengan itu meningkatkan keselamatan dan produktiviti. Sesetengah syarikat telah membangunkan kenderaan perlombongan autonomi untuk operasi perlombongan berskala besar. Peralatan yang beroperasi dalam persekitaran yang mencabar memerlukan penyelenggaraan yang berterusan. Walau bagaimanapun, penyelenggaraan boleh menyimpan peranti kritikal di luar talian dan menggunakan sumber. Penyelenggaraan yang lebih tepat bermakna peningkatan uptime untuk peralatan yang mahal dan diperlukan dan penjimatan kos yang signifikan. AI-didorong

Mengapa ejen AI akan mencetuskan revolusi tempat kerja terbesar dalam 25 tahunMengapa ejen AI akan mencetuskan revolusi tempat kerja terbesar dalam 25 tahunMay 10, 2025 am 11:15 AM

Marc Benioff, Ketua Pegawai Eksekutif Salesforce, meramalkan revolusi tempat kerja yang monumental yang didorong oleh ejen AI, transformasi yang sedang dijalankan dalam Salesforce dan pangkalan pelanggannya. Dia membayangkan peralihan dari pasaran tradisional ke pasaran yang jauh lebih besar yang difokuskan

AI HR akan melancarkan dunia kita sebagai pengangkatan AIAI HR akan melancarkan dunia kita sebagai pengangkatan AIMay 10, 2025 am 11:14 AM

Kebangkitan AI dalam HR: Menavigasi Tenaga Kerja dengan Rakan Robot Penyepaduan AI ke dalam sumber manusia (HR) tidak lagi menjadi konsep futuristik; Ia cepat menjadi realiti baru. Peralihan ini memberi kesan kepada profesional dan pekerja HR, DEM

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Nordhold: Sistem Fusion, dijelaskan
3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌
Mandragora: Whispers of the Witch Tree - Cara Membuka Kunci Cangkuk Bergelut
3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Alat panas

MantisBT

MantisBT

Mantis ialah alat pengesan kecacatan berasaskan web yang mudah digunakan yang direka untuk membantu dalam pengesanan kecacatan produk. Ia memerlukan PHP, MySQL dan pelayan web. Lihat perkhidmatan demo dan pengehosan kami.

SublimeText3 versi Inggeris

SublimeText3 versi Inggeris

Disyorkan: Versi Win, menyokong gesaan kod!

MinGW - GNU Minimalis untuk Windows

MinGW - GNU Minimalis untuk Windows

Projek ini dalam proses untuk dipindahkan ke osdn.net/projects/mingw, anda boleh terus mengikuti kami di sana. MinGW: Port Windows asli bagi GNU Compiler Collection (GCC), perpustakaan import yang boleh diedarkan secara bebas dan fail pengepala untuk membina aplikasi Windows asli termasuk sambungan kepada masa jalan MSVC untuk menyokong fungsi C99. Semua perisian MinGW boleh dijalankan pada platform Windows 64-bit.

DVWA

DVWA

Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini

EditPlus versi Cina retak

EditPlus versi Cina retak

Saiz kecil, penyerlahan sintaks, tidak menyokong fungsi gesaan kod