NVIDIA Memperkenalkan Llama 3.1-Nemotron-51B: Lonjakan dalam Ketepatan dan Kecekapan-web3.0-php.cn

Rumah

web3.0

NVIDIA Memperkenalkan Llama 3.1-Nemotron-51B: Lonjakan dalam Ketepatan dan Kecekapan

Barbara Streisand

Sep 24, 2024 pm 09:17 PM

nvidia Llama 3.1 Nemotron-51B Accuracy Efficiency

NVIDIA's Llama 3.1-Nemotron-51B menetapkan penanda aras baharu dalam AI dengan ketepatan dan kecekapan yang unggul, membolehkan beban kerja yang tinggi pada satu GPU.

NVIDIA Memperkenalkan Llama 3.1-Nemotron-51B: Lonjakan dalam Ketepatan dan Kecekapan

Model bahasa terbaharu NVIDIA, Llama 3.1-Nemotron-51B, menetapkan piawaian baharu dalam prestasi AI dengan ketepatan dan kecekapan yang luar biasa. Model ini menandakan kemajuan dalam menskalakan LLM agar muat pada satu GPU, walaupun di bawah beban kerja yang tinggi.

NVIDIA telah melancarkan model bahasa baharu, digelar Llama 3.1-Nemotron-51B, menjanjikan lonjakan dalam prestasi AI dengan ketepatan dan kecekapan yang unggul. Model ini diperoleh daripada Meta Llama-3.1-70B dan memanfaatkan pendekatan Carian Senibina Neural (NAS) novel untuk mengoptimumkan ketepatan dan kecekapan. Hebatnya, model ini boleh dimuatkan pada satu GPU NVIDIA H100, walaupun di bawah beban kerja yang tinggi, menjadikannya lebih mudah diakses dan menjimatkan kos.

Model Llama 3.1-Nemotron-51B mempunyai kelajuan inferens 2.2 kali lebih pantas sambil mengekalkan tahap ketepatan yang hampir sama berbanding dengan pendahulunya. Kecekapan ini membolehkan beban kerja 4 kali ganda lebih besar pada satu GPU semasa inferens, berkat jejak memori yang berkurangan dan seni bina yang dioptimumkan.

Salah satu cabaran dalam mengguna pakai model bahasa besar (LLM) ialah kos inferens yang tinggi. Model Llama 3.1-Nemotron-51B menangani perkara ini dengan menawarkan pertukaran seimbang antara ketepatan dan kecekapan, menjadikannya penyelesaian yang kos efektif untuk pelbagai aplikasi, daripada sistem tepi hingga pusat data awan. Keupayaan ini amat berguna untuk menggunakan berbilang model melalui pelan tindakan Kubernetes dan NIM.

Model Nemotron dioptimumkan dengan enjin TensorRT-LLM untuk prestasi inferens yang lebih tinggi dan dibungkus sebagai perkhidmatan mikro inferens NVIDIA NIM. Persediaan ini memudahkan dan mempercepatkan penggunaan model AI generatif merentas infrastruktur dipercepat NVIDIA, termasuk awan, pusat data dan stesen kerja.

Model Llama 3.1-Nemotron-51B-Instruct dibina menggunakan teknologi NAS dan kaedah latihan yang cekap, yang membolehkan penciptaan model pengubah bukan standard yang dioptimumkan untuk GPU tertentu. Pendekatan ini termasuk rangka kerja penyulingan blok untuk melatih pelbagai varian blok secara selari, memastikan inferens yang cekap dan tepat.

Pendekatan NAS NVIDIA membolehkan pengguna memilih keseimbangan optimum mereka antara ketepatan dan kecekapan. Sebagai contoh, varian Llama-3.1-Nemotron-40B-Instruct dicipta untuk mengutamakan kelajuan dan kos, mencapai peningkatan kelajuan 3.2 kali ganda berbanding model induk dengan penurunan ketepatan yang sederhana.

Model Llama 3.1-Nemotron-51B-Instruct telah ditanda aras dengan beberapa piawaian industri, mempamerkan prestasi unggulnya dalam pelbagai senario. Ia menggandakan daya pemprosesan model rujukan, menjadikannya kos efektif dalam pelbagai kes penggunaan.

Model Llama 3.1-Nemotron-51B-Instruct menawarkan satu set baharu kemungkinan untuk pengguna dan syarikat memanfaatkan model asas yang sangat tepat secara kos efektif. Keseimbangan antara ketepatan dan kecekapan menjadikannya pilihan yang menarik untuk pembina dan menyerlahkan keberkesanan pendekatan NAS, yang NVIDIA sasarkan untuk diperluaskan kepada model lain.

Atas ialah kandungan terperinci NVIDIA Memperkenalkan Llama 3.1-Nemotron-51B: Lonjakan dalam Ketepatan dan Kecekapan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel Berkaitan

Harga token rangkaian PI telah meningkat lebih daripada 14% sejak seminggu yang lalu.Apr 16, 2025 am 11:22 AM

Pada masa akhbar, PI didagangkan pada $ 0.6711 selepas integrasinya dengan ChainLink pada 12 April. Pengumuman itu menyebabkan lonjakan harga pi

Lebih banyak alasan untuk menaikkan harga Sui sebagai harga memasuki zon belian utamaApr 16, 2025 am 11:20 AM

Seorang penganalisis mengenai X, Frigg, menyoroti pelbagai sebab untuk optimis mengenai trajektori harga rangkaian Sui.

Sentimen Bitcoin (BTC) menghidupkan kenaikan harga lebih dari $ 467 juta dari cryptocurrency telah ditarik balik dari pertukaran semalamApr 16, 2025 am 11:18 AM

Berikutan data hari ini yang dikeluarkan oleh Intotheblock, sentimen di sekitar Bitcoin kelihatan semakin tinggi ke arah kenaikan harga.

Makmal Pergerakan dan Yayasan Rangkaian Pergerakan telah melancarkan siasatan bebas ke dalam penyelewengan pembuatan pasaran baru-baru ini yang berkaitan dengan token langkah.Apr 16, 2025 am 11:16 AM

NT Labs dan Yayasan Rangkaian Pergerakan melancarkan siasatan bebas ke dalam pemindahan pasaran yang membuat token

Gelombang modal mengalir keluar dari Ethereum [ETH] dan ke Tron [TRX]Apr 16, 2025 am 11:14 AM

Dengan $ 1.52 bilion di stablecoins yang berhijrah ke Tron, pelabur nampaknya memihak kepada rantai kos rendah dan mempelbagaikan di luar aset yang disokong USD tradisional.

Ketua Pegawai Eksekutif Mantra John Patrick Mullin membakar peruntukan token OM untuk memulihkan keyakinan pelaburApr 16, 2025 am 11:12 AM

Ketua Pegawai Eksekutif Mantra, John Patrick Mullin telah mencadangkan membakar peruntukannya terhadap token OM dalam langkah yang bertujuan untuk memulihkan keyakinan pelabur selepas tanda protokol asli mengalami keruntuhan tajam.

Pergerakan pasaran dan analisis teknikal baru -baru ini mencadangkan bahawa Bonk mungkin berada di ambang lonjakan harga yang ketara, melampaui ekosistem Solana yang lebih luas.Apr 16, 2025 am 11:10 AM

Persediaan teknikal untuk pemulihan harga bonk Menurut penganalisis Crypto yang terkenal Altcoin Sherpa, Bonk menunjukkan tanda -tanda pemulihan yang berpotensi.

Securitize memperoleh perniagaan pentadbiran dana MG Stover untuk menjadi pentadbir dana aset digital terbesarApr 16, 2025 am 11:08 AM

Securitize, salah satu penerbit aset yang terbesar, pada hari Selasa ia telah memperoleh perniagaan pentadbiran dana MG Stover

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang laluByDDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Arahan sembang dan cara menggunakannya

1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Penyesuai Pelayan SAP NetWeaver untuk Eclipse

Integrasikan Eclipse dengan pelayan aplikasi SAP NetWeaver.

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.