Rumah >Peranti teknologi >AI >NVIDIA mengeluarkan GPU khusus ChatGPT, meningkatkan kelajuan inferens sebanyak 10 kali ganda

NVIDIA mengeluarkan GPU khusus ChatGPT, meningkatkan kelajuan inferens sebanyak 10 kali ganda

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBke hadapan: 2023-05-13 23:04:041312semak imbas

Pada suatu masa dahulu, kecerdasan buatan mengalami kesesakan selama beberapa dekad kerana kuasa pengkomputeran yang tidak mencukupi, dan GPU mencetuskan pembelajaran mendalam. Dalam era ChatGPT, AI sekali lagi menghadapi masalah kuasa pengkomputeran yang tidak mencukupi kerana model besar Adakah NVIDIA mempunyai penyelesaian kali ini?

Pada 22 Mac, persidangan GTC telah diadakan secara rasmi Pada Keynote yang baru diadakan, Ketua Pegawai Eksekutif NVIDIA Jensen Huang telah memindahkan cip yang disediakan untuk ChatGPT.

"Mempercepatkan pengkomputeran bukan mudah. Pada tahun 2012, model penglihatan komputer AlexNet menggunakan GeForce GTX 580 dan boleh memproses 262 PetaFLOPS sesaat. Model ini mencetuskan letupan dalam teknologi AI," Jen -Hsun Huang berkata. "Sepuluh tahun kemudian, Transformer muncul. GPT-3 menggunakan 323 ZettaFLOPS kuasa pengkomputeran, 1 juta kali ganda daripada AlexNet, untuk mencipta ChatGPT, AI yang mengejutkan dunia. Platform pengkomputeran baharu muncul, dan era iPhone AI telah tiba . ”

NVIDIA mengeluarkan GPU khusus ChatGPT, meningkatkan kelajuan inferens sebanyak 10 kali ganda

Ledakan dalam AI telah memacu harga saham Nvidia naik 77% pada masa ini, nilai pasaran Nvidia ialah AS$640 bilion, menjadikannya Intel hampir lima kali. Walau bagaimanapun, keluaran hari ini memberitahu kami bahawa Nvidia masih belum berhenti.

Merancang kuasa pengkomputeran khusus untuk AIGC

Pembangunan AI generatif (AIGC) mengubah keperluan syarikat teknologi untuk kuasa pengkomputeran Nvidia pernah menunjukkan empat jenis pengkomputeran kuasa untuk platform penaakulan Tugas AI, semuanya menggunakan seni bina bersatu.

NVIDIA mengeluarkan GPU khusus ChatGPT, meningkatkan kelajuan inferens sebanyak 10 kali ganda

Antaranya, NVIDIA L4 menyediakan "prestasi video dipacu AI 120 kali lebih tinggi daripada CPU, dan kecekapan tenaga 99%", yang boleh digunakan untuk Penstriman video, pengekodan dan penyahkodan, dan menjana video AI yang lebih berkuasa NVIDIA L40 digunakan khas untuk penjanaan imej 2D/3D.

Untuk ChatGPT, yang memerlukan kuasa pengkomputeran yang besar, NVIDIA telah mengeluarkan NVIDIA H100 NVL, penyelesaian khusus model bahasa besar (LLM) dengan memori 94GB dan Enjin Transformer dipercepatkan, dilengkapi dengan PCIE H100 GPU dengan dwi GPU NVLINK.

NVIDIA mengeluarkan GPU khusus ChatGPT, meningkatkan kelajuan inferens sebanyak 10 kali ganda

"Pada masa ini satu-satunya GPU yang benar-benar boleh mengendalikan ChatGPT ialah NVIDIA HGX A100. Berbanding dengan yang sebelumnya, satu kini dilengkapi dengan empat pasang H100 dan dwi NVLINK Kelajuan pelayan standard boleh menjadi 10 kali lebih pantas, yang boleh mengurangkan kos pemprosesan model bahasa besar mengikut susunan magnitud," kata Huang.

Akhir sekali terdapat NVIDIA Grace Hopper untuk Model Pengesyoran, yang selain dioptimumkan untuk tugas pengesyoran, juga boleh menguasakan rangkaian saraf graf dan pangkalan data vektor.

Biar cip menembusi had fizikal

Pada masa ini, proses pengeluaran semikonduktor telah menghampiri had yang boleh dicapai oleh fizik. Selepas proses 2nm, apakah titik terobosan? NVIDIA memutuskan untuk memulakan dengan peringkat paling primitif pembuatan cip - fotolitografi.

Pada asasnya, ini adalah masalah pengimejan pada had fizik. Di bawah proses lanjutan, banyak ciri pada cip akan lebih kecil daripada panjang gelombang cahaya yang digunakan dalam proses percetakan, dan reka bentuk topeng mesti sentiasa diubah suai, satu langkah yang dipanggil pembetulan jarak optik. Litografi pengiraan mensimulasikan kelakuan cahaya apabila ia berinteraksi dengan photoresist melalui yang asal Kelakuan ini diterangkan mengikut persamaan Maxwell Ini adalah tugas yang paling memerlukan pengiraan dalam bidang reka bentuk dan pembuatan cip.

NVIDIA mengeluarkan GPU khusus ChatGPT, meningkatkan kelajuan inferens sebanyak 10 kali ganda

Jensen Huang mengumumkan teknologi baharu yang dipanggil CuLitho di GTC untuk mempercepatkan reka bentuk dan pembuatan semikonduktor. Perisian menggunakan cip Nvidia untuk mempercepatkan langkah antara reka bentuk cip berasaskan perisian dan fabrikasi fizikal topeng fotolitografi yang digunakan untuk mencetak reka bentuk tersebut pada cip.

CuLitho berjalan pada GPU dan menyampaikan peningkatan prestasi 40x ganda berbanding teknologi litografi semasa, mempercepatkan beban kerja pengkomputeran berskala besar yang kini menggunakan berpuluh bilion jam CPU setiap tahun. "Membina H100 memerlukan 89 topeng. Apabila berjalan pada CPU, satu topeng mengambil masa dua minggu, tetapi jika H100 digunakan untuk berjalan pada CuLitho, ia hanya mengambil masa 8 jam," kata Huang.

Ini bermakna 500 sistem NVIDIA DGX H100 boleh menggantikan kerja 40,000 sistem CPU dan menjalankan semua bahagian proses litografi pengiraan, membantu mengurangkan keperluan kuasa dan kesan potensi kesan alam sekitar.

Kemajuan ini akan menjadikan transistor dan litar cip lebih kecil daripada hari ini, sambil mempercepatkan masa untuk memasarkan cip dan menambah baik pusat data besar-besaran yang beroperasi sepanjang masa untuk memacu pembuatan kecekapan tenaga.

Nvidia berkata ia bekerjasama dengan ASML, Synopsys dan TSMC untuk membawa teknologi itu ke pasaran. Menurut laporan, TSMC akan mula bersedia untuk pengeluaran percubaan teknologi ini pada bulan Jun.

"Industri cip adalah asas bagi hampir setiap industri lain di dunia," kata Huang. "Dengan teknologi litografi pada had fizik, melalui CuLitho dan bekerjasama dengan rakan kongsi kami TSMC, ASML dan Synopsys, fab boleh meningkatkan pengeluaran, mengurangkan jejak karbon mereka, dan meletakkan asas untuk 2nm dan seterusnya." 🎜>Sistem pengkomputeran kuantum dipercepatkan GPU pertama

Pada acara hari ini, NVIDIA turut mengumumkan sistem baharu yang dibina menggunakan Mesin Kuantum untuk mereka yang bekerja pada Penyelidik berteknologi tinggi menyediakan seni bina baharu yang revolusioner untuk prestasi dan rendah. -pendaman pengkomputeran klasik kuantum.

NVIDIA mengeluarkan GPU khusus ChatGPT, meningkatkan kelajuan inferens sebanyak 10 kali ganda

Sebagai sistem pengkomputeran kuantum dipercepatkan GPU pertama di dunia, NVIDIA DGX Quantum menggabungkan platform pengkomputeran dipercepatkan yang paling berkuasa di dunia ( Dicapai oleh cip super NVIDIA Grace Hopper dan model pengaturcaraan sumber terbuka CUDA Quantum) digabungkan dengan platform kawalan kuantum paling maju di dunia OPX (disediakan oleh Mesin Kuantum). Gabungan ini membolehkan penyelidik membina aplikasi berkuasa yang tidak pernah berlaku sebelum ini yang menggabungkan pengkomputeran kuantum dengan pengkomputeran klasik tercanggih untuk membolehkan penentukuran, kawalan, pembetulan ralat kuantum dan algoritma hibrid.

Di tengah-tengah DGX Quantum ialah sistem NVIDIA Grace Hopper yang disambungkan oleh PCIe ke Mesin Kuantum OPX+, membolehkan kependaman sub-mikrosaat antara GPU dan Unit Pemprosesan Kuantum (QPU) .

Tim Costa, pengarah HPC dan kuantum di NVIDIA, berkata: "Pengkomputeran super dipercepatkan kuantum berpotensi untuk membentuk semula sains dan industri, dan NVIDIA DGX Quantum akan membolehkan para penyelidik menembusi sempadan pengkomputeran kuantum-klasik 》

Sebagai tindak balas, NVIDIA menyepadukan GPU seni bina Hopper berprestasi tinggi dengan CPU Grace baharu syarikat ke dalam “Grace Hopper” untuk menyediakan AI dan HPC yang sangat berkuasa. aplikasi. Ia memberikan prestasi sehingga 10x ganda untuk aplikasi yang menjalankan terabait data, memberikan penyelidik kuantum-klasik lebih kuasa untuk menyelesaikan masalah paling kompleks di dunia.

DGX Quantum juga melengkapkan pembangun dengan NVIDIA CUDA Quantum, susunan perisian bersatu yang berkuasa yang kini sumber terbuka. CUDA Quantum ialah platform pengkomputeran kuantum klasik hibrid yang menyepadukan dan memprogramkan QPU, GPU dan CPU dalam satu sistem.

$37,000 sebulan, latih ChatGPT anda sendiri di halaman web

Microsoft membelanjakan ratusan juta dolar untuk membeli puluhan ribu A100 untuk membina superkomputer khusus GPT , anda kini Anda mungkin ingin menyewa GPU yang sama yang digunakan oleh OpenAI dan Microsoft untuk melatih ChatGPT dan Carian Bing untuk melatih model besar anda sendiri.

Awan DGX yang dicadangkan oleh NVIDIA menyediakan kluster pengkomputeran super NVIDIA DGX AI khusus, dipasangkan dengan perisian NVIDIA AI Perkhidmatan ini membolehkan setiap perusahaan mengakses pengkomputeran super AI menggunakan penyemak imbas web yang ringkas. pengkomputeran, menghapuskan kerumitan memperoleh, menggunakan dan mengurus infrastruktur di premis.

Menurut laporan, setiap tika DGX Cloud mempunyai lapan GPU Teras Tensor 80GB H100 atau A100, dengan jumlah memori GPU 640GB setiap nod. Fabrik berprestasi tinggi dan kependaman rendah yang dibina dengan NVIDIA Networking memastikan beban kerja boleh berskala merentas kelompok sistem yang saling berkaitan, membolehkan berbilang kejadian bertindak sebagai satu GPU gergasi untuk memenuhi keperluan prestasi latihan AI lanjutan.

Perusahaan kini boleh menyewa gugusan Awan DGX secara bulanan untuk skala pembangunan beban kerja latihan berbilang nod yang besar tanpa menunggu sumber pengkomputeran dipercepatkan yang sering mendapat permintaan tinggi.

Harga sewa bulanan, menurut Huang Renxun, bermula pada $36,999 setiap kejadian sebulan.

"Kami berada dalam momen kecerdasan buatan iPhone," kata Huang "Permulaan berlumba-lumba untuk mencipta produk dan model perniagaan yang mengganggu, dan penyandang sedang mencari untuk bertindak balas. DGX Cloud memberi pelanggan. akses segera kepada pengkomputeran besar NVIDIA AI dalam awan pada skala global 》

Untuk membantu perusahaan menerima gelombang AI generatif, NVIDIA turut mengumumkan satu siri perkhidmatan awan yang boleh dibina dan dipertingkatkan model bahasa berskala besar tersuai dan model AI generatif.

Kini orang ramai boleh menggunakan perkhidmatan bahasa NVIDIA NeMo dan perkhidmatan imej, video dan 3D NVIDIA Picasso untuk membina proprietari, aplikasi AI generatif khusus domain untuk perbualan pintar dan sokongan Pelanggan, penciptaan kandungan profesional, simulasi digital dan banyak lagi. Secara berasingan, NVIDIA mengumumkan model baharu perkhidmatan awan biologi NVIDIA BioNeMo.

"AI Generatif ialah sejenis komputer baharu yang boleh diprogramkan dengan bahasa semula jadi manusia. Keupayaan ini mempunyai implikasi yang meluas - semua orang boleh memerintah komputer untuk menyelesaikan masalah, yang bukan kes sebelum Soon, ini hanya untuk pengaturcara," kata Huang.

Berdasarkan keluaran hari ini, Nvidia bukan sahaja terus menambah baik reka bentuk perkakasan untuk beban kerja AI syarikat teknologi, tetapi juga mencadangkan model perniagaan baharu. Pada pandangan sesetengah pihak, NVIDIA mahu menjadi "TSMC dalam bidang AI": menyediakan perkhidmatan faundri produktiviti termaju seperti kilang wafer, membantu syarikat lain melatih algoritma AI untuk senario khusus mereka di atasnya.

Menggunakan latihan superkomputer NVIDIA dan secara langsung menghapuskan keperluan orang tengah untuk memperoleh perbezaan harga, adakah ini akan menjadi hala tuju pembangunan AI masa hadapan?

Atas ialah kandungan terperinci NVIDIA mengeluarkan GPU khusus ChatGPT, meningkatkan kelajuan inferens sebanyak 10 kali ganda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan：

Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel sebelumnya：Tidak mahu Nvidia menguasainya, Microsoft membantu AMD dalam membangunkan cip kecerdasan buatanArtikel seterusnya：Tidak mahu Nvidia menguasainya, Microsoft membantu AMD dalam membangunkan cip kecerdasan buatan

Artikel berkaitan

Lihat lagi