Rumah >Peranti teknologi >AI >VMware dan NVIDIA menyambut era AI generatif untuk perusahaan
VMware dan NVIDIA hari ini mengumumkan pengembangan perkongsian strategik mereka untuk membantu beribu-ribu syarikat yang menggunakan infrastruktur awan VMware bersedia untuk era AI.
VMware Private AI Foundation dengan NVIDIA akan membolehkan perusahaan menyesuaikan model dan menjalankan pelbagai aplikasi AI generatif seperti chatbots pintar, pembantu, carian dan ringkasan, dan banyak lagi. Platform ini akan menjadi penyelesaian bersepadu sepenuhnya menggunakan perisian AI generatif dan pengkomputeran dipercepatkan daripada NVIDIA, dibina di atas Yayasan Awan VMware dan dioptimumkan untuk AI.
Raghu Raghuram, Ketua Pegawai Eksekutif VMware, berkata: "AI Generatif dan multi-cloud adalah padanan yang sempurna. Data pelanggan ada di mana-mana, di pusat data, tepi, awan dan banyak lagi mereka. Bersama NVIDIA, kami akan membantu perusahaan berjalan berhampiran mereka data dengan keyakinan beban kerja AI Generatif dan menangani isu mereka dalam privasi, keselamatan dan kawalan data perusahaan.”
Pengasas dan Ketua Pegawai Eksekutif NVIDIA Jensen Huang berkata: "Perusahaan di seluruh dunia berlumba-lumba untuk mengintegrasikan AI generatif ke dalam perniagaan mereka. Dengan meluaskan kerjasama kami dengan VMware, kami akan dapat memberi perkhidmatan kepada beribu-ribu pelanggan dalam perkhidmatan kewangan, penjagaan kesihatan, pembuatan dan bidang lain . Puluhan ribu pelanggan menyediakan perisian dan pengkomputeran timbunan penuh yang mereka perlukan, membolehkan mereka menggunakan aplikasi yang disesuaikan berdasarkan data mereka sendiri dan memanfaatkan sepenuhnya potensi AI generatif.”
Pengkomputeran timbunan penuh sangat meningkatkan prestasi AI generatif
Untuk merealisasikan faedah perniagaan dengan lebih pantas, perusahaan ingin memudahkan dan meningkatkan kecekapan pembangunan, ujian dan penggunaan aplikasi AI generatif. Menurut McKinsey, AI generatif boleh menambah sebanyak $4.4 trilion kepada ekonomi global setiap tahun(1).
VMware Private AI Foundation dengan NVIDIA akan membantu perusahaan memanfaatkan sepenuhnya keupayaan ini untuk menyesuaikan model bahasa yang besar, mencipta model peribadi yang lebih selamat untuk kegunaan dalaman, menyediakan AI generatif sebagai perkhidmatan kepada pengguna dan model bahasa berskala besar yang lebih selamat inferens beban kerja pada skala.
Pelbagai alatan AI bersepadu yang dirancang untuk disediakan oleh platform akan membantu perusahaan menjalankan model matang yang dilatih menggunakan data peribadi mereka secara efektif dari segi kos. Platform yang dibina di atas VMware Cloud Foundation dan perisian NVIDIA AI Enterprise, dijangka memberikan faedah berikut:
• Privasi: Pelanggan akan dapat menjalankan perkhidmatan AI dengan mudah di mana sahaja data mereka berada melalui seni bina yang melindungi privasi data dan menjamin akses.
• Pilihan: Daripada NVIDIA NeMo™ hingga Llama 2 dan banyak lagi, perusahaan akan mempunyai pelbagai pilihan untuk membina dan menjalankan model mereka, termasuk konfigurasi perkakasan OEM terkemuka dan penyelesaian penyedia perkhidmatan dan awan awam masa hadapan.
• Prestasi: Penanda aras industri terkini menunjukkan bahawa kes penggunaan tertentu yang dijalankan pada infrastruktur dipercepatkan NVIDIA sepadan atau melebihi prestasi logam kosong.
• Skala Pusat Data: Penskalaan GPU yang dioptimumkan dalam persekitaran maya membolehkan beban kerja AI menskalakan kepada sehingga 16 vGPU/GPU pada satu VM dan merentasi berbilang nod, mempercepatkan penalaan halus dan penggunaan model AI generatif.
• Kos Lebih Rendah: Semua sumber pengkomputeran daripada GPU, DPU dan CPU akan dimaksimumkan untuk mengurangkan kos keseluruhan dan mewujudkan persekitaran sumber terkumpul yang boleh dikongsi dengan cekap merentas pasukan.
• Storan dipercepatkan: VMware vSAN Express Storage Architecture menyampaikan storan NVMe yang dioptimumkan prestasi dan menyokong storan GPUDirect® melalui RDMA, membolehkan pemindahan I/O terus daripada storan ke GPU tanpa memerlukan CPU.
• Rangkaian Dipercepatkan: Penyepaduan mendalam antara teknologi vSphere dan NVIDIA NVSwitch™ akan memastikan pelaksanaan model berbilang GPU tanpa kesesakan antara GPU.
• Penggunaan pantas dan masa untuk menghargai: Imej dan perpustakaan vSphere Deep Learning VM akan menyediakan imej penyelesaian turnkey yang stabil yang didatangkan pra-pasang dengan pelbagai rangka kerja dan perpustakaan yang dioptimumkan prestasi untuk prototaip pantas.
Platform ini akan menggunakan NVIDIA NeMo, rangka kerja asli awan hujung ke hujung yang disertakan dalam NVIDIA AI Enterprise, sistem pengendalian platform AI NVIDIA, yang membantu perusahaan membina, menyesuaikan dan menggunakan model AI generatif hampir di mana-mana sahaja. NeMo menggabungkan rangka kerja tersuai, toolkit pagar, alat perbalahan data dan model pra-terlatih untuk membolehkan perusahaan mengguna pakai AI generatif dengan cara yang mudah, berpatutan dan pantas.
Untuk menggunakan AI generatif ke dalam pengeluaran, NeMo menggunakan TensorRT for Large Language Models (TRT-LLM) untuk mempercepatkan dan mengoptimumkan prestasi inferens LLM terkini pada GPU NVIDIA. Melalui NeMo, VMware Private AI Foundation dengan NVIDIA akan membolehkan perusahaan mengimport data mereka sendiri dan membina serta menjalankan model AI generatif tersuai pada infrastruktur awan hibrid VMware.
Pada persidangan VMware Explore 2023, NVIDIA dan VMware akan menumpukan pada cara pembangun dalam perusahaan boleh menggunakan NVIDIA AI Workbench baharu untuk mengekstrak model komuniti (seperti Llama 2 yang disediakan pada Hugging Face), menyesuaikan model ini dari jauh dan menjalankannya dalam Persekitaran VMware Gunakan AI generatif gred pengeluaran dalam .
Sokongan ekosistem yang meluas untuk VMware Private AI Foundation Dengan NVIDIA
VMware Private AI Foundation dengan NVIDIA akan disokong oleh Dell, HPE dan Lenovo. Ketiga-tiga syarikat itu akan menjadi yang pertama menawarkan sistem yang dikuasakan oleh GPU NVIDIA L40S, NVIDIA BlueField®-3 DPU dan NVIDIA ConnectX®-7 SmartNIC yang akan mempercepatkan penyesuaian LLM perusahaan dan beban kerja inferens.
Berbanding GPU Tensor Core NVIDIA A100, GPU NVIDIA L40S boleh meningkatkan prestasi inferens dan prestasi latihan AI generatif sebanyak 1.2 kali dan 1.7 kali masing-masing.
NVIDIA BlueField-3 DPU mempercepatkan, memunggah dan mengasingkan beban kerja pengkomputeran besar-besaran pada GPU atau CPU, termasuk maya, rangkaian, storan, keselamatan dan perkhidmatan AI asli awan yang lain.
NVIDIA ConnectX-7 SmartNICs menyediakan rangkaian pintar, dipercepatkan untuk infrastruktur pusat data untuk menjadi tuan rumah beberapa beban kerja AI yang paling menuntut di dunia.
VMware Private AI Foundation dengan NVIDIA dibina atas kerjasama selama sedekad antara kedua-dua syarikat. Hasil penyelidikan dan pembangunan bersama kedua-dua pihak telah mengoptimumkan infrastruktur awan VMware supaya ia boleh menjalankan NVIDIA AI Enterprise dengan prestasi yang setanding dengan logam kosong. Pengurusan sumber dan infrastruktur serta fleksibiliti yang disediakan oleh VMware Cloud Foundation akan terus memanfaatkan pelanggan bersama.
Ketersediaan
VMware merancang untuk mengeluarkan VMware Private AI Foundation dengan NVIDIA pada awal 2024.
Atas ialah kandungan terperinci VMware dan NVIDIA menyambut era AI generatif untuk perusahaan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!