VMware dan NVIDIA menyambut era AI generatif untuk perusahaan-AI-php.cn

Rumah

Peranti teknologi

VMware dan NVIDIA menyambut era AI generatif untuk perusahaan

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Aug 25, 2023 am 08:45 AM

VMware dan NVIDIA hari ini mengumumkan pengembangan perkongsian strategik mereka untuk membantu beribu-ribu syarikat yang menggunakan infrastruktur awan VMware bersedia untuk era AI.

VMware 与 NVIDIA 为企业开启生成式 AI 时代

VMware Private AI Foundation dengan NVIDIA akan membolehkan perusahaan menyesuaikan model dan menjalankan pelbagai aplikasi AI generatif seperti chatbots pintar, pembantu, carian dan ringkasan, dan banyak lagi. Platform ini akan menjadi penyelesaian bersepadu sepenuhnya menggunakan perisian AI generatif dan pengkomputeran dipercepatkan daripada NVIDIA, dibina di atas Yayasan Awan VMware dan dioptimumkan untuk AI.

Raghu Raghuram, Ketua Pegawai Eksekutif VMware, berkata: "AI Generatif dan multi-cloud adalah padanan yang sempurna. Data pelanggan ada di mana-mana, di pusat data, tepi, awan dan banyak lagi mereka. Bersama NVIDIA, kami akan membantu perusahaan berjalan berhampiran mereka data dengan keyakinan beban kerja AI Generatif dan menangani isu mereka dalam privasi, keselamatan dan kawalan data perusahaan.”

Pengasas dan Ketua Pegawai Eksekutif NVIDIA Jensen Huang berkata: "Perusahaan di seluruh dunia berlumba-lumba untuk mengintegrasikan AI generatif ke dalam perniagaan mereka. Dengan meluaskan kerjasama kami dengan VMware, kami akan dapat memberi perkhidmatan kepada beribu-ribu pelanggan dalam perkhidmatan kewangan, penjagaan kesihatan, pembuatan dan bidang lain . Puluhan ribu pelanggan menyediakan perisian dan pengkomputeran timbunan penuh yang mereka perlukan, membolehkan mereka menggunakan aplikasi yang disesuaikan berdasarkan data mereka sendiri dan memanfaatkan sepenuhnya potensi AI generatif.”

Pengkomputeran timbunan penuh sangat meningkatkan prestasi AI generatif

Untuk merealisasikan faedah perniagaan dengan lebih pantas, perusahaan ingin memudahkan dan meningkatkan kecekapan pembangunan, ujian dan penggunaan aplikasi AI generatif. Menurut McKinsey, AI generatif boleh menambah sebanyak $4.4 trilion kepada ekonomi global setiap tahun(1).

VMware Private AI Foundation dengan NVIDIA akan membantu perusahaan memanfaatkan sepenuhnya keupayaan ini untuk menyesuaikan model bahasa yang besar, mencipta model peribadi yang lebih selamat untuk kegunaan dalaman, menyediakan AI generatif sebagai perkhidmatan kepada pengguna dan model bahasa berskala besar yang lebih selamat inferens beban kerja pada skala.

Pelbagai alatan AI bersepadu yang dirancang untuk disediakan oleh platform akan membantu perusahaan menjalankan model matang yang dilatih menggunakan data peribadi mereka secara efektif dari segi kos. Platform yang dibina di atas VMware Cloud Foundation dan perisian NVIDIA AI Enterprise, dijangka memberikan faedah berikut:

• Privasi: Pelanggan akan dapat menjalankan perkhidmatan AI dengan mudah di mana sahaja data mereka berada melalui seni bina yang melindungi privasi data dan menjamin akses.

• Pilihan: Daripada NVIDIA NeMo™ hingga Llama 2 dan banyak lagi, perusahaan akan mempunyai pelbagai pilihan untuk membina dan menjalankan model mereka, termasuk konfigurasi perkakasan OEM terkemuka dan penyelesaian penyedia perkhidmatan dan awan awam masa hadapan.

• Prestasi: Penanda aras industri terkini menunjukkan bahawa kes penggunaan tertentu yang dijalankan pada infrastruktur dipercepatkan NVIDIA sepadan atau melebihi prestasi logam kosong.

• Skala Pusat Data: Penskalaan GPU yang dioptimumkan dalam persekitaran maya membolehkan beban kerja AI menskalakan kepada sehingga 16 vGPU/GPU pada satu VM dan merentasi berbilang nod, mempercepatkan penalaan halus dan penggunaan model AI generatif.

• Kos Lebih Rendah: Semua sumber pengkomputeran daripada GPU, DPU dan CPU akan dimaksimumkan untuk mengurangkan kos keseluruhan dan mewujudkan persekitaran sumber terkumpul yang boleh dikongsi dengan cekap merentas pasukan.

• Storan dipercepatkan: VMware vSAN Express Storage Architecture menyampaikan storan NVMe yang dioptimumkan prestasi dan menyokong storan GPUDirect® melalui RDMA, membolehkan pemindahan I/O terus daripada storan ke GPU tanpa memerlukan CPU.

• Rangkaian Dipercepatkan: Penyepaduan mendalam antara teknologi vSphere dan NVIDIA NVSwitch™ akan memastikan pelaksanaan model berbilang GPU tanpa kesesakan antara GPU.

• Penggunaan pantas dan masa untuk menghargai: Imej dan perpustakaan vSphere Deep Learning VM akan menyediakan imej penyelesaian turnkey yang stabil yang didatangkan pra-pasang dengan pelbagai rangka kerja dan perpustakaan yang dioptimumkan prestasi untuk prototaip pantas.

Platform ini akan menggunakan NVIDIA NeMo, rangka kerja asli awan hujung ke hujung yang disertakan dalam NVIDIA AI Enterprise, sistem pengendalian platform AI NVIDIA, yang membantu perusahaan membina, menyesuaikan dan menggunakan model AI generatif hampir di mana-mana sahaja. NeMo menggabungkan rangka kerja tersuai, toolkit pagar, alat perbalahan data dan model pra-terlatih untuk membolehkan perusahaan mengguna pakai AI generatif dengan cara yang mudah, berpatutan dan pantas.

Untuk menggunakan AI generatif ke dalam pengeluaran, NeMo menggunakan TensorRT for Large Language Models (TRT-LLM) untuk mempercepatkan dan mengoptimumkan prestasi inferens LLM terkini pada GPU NVIDIA. Melalui NeMo, VMware Private AI Foundation dengan NVIDIA akan membolehkan perusahaan mengimport data mereka sendiri dan membina serta menjalankan model AI generatif tersuai pada infrastruktur awan hibrid VMware.

Pada persidangan VMware Explore 2023, NVIDIA dan VMware akan menumpukan pada cara pembangun dalam perusahaan boleh menggunakan NVIDIA AI Workbench baharu untuk mengekstrak model komuniti (seperti Llama 2 yang disediakan pada Hugging Face), menyesuaikan model ini dari jauh dan menjalankannya dalam Persekitaran VMware Gunakan AI generatif gred pengeluaran dalam .

Sokongan ekosistem yang meluas untuk VMware Private AI Foundation Dengan NVIDIA

VMware Private AI Foundation dengan NVIDIA akan disokong oleh Dell, HPE dan Lenovo. Ketiga-tiga syarikat itu akan menjadi yang pertama menawarkan sistem yang dikuasakan oleh GPU NVIDIA L40S, NVIDIA BlueField®-3 DPU dan NVIDIA ConnectX®-7 SmartNIC yang akan mempercepatkan penyesuaian LLM perusahaan dan beban kerja inferens.

Berbanding GPU Tensor Core NVIDIA A100, GPU NVIDIA L40S boleh meningkatkan prestasi inferens dan prestasi latihan AI generatif sebanyak 1.2 kali dan 1.7 kali masing-masing.

NVIDIA BlueField-3 DPU mempercepatkan, memunggah dan mengasingkan beban kerja pengkomputeran besar-besaran pada GPU atau CPU, termasuk maya, rangkaian, storan, keselamatan dan perkhidmatan AI asli awan yang lain.

NVIDIA ConnectX-7 SmartNICs menyediakan rangkaian pintar, dipercepatkan untuk infrastruktur pusat data untuk menjadi tuan rumah beberapa beban kerja AI yang paling menuntut di dunia.

VMware Private AI Foundation dengan NVIDIA dibina atas kerjasama selama sedekad antara kedua-dua syarikat. Hasil penyelidikan dan pembangunan bersama kedua-dua pihak telah mengoptimumkan infrastruktur awan VMware supaya ia boleh menjalankan NVIDIA AI Enterprise dengan prestasi yang setanding dengan logam kosong. Pengurusan sumber dan infrastruktur serta fleksibiliti yang disediakan oleh VMware Cloud Foundation akan terus memanfaatkan pelanggan bersama.

Ketersediaan

VMware merancang untuk mengeluarkan VMware Private AI Foundation dengan NVIDIA pada awal 2024.

Atas ialah kandungan terperinci VMware dan NVIDIA menyambut era AI generatif untuk perusahaan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Artikel ini dikembalikan pada:搜狐. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel Berkaitan

Apakah graf pemikiran dalam kejuruteraan segeraApr 13, 2025 am 11:53 AM

Pengenalan Dalam kejuruteraan segera, "Grafik Pemikiran" merujuk kepada pendekatan baru yang menggunakan teori graf untuk struktur dan membimbing proses penalaran AI. Tidak seperti kaedah tradisional, yang sering melibatkan linear

Mengoptimumkan pemasaran e -mel organisasi anda dengan agen genaiApr 13, 2025 am 11:44 AM

Pengenalan Tahniah! Anda menjalankan perniagaan yang berjaya. Melalui laman web anda, kempen media sosial, webinar, persidangan, sumber percuma, dan sumber lain, anda mengumpul 5000 ID e -mel setiap hari. Langkah jelas seterusnya adalah

Pemantauan Prestasi Aplikasi Masa Nyata dengan Apache PinotApr 13, 2025 am 11:40 AM

Pengenalan Dalam persekitaran pembangunan perisian pantas hari ini, memastikan prestasi aplikasi yang optimum adalah penting. Memantau metrik masa nyata seperti masa tindak balas, kadar ralat, dan penggunaan sumber dapat membantu utama

Chatgpt mencecah 1 bilion pengguna? 'Dua kali ganda dalam beberapa minggu' kata Ketua Pegawai Eksekutif OpenaiApr 13, 2025 am 11:23 AM

"Berapa banyak pengguna yang anda ada?" Dia ditakdirkan. "Saya fikir kali terakhir yang kami katakan ialah 500 juta aktif mingguan, dan ia berkembang dengan pesat," jawab Altman. "Anda memberitahu saya bahawa ia seperti dua kali ganda dalam beberapa minggu sahaja," kata Anderson. "Saya mengatakan bahawa priv

Pixtral -12b: Model Multimodal Pertama Mistral Ai 'Apr 13, 2025 am 11:20 AM

Pengenalan Mistral telah mengeluarkan model multimodal yang pertama, iaitu Pixtral-12B-2409. Model ini dibina atas parameter 12 bilion Mistral, NEMO 12B. Apa yang membezakan model ini? Ia kini boleh mengambil kedua -dua gambar dan Tex

Rangka Kerja Agentik untuk Aplikasi AI Generatif - Analytics VidhyaApr 13, 2025 am 11:13 AM

Bayangkan mempunyai pembantu berkuasa AI yang bukan sahaja memberi respons kepada pertanyaan anda tetapi juga mengumpulkan maklumat, melaksanakan tugas, dan juga mengendalikan pelbagai jenis teks, imej, dan kod. Bunyi futuristik? Dalam ini a

Aplikasi AI Generatif di Sektor KewanganApr 13, 2025 am 11:12 AM

Pengenalan Industri kewangan adalah asas kepada mana -mana pembangunan negara, kerana ia memacu pertumbuhan ekonomi dengan memudahkan urus niaga yang cekap dan ketersediaan kredit. The ease with which transactions occur and credit

Panduan untuk pembelajaran dalam talian dan algoritma pasif-agresifApr 13, 2025 am 11:09 AM

Pengenalan Data dijana pada kadar yang belum pernah terjadi sebelumnya dari sumber seperti media sosial, urus niaga kewangan, dan platform e-dagang. Mengendalikan aliran maklumat yang berterusan ini adalah satu cabaran, tetapi ia menawarkan

See all articles