Rumah  >  Artikel  >  Peranti teknologi  >  Meta telah menambah dua kluster 10,000 kad baharu dan melabur hampir 50,000 GPU NVIDIA H100.

Meta telah menambah dua kluster 10,000 kad baharu dan melabur hampir 50,000 GPU NVIDIA H100.

WBOY
WBOYke hadapan
2024-03-15 09:34:13605semak imbas

Meta新增两大万卡集群,投入近50000块英伟达H100 GPU

Meta baru-baru ini melancarkan dua kluster GPU berkuasa untuk menyokong latihan model AI generasi akan datang, termasuk Llama 3 yang akan datang.

Kedua-dua pusat data dilaporkan dilengkapi dengan sehingga 24,576 GPU, direka untuk menyokong model AI generatif yang lebih besar dan lebih kompleks daripada yang dikeluarkan sebelum ini.

Sebagai model algoritma sumber terbuka yang popular, Llama Meta adalah setanding dengan GPT OpenAI dan Gemini Google.

Meta menyegarkan skala kluster AI

Menurut Geek.com, kedua-dua kluster GPU ini dilengkapi dengan GPU H100 NVIDIA yang paling berkuasa, dan skalanya jauh lebih besar daripada kluster besar yang dilancarkan oleh Meta sebelum ini. Sebelum ini, kluster Meta mempunyai kira-kira 16,000 GPU Nvidia A100.

Dilaporkan bahawa Meta telah membeli beribu-ribu GPU terbaharu Nvidia. Syarikat penyelidikan pasaran Omdia menunjukkan dalam laporan terbarunya bahawa Meta telah menjadi salah satu pelanggan paling penting Nvidia.

Jurutera meta mengumumkan bahawa mereka merancang untuk menggunakan kluster GPU baharu untuk memperhalusi sistem AI sedia ada untuk melatih sistem AI yang lebih baharu dan lebih berkuasa, termasuk Llama 3.

Jurutera itu menunjukkan bahawa pembangunan Llama 3 kini "sedang berjalan", tetapi tidak mendedahkan bila ia akan dikeluarkan.

Matlamat jangka panjang Meta adalah untuk membangunkan sistem kecerdasan buatan umum (AGI), kerana AGI lebih dekat dengan manusia dari segi kreativiti dan berbeza dengan ketara daripada model AI generatif sedia ada.

Kluster GPU baharu akan membantu Meta mencapai matlamat ini. Selain itu, syarikat itu sedang menambah baik rangka kerja AI PyTorch untuk menyokong lebih banyak GPU.

Dua kluster GPU menggunakan seni bina yang berbeza

Perlu dinyatakan bahawa walaupun kedua-dua kluster mempunyai bilangan GPU yang betul-betul sama dan boleh bersambung antara satu sama lain pada titik akhir 400GB sesaat, ia menggunakan seni bina yang berbeza.

Antaranya, kluster GPU boleh mengakses memori terus atau RDMA dari jauh melalui fabrik rangkaian Ethernet tertumpu yang dibina menggunakan Arista Networks' Arista 7800 dengan suis rak Wedge400 dan Minipack2 OCP. Satu lagi kluster GPU dibina menggunakan teknologi fabrik rangkaian Quantum2 InfiniBand Nvidia.

Kedua-dua kluster menggunakan Grand Teton, platform perkakasan GPU terbuka Meta, yang direka bentuk untuk menyokong beban kerja AI berskala besar. Grand Teton menawarkan empat kali lebar jalur hos-ke-GPU pendahulunya, platform Zion-EX, dan dua kali ganda kuasa pengkomputeran, lebar jalur dan kuasa Zion-EX.

Meta berkata bahawa kedua-dua kluster ini mengguna pakai kuasa rak terbuka dan infrastruktur rak terbaharu, bertujuan untuk memberikan fleksibiliti yang lebih besar dalam reka bentuk pusat data. Rak Terbuka v3 membolehkan rak kuasa dipasang di mana-mana bahagian dalam rak dan bukannya dipasang pada bar bas, membolehkan konfigurasi yang lebih fleksibel.

Meta新增两大万卡集群,投入近50000块英伟达H100 GPU

Selain itu, bilangan pelayan bagi setiap rak juga boleh disesuaikan, membolehkan keseimbangan yang lebih berkesan dari segi kapasiti pemprosesan setiap pelayan.

Dari segi storan, kedua-dua kluster GPU ini adalah berdasarkan platform pelayan YV3 Sierra Point dan menggunakan pemacu keadaan pepejal E1.S yang paling canggih.

Lebih banyak GPU sedang dalam perjalanan

Jurutera meta menekankan dalam artikel bahawa syarikat komited untuk membuka inovasi timbunan perkakasan AI. "Ketika kami melihat ke masa hadapan, kami menyedari bahawa apa yang berjaya sebelum ini atau pada masa ini mungkin tidak mencukupi untuk memenuhi keperluan masa hadapan. Itulah sebabnya kami sentiasa menilai dan menambah baik infrastruktur kami

Meta ialah ahli AI Alliance one yang baru ditubuhkan." . Perikatan itu bertujuan untuk mewujudkan ekosistem terbuka yang meningkatkan ketelusan dan kepercayaan dalam pembangunan AI dan memastikan semua orang mendapat manfaat daripada inovasinya.

Meta juga mendedahkan bahawa ia akan terus membeli lebih banyak GPU Nvidia H100 dan merancang untuk mempunyai lebih daripada 350,000 GPU menjelang akhir tahun ini. GPU ini akan digunakan untuk terus membina infrastruktur AI, yang bermakna semakin banyak kluster GPU yang berkuasa akan tersedia pada masa hadapan.

Atas ialah kandungan terperinci Meta telah menambah dua kluster 10,000 kad baharu dan melabur hampir 50,000 GPU NVIDIA H100.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam