Rumah >Peranti teknologi >AI >Tencent mengeluarkan generasi baharu kelompok pengkomputeran yang sangat berkuasa: untuk latihan model besar, prestasi meningkat sebanyak 3 kali ganda

Tencent mengeluarkan generasi baharu kelompok pengkomputeran yang sangat berkuasa: untuk latihan model besar, prestasi meningkat sebanyak 3 kali ganda

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBke hadapan: 2023-04-16 13:28:051304semak imbas

Kluster pengkomputeran berprestasi tinggi HCC generasi baharu menggunakan pelayan generasi terbaharu Xinghai yang dibangunkan sendiri dan dilengkapi dengan GPU Tensor Core NVIDIA H800.

Pegawai Tencent berkata bahawa kluster itu adalah berdasarkan rangkaian yang dibangunkan sendiri dan seni bina storan, membawakan lebar jalur intersambung ultra tinggi 3.2T, kapasiti pemprosesan tahap TB dan berpuluh juta IOPS. Keputusan pengukuran sebenar menunjukkan bahawa prestasi kuasa pengkomputeran kluster generasi baharu dipertingkatkan sebanyak 3 kali ganda berbanding dengan generasi sebelumnya.

Tencent mengeluarkan generasi baharu kelompok pengkomputeran yang sangat berkuasa: untuk latihan model besar, prestasi meningkat sebanyak 3 kali ganda

Pada Oktober tahun lalu, Tencent telah menyelesaikan latihan model AI besar pertama dengan bertrilion parameter - model besar Hunyuan NLP. Dengan set data yang sama, masa latihan dipendekkan daripada 50 hari kepada 11 hari. Jika berdasarkan kluster generasi baharu, masa latihan akan dikurangkan lagi kepada 4 hari.

Pada peringkat pengkomputeran, prestasi kendiri pelayan adalah asas kuasa pengkomputeran kluster Kad GPU tunggal kluster generasi baharu Tencent Cloud menyokong output sehingga 1979 TFlop kuasa pengkomputeran di bawah ketepatan yang berbeza.

Untuk senario model besar, pelayan yang dibangunkan sendiri oleh Xingxinghai menggunakan reka bentuk ketumpatan ultra tinggi 6U, iaitu 30% lebih tinggi daripada ketumpatan rak yang disokong industri menggunakan konsep pengkomputeran selari, melalui reka bentuk bersepadu CPU dan nod GPU, Tingkatkan prestasi kuasa pengkomputeran satu titik ke tahap yang lebih tinggi.

Tencent mengeluarkan generasi baharu kelompok pengkomputeran yang sangat berkuasa: untuk latihan model besar, prestasi meningkat sebanyak 3 kali ganda

Di peringkat rangkaian, terdapat keperluan interaksi data yang besar antara nod pengkomputeran. Apabila skala kelompok berkembang, prestasi komunikasi secara langsung akan menjejaskan kecekapan latihan, memerlukan kerjasama maksimum antara rangkaian dan nod pengkomputeran.

Rangkaian pengkomputeran berprestasi tinggi Xingmai Tencent yang dibangunkan sendiri mendakwa mempunyai jalur lebar komunikasi 3.2T RDMA tertinggi dalam industri. Keputusan pengukuran sebenar menunjukkan bahawa dilengkapi dengan bilangan GPU yang sama, rangkaian Xingmai 3.2T mempunyai peningkatan 20% dalam kuasa pengkomputeran keseluruhan kluster berbanding rangkaian 1.6T.

Pada masa yang sama, perpustakaan komunikasi kolektif berprestasi tinggi Tencent yang dibangunkan sendiri TCCL disepadukan ke dalam penyelesaian yang direka khas. Berbanding dengan perpustakaan komunikasi kolektif sumber terbuka industri, ia mengoptimumkan prestasi beban 40% untuk latihan model besar dan menghapuskan masalah gangguan latihan yang disebabkan oleh pelbagai sebab rangkaian.

Tencent mengeluarkan generasi baharu kelompok pengkomputeran yang sangat berkuasa: untuk latihan model besar, prestasi meningkat sebanyak 3 kali ganda

Di peringkat storan, semasa latihan model besar, sebilangan besar nod pengkomputeran akan membaca kumpulan set data pada masa yang sama Ia adalah perlu untuk memendekkan data masa memuatkan sebanyak mungkin untuk mengelakkan menunggu nod pengkomputeran.

Seni bina storan Tencent Cloud yang dibangunkan sendiri mempunyai keupayaan daya pemprosesan tahap terabait dan berpuluh juta IOPS, menyokong keperluan storan dalam senario yang berbeza. Penyelesaian storan objek COS+GooseFS dan penyelesaian storan fail berprestasi tinggi CFS Turbo memenuhi sepenuhnya prestasi tinggi, pemprosesan besar dan keperluan storan besar-besaran dalam senario model besar.

Tencent mengeluarkan generasi baharu kelompok pengkomputeran yang sangat berkuasa: untuk latihan model besar, prestasi meningkat sebanyak 3 kali ganda

Selain itu, kluster generasi baharu menyepadukan enjin pecutan latihan TACO yang dibangunkan sendiri Tencent Cloud, yang melaksanakan sejumlah besar pengoptimuman peringkat sistem pada protokol rangkaian, strategi komunikasi, Rangka kerja AI, dan kompilasi model menjimatkan kos penalaan latihan dan kuasa pengkomputeran dengan ketara.

AngelPTM, rangka kerja latihan di sebalik model besar Hunyuan Tencent, juga telah menyediakan perkhidmatan melalui Tencent Cloud TACO untuk membantu perusahaan mempercepatkan pelaksanaan model besar.

Melalui keupayaan model besar dan kotak alat platform Tencent Cloud TI, perusahaan boleh menjalankan latihan yang diperhalusi berdasarkan data senario industri, meningkatkan kecekapan pengeluaran dan mencipta serta menggunakan aplikasi AI dengan pantas.

Tencent mengeluarkan generasi baharu kelompok pengkomputeran yang sangat berkuasa: untuk latihan model besar, prestasi meningkat sebanyak 3 kali ganda

Bergantung pada keupayaan tadbir urus asli awan yang diedarkan, Tencent Cloud Intelligent Computing Platform menyediakan 16 EFLOPS kuasa pengkomputeran titik terapung.

Atas ialah kandungan terperinci Tencent mengeluarkan generasi baharu kelompok pengkomputeran yang sangat berkuasa: untuk latihan model besar, prestasi meningkat sebanyak 3 kali ganda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

架构分布式对象 nlp

Kenyataan：

Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel sebelumnya：Adakah kad super dikira sebagai leher? Biden akan menyekat eksport peralatan pembuatan cip di bawah 14nm ke ChinaArtikel seterusnya：Adakah kad super dikira sebagai leher? Biden akan menyekat eksport peralatan pembuatan cip di bawah 14nm ke China

Artikel berkaitan

Lihat lagi