Rumah >Peranti teknologi >AI >Rangkaian AI Galaxy, jawapan kepada kapasiti pengangkutan dalam era model besar
Memandangkan nilai model pra-latihan AI yang besar terus muncul, skala model menjadi lebih besar dan lebih besar. Industri dan akademik telah mencapai kata sepakat: Dalam era AI, kuasa pengkomputeran adalah produktiviti.
Walaupun pemahaman ini betul, ia tidak menyeluruh. Sistem digital mempunyai tiga tiang: penyimpanan, pengkomputeran dan rangkaian, dan perkara yang sama berlaku untuk teknologi AI. Jika anda mengetepikan storan dan kuasa pengkomputeran rangkaian, maka model besar hanya boleh berdiri sendiri. Khususnya, infrastruktur rangkaian yang disesuaikan dengan model besar tidak mendapat perhatian yang berkesan.
Dalam menghadapi model besar AI yang kerap "melatih dengan berpuluh-puluh ribu kad", "digunakan di beribu-ribu batu" dan "dengan trilion parameter", kapasiti pengangkutan rangkaian adalah pautan yang tidak boleh diabaikan dalam keseluruhan pintar sistem. Cabaran yang dihadapinya sangat menonjol, dan ia sedang menunggu jawapan yang boleh memecahkan keadaan.
Wang Lei, Presiden Barisan Produk Komunikasi Data Huawei
Pada 20 September, satu sidang kemuncak komunikasi data dengan tema "Rangkaian AI Galaxy, Mempercepat Perisikan Industri" telah diadakan semasa Persidangan Huawei Connect 2023. Wakil dari semua lapisan masyarakat membincangkan transformasi dan trend pembangunan teknologi rangkaian AI. Pada mesyuarat itu, Wang Lei, Presiden Barisan Produk Komunikasi Data Huawei, melancarkan penyelesaian rangkaian Galaxy AI secara rasmi. Beliau berkata bahawa model besar menjadikan AI lebih pintar, tetapi kos melatih model besar adalah sangat tinggi, dan kos bakat AI juga mesti dipertimbangkan. Oleh itu, dalam peringkat kepintaran industri, hanya dengan menumpukan pada membina kluster kuasa pengkomputeran yang besar dan menyediakan perkhidmatan awan pengkomputeran pintar kepada masyarakat boleh kecerdasan buatan benar-benar menembusi ke dalam beribu-ribu industri. Huawei telah mengeluarkan generasi baharu penyelesaian rangkaian Galaxy AI Menghadapi era pintar, ia membina infrastruktur rangkaian baharu dengan daya pemprosesan ultra tinggi, kestabilan jangka panjang, kebolehpercayaan, keanjalan dan keselarasan tinggi untuk membantu AI memanfaatkan semua orang dan mempercepatkan kecerdasan. industri.
Ambil peluang ini untuk mengetahui tentang cabaran rangkaian yang dibawa ke pusat data pengkomputeran pintar oleh kemunculan model besar, dan sebab Huawei Galaxy AI Network ialah penyelesaian optimum untuk masalah ini.
Apabila datang ke era AI, model, sekeping data dan unit pengkomputeran boleh dianggap sebagai cahaya bintang. Walau bagaimanapun, hanya dengan menghubungkannya secara cekap dan stabil, dunia pintar yang cemerlang dapat dibentuk
Wabak model besar mencetuskan torrent rangkaian tersembunyi
Kami tahu bahawa model AI terbahagi kepada dua peringkat: latihan dan penggunaan inferens. Dengan peningkatan model besar yang telah dilatih, cabaran rangkaian AI yang besar juga telah berlaku dalam kedua-dua peringkat ini.
Yang pertama adalah dalam fasa latihan model besar. Apabila saiz model dan parameter data menjadi lebih besar dan lebih besar, latihan model besar mula memerlukan pengkomputeran kelompok kilokalori atau bahkan 10,000 kilowatt untuk diselesaikan. Ini juga bermakna latihan model besar mesti berlaku di pusat data dengan kuasa pengkomputeran AI.
Pada peringkat semasa, kos pusat data pengkomputeran pintar adalah sangat tinggi. Menurut data industri, kos membina kluster dengan kuasa pengkomputeran 100P mencecah 400 juta yuan. Mengambil model besar antarabangsa yang terkenal sebagai contoh, perbelanjaan kuasa pengkomputeran hariannya semasa proses latihan mencecah 700,000 dolar AS
Jika keupayaan sambungan rangkaian pusat data tidak lancar, mengakibatkan sejumlah besar sumber pengkomputeran hilang semasa penghantaran rangkaian, kerugian kepada pusat data dan model AI akan menjadi tidak terukur. Sebaliknya, jika latihan kluster lebih cekap dengan skala kuasa pengkomputeran yang sama, maka pusat data akan memperoleh peluang perniagaan yang besar. Kadar beban dan faktor rangkaian lain secara langsung menentukan kecekapan latihan model AI. Sebaliknya, apabila skala kluster kuasa pengkomputeran AI terus berkembang, kerumitannya juga meningkat dengan sewajarnya, jadi kebarangkalian kegagalan juga meningkat. Membina rangkaian kluster jangka panjang yang stabil dan boleh dipercayai ialah pangsi penting bagi pusat data untuk meningkatkan nisbah input-output mereka
Di luar pusat data, nilai rangkaian AI juga boleh dilihat dalam senario penaakulan dan penggunaan model AI. Penggunaan inferens model besar bergantung terutamanya pada perkhidmatan awan, dan penyedia perkhidmatan awan mesti cuba memberi perkhidmatan kepada pelanggan yang lebih besar dengan sumber pengkomputeran terhad untuk memaksimumkan nilai komersial model besar. Akibatnya, semakin ramai pengguna, semakin kompleks keseluruhan struktur rangkaian awan. Cara menyediakan perkhidmatan rangkaian jangka panjang dan stabil telah menjadi cabaran baharu bagi penyedia perkhidmatan pengkomputeran awan.
Selain itu, dalam jarak terakhir penggunaan inferens AI, pengguna kerajaan dan perusahaan berhadapan dengan keperluan untuk meningkatkan kualiti rangkaian. Dalam senario sebenar, kehilangan paket pautan 1% akan menyebabkan prestasi TCP menurun 50 kali ganda, yang bermaksud bahawa untuk jalur lebar 100Mbps, kapasiti sebenar adalah kurang daripada 2Mbps. Oleh itu, hanya dengan meningkatkan keupayaan rangkaian senario aplikasi itu sendiri, kami dapat memastikan aliran lancar kuasa pengkomputeran AI dan merealisasikan AI yang benar-benar inklusif.
Tidak sukar untuk melihat daripada ini bahawa dalam keseluruhan proses kelahiran, penghantaran dan penggunaan model AI yang besar, setiap pautan menghadapi cabaran dan keperluan peningkatan rangkaian. Masalah kapasiti pengangkutan dalam era model besar perlu diselesaikan segera.
Idea gangguan rangkaian dalam era pintar boleh berlanjutan dari cahaya bintang ke galaksi
Kemunculan model besar telah membawa masalah rangkaian berbilang pautan, proses penuh. Oleh itu, kita mesti mengambil pendekatan yang sistematik untuk menangani cabaran ini
Huawei telah mencadangkan infrastruktur rangkaian baharu untuk perkhidmatan awan pengkomputeran pintar Kemudahan ini perlu menyokong tiga keupayaan "latihan kecekapan tinggi", "kuasa pengkomputeran tanpa henti" dan "perkhidmatan AI inklusif". Ketiga-tiga keupayaan ini merangkumi keseluruhan senario model besar AI daripada latihan kepada penggunaan inferens. Huawei bukan sahaja menumpukan pada memenuhi satu keperluan dan menaik taraf satu teknologi, tetapi juga secara menyeluruh mempromosikan lelaran rangkaian AI, membawa idea penemuan unik kepada industri
Secara khusus, infrastruktur rangkaian dalam era AI perlu menyertakan keupayaan berikut:
Pertama sekali, rangkaian perlu memaksimumkan nilai kelompok pengkomputeran AI dalam senario latihan. Dengan membina rangkaian dengan keupayaan sambungan berskala ultra besar, latihan kecekapan tinggi model AI besar dicapai.
Kedua, untuk memastikan kestabilan dan kemampanan tugas AI, adalah perlu untuk membina keupayaan rangkaian jangka panjang dan boleh dipercayai untuk memastikan latihan bulanan tidak terganggu Pada masa yang sama, persempadanan yang stabil, kedudukan dan pemulihan di tahap kedua diperlukan untuk meminimumkan gangguan latihan. Ini adalah pembinaan kapasiti tanpa henti bagi kuasa pengkomputeran.
Sekali lagi, semasa proses penggunaan inferens AI, rangkaian dikehendaki mempunyai ciri-ciri konkurensi yang anjal dan tinggi, yang boleh mengatur aliran pengguna secara besar-besaran dan memberikan pengalaman pendaratan AI yang terbaik. Ia juga boleh menahan kesan rangkaian kemerosotan dan memastikan kuasa pengkomputeran AI lancar antara kawasan Mudah Alih, ini juga merealisasikan pembinaan kapasiti "perkhidmatan AI inklusif".
Huawei akhirnya melancarkan penyelesaian rangkaian Galaxy AI, mematuhi idea memecahkan permainan ini. Penyelesaian ini menyepadukan teknologi AI yang tersebar dan membentuk rangkaian seperti galaksi melalui keupayaan pengkomputeran yang berkuasa
Galaxy AI Network memberikan jawapan kapasiti kepada era model besar
Semasa Persidangan Ketersambungan Penuh Huawei 2023, Huawei berkongsi visi pembangunannya untuk mempercepatkan penciptaan model AI yang besar dengan kuasa pengkomputeran yang besar, kapasiti storan yang besar dan kapasiti pengangkutan yang besar. Generasi baharu penyelesaian rangkaian Galaxy AI Huawei boleh dikatakan sebagai penyelesaian Huawei kepada kapasiti pengangkutan berskala besar dalam era kecerdasan.
Untuk pusat data pintar, Huawei Galaxy AI Network ialah penyelesaian optimum berdasarkan kuasa rangkaian.
Ciri rangkaian daya pemprosesan ultra tingginya boleh memberikan nilai penting kepada kluster AI di pusat pengkomputeran pintar untuk meningkatkan kadar beban rangkaian dan meningkatkan kecekapan latihan. Khususnya, suis pengkomputeran pintar rangkaian Galaxy AI mempunyai keupayaan port 400GE dan 800GE kepadatan tertinggi industri Hanya rangkaian pensuisan lapisan 2 boleh merealisasikan rangkaian kluster tanpa penumpuan sebanyak 18,000 kad, sekali gus menyokong latihan model besar dengan lebih satu trilion parameter. Sebaik sahaja tahap rangkaian dikurangkan, ini bermakna pusat data boleh menjimatkan banyak kos modul optik, sambil meningkatkan kebolehramalan risiko rangkaian dan memperoleh keupayaan latihan model besar yang lebih stabil.
Rangkaian AI Galaxy boleh menyokong pengimbangan beban peringkat rangkaian NSLB, meningkatkan kadar beban daripada 50% kepada 98%, yang bersamaan dengan merealisasikan operasi overclocking kelompok AI, dengan itu meningkatkan kecekapan latihan sebanyak 20%, memenuhi jangkaan latihan yang cekap
Untuk pengeluar perkhidmatan awan, Rangkaian AI Galaxy boleh memberikan jaminan kuasa pengkomputeran yang stabil dan boleh dipercayai.
Dalam senario interkoneksi bilik pengkomputeran DCI, teknologi ini boleh menyediakan fungsi seperti penjadualan pintar pelbagai laluan, mengenal pasti secara automatik dan menyesuaikan secara proaktif kepada kesan trafik perniagaan puncak. Ia boleh mengenal pasti aliran besar dan kecil daripada berjuta-juta aliran data dan memperuntukkannya secara munasabah kepada 100,000 laluan untuk mencapai kesesakan sifar dalam rangkaian dan memberikan jaminan anjal untuk perkhidmatan awan pengkomputeran pintar konkurensi tinggi
Bagi pengguna kerajaan dan perusahaan, rangkaian AI Galaxy dapat mengatasi masalah degradasi rangkaian dan memastikan kuasa pengkomputeran AI sejagat.
Ia boleh menyokong keupayaan anti-degradasi anjal dalam senario pengiraan DCA, dan menggunakan teknologi Fillp untuk mengoptimumkan protokol TCP, yang boleh meningkatkan kadar beban lebar jalur daripada 10% kepada 60% di bawah keadaan kadar kehilangan paket 1%, dengan itu memastikan bahawa dari kawasan bandar ke kawasan terpencil Kuasa pengkomputeran di rantau ini mengalir dengan lancar, mempercepatkan aplikasi perkhidmatan AI yang inklusif.
Dengan cara ini, keperluan rangkaian semua aspek model besar daripada latihan hingga penggunaan diselesaikan. Daripada pusat pengkomputeran pintar kepada beribu-ribu industri, terdapat tunjang untuk pembangunan pengkomputeran berasaskan rangkaian.
Dalam era kecerdasan, era baru teknologi yang dibuka oleh model besar baru sahaja bermula. Rangkaian AI Galaxy menyediakan jawapan kepada kapasiti pengangkutan dalam era pintar
Atas ialah kandungan terperinci Rangkaian AI Galaxy, jawapan kepada kapasiti pengangkutan dalam era model besar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!