Rumah >Peranti teknologi >AI >Empat cara untuk mengoptimumkan pusat data anda untuk menampung beban kerja AI
AI dijangka mengubah pusat data dalam pelbagai cara, seperti menukar pasaran kerja pusat data dan menambah baik pemantauan pusat data dan operasi tindak balas insiden.
Walau bagaimanapun, kesan terbesar kecerdasan buatan yang mungkin ada pada pusat data ialah mengubah cara pusat data berfungsi. Bagi perusahaan yang ingin menggunakan sepenuhnya teknologi kecerdasan buatan moden, infrastruktur yang terkandung dalam pusat data dan cara ia diurus mesti berubah
Pembangunan AI dalam pusat data akan membawa satu siri perubahan utama yang patut dilihat Walau bagaimanapun, Impak yang tepat masih dapat dilihat
Untuk menilai kesan AI pada pusat data, anda perlu memahami terlebih dahulu bagaimana beban kerja AI dibandingkan dengan jenis beban kerja lain dalam pusat data, seperti pengehosan aplikasi standard Perbezaan antara
Walaupun beban kerja kecerdasan buatan (AI) datang dalam pelbagai bentuk dan mempunyai keperluan yang berbeza, kebanyakannya mempunyai keperluan unik berikut:
Sudah tentu, terdapat jenis beban kerja lain yang mungkin mempunyai keperluan ini. Contohnya, menjalankan aplikasi dan perkhidmatan kecerdasan buatan bukanlah satu-satunya kes penggunaan yang boleh mendapat manfaat daripada pelayan logam kosong. Tetapi secara amnya, perisian AI memerlukan lebih banyak sumber di atas daripada jenis beban kerja lain
Untuk mengoptimumkan kemudahan untuk beban kerja AI, banyak pengendali pusat data perlu membuat Perubahan untuk memenuhi keperluan unik AI. Berikut ialah peningkatan pusat data utama dalam hal ini.
Mesin maya telah menjadi sumber infrastruktur pilihan untuk mengehos beban kerja sepanjang dekad yang lalu. Walau bagaimanapun, apabila permintaan untuk perkakasan logam terdedah meningkat untuk aplikasi dan perkhidmatan AI, semakin ramai pengendali pusat data mungkin menyedari kepentingan mengembangkan tawaran logam terdedah mereka
Dalam beberapa cara, ini sebenarnya memudahkan operasi pusat data. Jika anda menjalankan beban kerja pada logam kosong, anda akan mendapat timbunan pengehosan yang kurang kompleks kerana anda tidak mempunyai gabungan hypervisor dan orkestra VM.
Sebaliknya, untuk menskalakan beban kerja pengehosan infrastruktur logam kosong, kemas kini dan peningkatan pada pelayan pengehosan dan rak di pusat data mungkin diperlukan. Secara tradisinya, cara paling mudah untuk menyediakan pelayan di pusat data adalah dengan menyediakan mesin logam kosong yang berkuasa dan memberikannya kepada sebarang bilangan mesin maya berdasarkan keperluan beban kerja. Walau bagaimanapun, jika beban kerja perlu dijalankan terus pada logam kosong, lebih banyak pelayan mungkin diperlukan untuk mengasingkan beban kerja - bermakna pusat data perlu menggantikan pelayan berkuasa tinggi dengan yang lebih kecil dan mengemas kini rak pelayan dengan sewajarnya
Pengoperasian aplikasi AI sehari-hari tidak semestinya memerlukan sokongan GPU, walaupun menggunakan pelayan GPU boleh memberi manfaat semasa latihan untuk beban kerja AI. Oleh itu, banyak perusahaan hanya memerlukan akses sementara kepada infrastruktur yang didayakan GPU
Untuk memenuhi keperluan perusahaan untuk infrastruktur GPU yang dikongsi, pengendali pusat data harus mempertimbangkan untuk menyediakan produk berkaitan. Sesetengah perusahaan hanya memerlukan pelayan yang dilengkapi GPU dalam beberapa kes, jadi pengendali pusat data boleh menyediakan akses kepada sumber GPU buat sementara waktu melalui GPU-sebagai-perkhidmatan untuk menarik lebih baik perusahaan tersebut dengan keperluan beban kerja AI
Kebanyakan pusat data kelas perusahaan sudah mempunyai akses kepada infrastruktur rangkaian berprestasi tinggi dan menyediakan perkhidmatan saling sambungan untuk mengalihkan data dengan pantas ke kemudahan luaran. Walau bagaimanapun, untuk merealisasikan sepenuhnya kuasa kecerdasan buatan, produk rangkaian pusat data mungkin perlu lebih berkuasa
Perusahaan yang mempunyai beban kerja kecerdasan buatan perlu mempunyai dua keupayaan utama: Pertama, mereka memerlukan sambungan rangkaian lebar jalur tinggi yang boleh dengan cepat memindahkan data dalam jumlah yang besar, amat penting apabila melatih model AI pada infrastruktur teragih. Kedua, rangkaian perlu menyediakan kependaman rendah, yang penting untuk aplikasi dan perkhidmatan AI yang ingin mencapai pelaksanaan masa nyata
Memandangkan keperluan sumber beban kerja AI sangat berubah-ubah, pusat data yang lebih fleksibel dari segi jumlah infrastruktur yang mereka boleh sokong mungkin diperlukan. AI juga mungkin meningkatkan permintaan untuk perkhidmatan yang membolehkan syarikat menggunakan pelayan atas permintaan di pusat data lain dan bukannya menyediakan pelayan tersebut sendiri, kerana infrastruktur atas permintaan ialah cara yang baik untuk mengambil kira turun naik permintaan sumber.
Untuk tujuan ini, pengendali pusat data yang ingin mengoptimumkan AI harus mempertimbangkan produk yang menjadikan kemudahan mereka lebih fleksibel. Gabungan kontrak dan perkhidmatan jangka pendek yang merangkumi lebih daripada sekadar ruang rak di mana pelanggan boleh membina infrastruktur mereka sendiri mungkin menarik kepada organisasi yang perlu menggunakan beban kerja AI.
Revolusi AI masih berlangsung, dan masih terlalu awal untuk mengetahui dengan tepat cara AI akan mengubah cara pusat data beroperasi atau jenis infrastruktur yang digunakan di dalamnya. Tetapi apa yang agak pasti ialah perubahan seperti pelayan yang didayakan GPU dan penyelesaian yang lebih fleksibel mungkin menjadi kritikal dalam dunia tertumpu AI. Pengendali pusat data yang mahukan sekeping pai harus memastikan mengemas kini kemudahan mereka untuk memenuhi keperluan unik beban kerja AI.
Atas ialah kandungan terperinci Empat cara untuk mengoptimumkan pusat data anda untuk menampung beban kerja AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!