Rumah > Artikel > Peranti teknologi > Untuk meneroka jalan ke pelaksanaan MLOps perusahaan, Persidangan Teknologi Kecerdasan Buatan Global AISummit 'Amalan Terbaik MLOps' telah berjaya diadakan
Pada masa ini, terdapat banyak kesukaran dalam aplikasi kepintaran buatan berskala besar dalam perusahaan, seperti: kitaran pelancaran R&D yang panjang, hasil yang kurang daripada jangkaan dan kesukaran dalam memadankan data dan model. Dalam konteks ini, MLOps telah wujud. MLOps muncul sebagai teknologi utama untuk membantu skala pembelajaran mesin dalam perusahaan.
Beberapa hari lalu, AIsummit Global Artificial Intelligence Technology Conference anjuran 51CTO telah berjaya diadakan . Dalam sesi "Amalan Terbaik MLOps" yang diadakan pada persidangan itu, Naib Pengerusi TOC Yayasan Atom Terbuka Tan Zhongyi, Arkitek Sistem Paradigma Keempat Lu Mian, Penyelidik Kepintaran Buatan Muzik Awan NetEase Wu Guanlin, Pusat Pembangunan Perisian Bank Perindustrian dan Komersial China Data Besar dan Kecerdasan Buatan Huang Bing, timbalan pengarah makmal, memberikan ucaptama sendiri dan membincangkan pertempuran sebenar MLOps mengenai topik hangat seperti kitaran operasi R&D, latihan berterusan dan pemantauan berterusan, versi model dan keturunan, ketekalan data dalam talian dan luar talian, dan bekalan data yang cekap dan trend terkini.
Andrew NG telah banyak kali menyatakan bahawa AI telah beralih daripada berpusat model kepada berpusatkan data, dan data merupakan cabaran terbesar untuk pelaksanaan daripada AI. Cara memastikan bekalan data yang berkualiti tinggi adalah isu utama Untuk menyelesaikan masalah ini, kita perlu menggunakan amalan MLOps untuk membantu AI melaksanakan dengan cepat, mudah dan kos efektif.
Jadi, apakah masalah yang MLOps selesaikan? Bagaimana untuk menilai kematangan projek MLOps? Tan Zhongyi, Naib Pengerusi Open Atomic Foundation TOC dan ahli LF AI & Data TAC, memberikan ucaptama "Daripada model sentrik kepada data centric - MLOps membantu AI dilaksanakan dengan cepat, mudah dan kos efektif", yang diperkenalkan pada terperinci.
Tan Zhongyi pertama kali berkongsi pandangan sekumpulan saintis industri dan penganalisis. Andrew NG percaya bahawa meningkatkan kualiti data boleh meningkatkan keberkesanan pelaksanaan AI lebih daripada menambah baik algoritma model Pada pandangannya, tugas paling penting MLOps adalah untuk sentiasa mengekalkan bekalan data berkualiti tinggi pada semua peringkat kitaran hayat pembelajaran mesin.
Untuk mencapai pelaksanaan AI berskala besar, MLOps mesti dibangunkan. Mengenai apa sebenarnya MLOps, tidak ada konsensus dalam industri Dia memberikan penjelasannya sendiri: ia adalah "integrasi berterusan, penggunaan berterusan, latihan berterusan dan pemantauan berterusan kod + model + data."
Kemudian, Tan Zhongyi menumpukan pada ciri-ciri Feature Store (Feature Platform), platform unik dalam bidang pembelajaran mesin, serta sebagai ciri arus perdana di pasaran pada masa ini.
Akhir sekali, Tan Zhongyi menghuraikan secara ringkas model kematangan MLOps. Beliau menyebut bahawa Microsoft Azure membahagikan model matang MLOps kepada beberapa tahap (0, 1, 2, 3, 4) mengikut tahap automasi keseluruhan proses pembelajaran mesin, di mana 0 bermaksud tiada automasi dan 123 bermaksud Automasi, 4 adalah tahap automasi yang tinggi.
Dalam banyak senario pembelajaran mesin, terdapat keperluan untuk pengiraan ciri masa nyata. Daripada skrip ciri yang dibangunkan di luar talian oleh saintis data kepada pengiraan ciri masa nyata dalam talian, kos pelaksanaan AI adalah sangat tinggi.
Sebagai tindak balas kepada titik kesakitan ini, Lu Mian, arkitek sistem 4Paradigm, pasukan pangkalan data dan ketua pasukan pengkomputeran berprestasi tinggi, memberikan ucaptama "Pangkalan Data Pembelajaran Mesin Sumber Terbuka OpenMLDB: Konsisten Dalam Talian dan Luar Talian "Platform Ciri Tahap Pengeluaran" memfokuskan pada cara OpenMLDB mencapai matlamat pembangunan ciri pembelajaran mesin diletakkan dalam talian serta-merta, dan cara memastikan ketepatan dan kecekapan pengiraan ciri.
Lu Mian menegaskan bahawa dengan kemajuan pelaksanaan kejuruteraan kecerdasan buatan, dalam proses kejuruteraan ciri, pengesahan konsisten dalam talian telah membawa kos pelaksanaan yang tinggi. OpenMLDB menyediakan penyelesaian sumber terbuka kos rendah Ia bukan sahaja menyelesaikan masalah teras - ketekalan pembelajaran mesin dalam talian dan luar talian, menyelesaikan masalah ketepatan, tetapi juga mencapai pengiraan ciri masa nyata peringkat milisaat. Ini adalah nilai terasnya.
Menurut Lu Mian, syarikat pembayaran dalam talian Indonesia, Akulaku ialah pengguna perusahaan komuniti pertama OpenMLDB sejak ia adalah sumber terbuka Mereka telah menyepadukan OpenMLDB ke dalam seni bina pengkomputeran pintar mereka. Dalam perniagaan sebenar, Akulaku memproses hampir 1 bilion data pesanan sehari secara purata Selepas menggunakan OpenMLDB, kelewatan pemprosesan datanya hanya 4 milisaat, yang memenuhi sepenuhnya keperluan perniagaan mereka.
Bergantung pada data besar NetEase Cloud Music, algoritma tepat dan sistem masa nyata, ia menyediakan pelbagai senario pengedaran dan pengkomersilan kandungan, sementara memenuhi kedua-dua keperluan pemodelan Satu siri usaha kejuruteraan algoritma termasuk kecekapan tinggi, halangan rendah untuk digunakan dan kesan model yang ketara Untuk tujuan ini, Pasukan Kejuruteraan Algoritma Muzik Awan NetEase telah memulakan pelaksanaan praktikal platform pembelajaran mesin hujung ke hujung. sempena perniagaan muzik.
Wu Guanlin, penyelidik kecerdasan buatan dan pengarah teknikal NetEase Cloud Music, memberikan ucaptama "Amalan Teknikal Platform Ciri Muzik Awan NetEase", bermula dari latar belakang perniagaan muzik awan, menerangkan pelaksanaan masa nyata model Pelan itu, digabungkan dengan Kedai Ciri, terus berkongsi pemikirannya dengan para peserta.
Wu Guanlin menyebut bahawa dalam pembinaan projek algoritma model muzik awan, terdapat tiga masalah utama: tahap masa nyata yang rendah, kecekapan pemodelan rendah dan keupayaan model terhad disebabkan oleh dalam talian dan ketidakkonsistenan luar talian. Sebagai tindak balas kepada titik kesakitan ini, mereka bermula daripada model masa nyata dan membina platform Gedung Ciri yang sepadan dalam proses model yang meliputi perniagaan dalam masa nyata.
Wu Guanlin memperkenalkan bahawa mereka mula-mula meneroka model masa nyata dalam senario siaran langsung dan mencapai hasil tertentu. Dari segi kejuruteraan, pautan lengkap juga telah diterokai dan beberapa pembinaan kejuruteraan asas telah dilaksanakan. Walau bagaimanapun, model masa nyata memfokuskan pada penalaan halus senario masa nyata, tetapi lebih daripada 80% senario adalah model luar talian. Dalam proses pemodelan pautan penuh, setiap pembangun senario bermula dari asal data, yang membawa kepada masalah seperti kitaran pemodelan yang panjang, kesan yang tidak dapat diramalkan dan ambang pembangunan yang tinggi untuk orang baru. Memandangkan kitaran pelancaran model, 80% masa adalah berkaitan dengan data, yang mana cirinya menyumbang sehingga 50%. Mereka mula mencetuskan Stor Ciri platform ciri.
Stor Ciri terutamanya menyelesaikan tiga masalah: Pertama, tentukan metadata, menyatukan keturunan ciri, pengiraan dan proses tolak, dan laksanakan berasaskan aliran kumpulan An pautan pengeluaran ciri bersepadu dan cekap; yang kedua ialah mengubah ciri ciri untuk menyelesaikan masalah penyimpanan ciri, dan menyediakan pelbagai jenis enjin storan mengikut perbezaan kependaman dan daya pengeluaran dalam senario penggunaan sebenar; ketekalan ciri , membaca data dalam format tertentu daripada API bersatu sebagai input kepada model pembelajaran mesin untuk inferens, latihan, dsb.
Huang Bing, timbalan pengarah Big Data dan Makmal Kepintaran Buatan Pusat Pembangunan Perisian Bank Perindustrian dan Komersial China, menyampaikan ucaptama "Membina Sistem Kewangan yang Teguh" "Infrastruktur Kecerdasan Buatan Baharu untuk Inovasi dan Pembangunan Pintar" memfokuskan pada amalan MLOps ICBC, meliputi proses pembinaan dan amalan teknikal sistem pengurusan kitaran hayat penuh pembangunan model, model penghantaran, pengurusan model dan operasi lelaran model.
Sebab mengapa MLOps diperlukan adalah kerana di sebalik perkembangan pesat kecerdasan buatan, banyak "hutang teknikal AI" sedia ada atau berpotensi tidak boleh diabaikan. Huang Bing percaya bahawa konsep MLOps boleh menyelesaikan hutang teknikal ini "Jika DevOps ialah alat untuk menyelesaikan masalah hutang teknikal sistem perisian, dan DataOps adalah kunci untuk membuka kunci masalah hutang teknikal aset data, maka MLOps, iaitu. lahir daripada konsep DevOps, ialah mesin rawatan." Pelajari penawar untuk masalah hutang teknikal anda."
Semasa proses pembinaan, pengalaman praktikal MLOps ICBC boleh diringkaskan kepada empat perkara: menyatukan "asas" keupayaan awam, membina pusat data peringkat perusahaan, dan merealisasikan pemendakan data dan perkongsian; mengurangkan Gunakan "alat" ambang untuk membina pemodelan dan rangkaian pemasangan perkhidmatan untuk membentuk model R&D pemasangan berasaskan proses dan binaan mewujudkan "kaedah" untuk pengumpulan dan perkongsian aset AI untuk meminimumkan kos AI pembinaan dan membentuk perkongsian dan dibina bersama Kunci kepada ekologi adalah untuk membentuk "teknik" lelaran operasi model dan mewujudkan sistem operasi model berdasarkan data dan nilai perniagaan Ini adalah asas untuk lelaran berterusan dan penilaian kuantitatif kualiti model .
Pada akhir ucapan, Huang Bing membuat dua pandangan: Pertama, MLOps perlu lebih selamat dan lebih patuh. Pada masa hadapan, pembangunan perusahaan akan memerlukan banyak model untuk mencapai pembuatan keputusan pintar dipacu data, yang akan membawa kepada lebih banyak keperluan peringkat perusahaan yang berkaitan dengan pembangunan model, operasi dan penyelenggaraan, kawalan kebenaran, privasi data, keselamatan dan pengauditan; kedua, MLOps Perlu digabungkan dengan Ops lain. Menyelesaikan masalah hutang teknikal ialah satu proses yang rumit Penyelesaian DevOps, penyelesaian DataOps dan penyelesaian MLOps mesti diselaraskan dan saling berkaitan untuk memperkasakan satu sama lain untuk memberikan permainan sepenuhnya kepada semua kelebihan ketiga-tiga dan mencapai kesan "1+1+. 1>3".
Menurut ramalan IDC, 60% daripada perusahaan akan menggunakan MLOps untuk melaksanakan aliran kerja pembelajaran mesin menjelang 2024. Penganalisis IDC Sriram Subramanian pernah mengulas: "MLOps mengurangkan kelajuan model kepada beberapa minggu - kadangkala berhari-hari, sama seperti menggunakan DevOps untuk mempercepatkan purata masa untuk membina aplikasi. Itulah sebabnya anda memerlukan MLOps." Pada masa ini, kita berada pada titik perubahan perkembangan pesat kecerdasan buatan. Dengan mengguna pakai MLOps, perusahaan boleh membina lebih banyak model, mencapai inovasi perniagaan dengan lebih pantas dan mempromosikan pelaksanaan AI dengan lebih cepat dan menjimatkan kos. Beribu-ribu industri menyaksikan dan mengesahkan fakta bahawa MLOps menjadi pemangkin untuk skala AI perusahaan. Untuk kandungan yang lebih menarik, sila klik untuk melihat .
Atas ialah kandungan terperinci Untuk meneroka jalan ke pelaksanaan MLOps perusahaan, Persidangan Teknologi Kecerdasan Buatan Global AISummit 'Amalan Terbaik MLOps' telah berjaya diadakan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!