Rumah > Artikel > Peranti teknologi > Sepuluh repositori GitHub untuk AutoML
Terobosan dalam kecerdasan buatan dan pembelajaran mesin ialah dua topik paling menarik sepanjang dua dekad yang lalu. Jurutera pembelajaran mesin dan sains data memerlukan penyelidikan yang meluas dan kerja keras untuk memahami dan menjalankan model mereka dengan berkesan.
Walaupun ia mungkin berbeza bagi setiap orang, langkah pembelajaran mesin tradisional termasuk:
Walaupun 8 langkah mungkin kelihatan tidak seberapa apabila membina model pembelajaran mesin, bermula dengan langkah di atas akan mengambil sedikit masa untuk disempurnakan!
Masalah semakin meruncing apabila pengamal pembelajaran mesin bukan pakar melalui langkah-langkah ini buat kali pertama proses ini selalunya mengambil lebih banyak masa dan sumber untuk diselesaikan, dan walaupun begitu, hasil akhirnya mungkin tidak seperti yang diharapkan.
AutoML berguna dengan mengautomasikan kebanyakan proses penciptaan model untuk pakar dan bukan pakar.
Pembelajaran mesin automatik, sering dipanggil AutoML, menjadikan pembelajaran mesin lebih mudah. AutoML menjadikan pembelajaran mesin lebih mudah diakses oleh pakar pembelajaran bukan mesin menggunakan pemprosesan automatik yang dilakukan oleh rangka kerja tertentu.
Ia memfokuskan pada mempercepatkan penyelidikan kecerdasan buatan dan meningkatkan kecekapan model pembelajaran mesin.
Proses pembelajaran mesin tradisional memfokuskan pada kesemua 8 langkah yang dinyatakan sebelum ini, manakala AutoML meliputi dua langkah:
Rangka kerja penerokaan data, penyediaan data, kejuruteraan ciri, pemilihan model, latihan model dan penalaan model akhir akan meliputi 6 langkah lain.
Sekarang kita telah membincangkan apa itu AutoML dan memahami beberapa kelebihannya, kami akan merangkumi 10 rangka kerja AutoML teratas, tempat untuk mencarinya dan fungsi yang ditawarkannya.
Google AutoML ialah salah satu rangka kerja paling terkenal yang tersedia dan menduduki tempat pertama dalam senarai kami. Google telah melancarkan banyak rangka kerja AutoML, seperti Google AutoML vision, Google AutoML Natural Language, dsb.
Pengguna yang pernah didedahkan kepada pembelajaran mesin sebelum ini mungkin biasa dengan nama SKlearn. Sebagai tambahan kepada pustaka sci-kit-learn yang popular, Auto SKLearn ialah rangka kerja pembelajaran mesin sumber terbuka yang mengendalikan automasi tugas pembelajaran mesin.
Rangka kerja Auto Sklearn dapat melaksanakan pemilihan model, penalaan hiperparameter dan penciriannya, yang merupakan ciri unik rangka kerja Auto SKlearn.
Dengan melakukan pemilihan model, Auto SKlearn secara automatik akan mencari algoritma terbaik yang boleh menangani masalah yang diberikan oleh pengguna.
Beralih ke ciri kedua Auto SKlearn, kami mempunyai penalaan hiperparameter. Sebagai salah satu langkah terakhir untuk mana-mana mesin atau model pembelajaran mendalam, pengguna harus mencari parameter model terbaik untuk mengoptimumkan hasil. Tugasan ini memerlukan banyak masa dan boleh diautomasikan dengan mudah melalui rangka kerja tersebut.
Faedah unik dan muktamad menggunakan Auto SKlearn ialah keupayaannya untuk melaksanakan pencirian automatik. Perwakilan ialah proses menukar data mentah kepada maklumat yang boleh digunakan.
TPOT, juga dikenali sebagai Tree Pipeline Optimization Tool, ialah salah satu pakej perisian autoML sumber terbuka python yang terawal. Ia memberi tumpuan kepada mengoptimumkan saluran paip pembelajaran mesin menggunakan pengaturcaraan genetik.
Matlamat utama TPOT adalah untuk membina saluran paip ML secara automatik dengan menggabungkan perwakilan pepohon ekspresi fleksibel bagi saluran paip dengan algoritma carian stokastik seperti pengaturcaraan genetik.
Sila ambil perhatian bahawa TPOT berfungsi di atas pustaka sci-kit-learn yang mesti dipasang terlebih dahulu.
AutoKeras ialah perpustakaan sumber terbuka yang dibina untuk AutoML dan model pembelajaran mendalam, yang pada asalnya dibangunkan oleh DATA Labs.
Auto Keras membantu mesin bukan pakar dan peminat pembelajaran mendalam menjalankan dan melatih model mereka dengan usaha yang minimum. Auto Keras bertujuan menjadikan pembelajaran mesin boleh diakses oleh semua orang dan merupakan alat yang hebat untuk pemula
Ludwig ialah rangka kerja autoML sumber terbuka yang memfokuskan pada memasang dan melatih model pembelajaran mendalam menggunakan sistem fail konfigurasi mudah.
Dengan membenarkan pengguna menyediakan fail konfigurasi yang mentakrifkan input dan output model tertentu dan jenis data masing-masing, rangka kerja Ludwig akan memanfaatkan data ini untuk membina model pembelajaran mendalamnya berdasarkan sifat yang dinyatakan sebelum ini.
MLBOX semakin meningkat dan pantas menjadi salah satu alatan rangka kerja pembelajaran mesin automatik teratas.
Menurut dokumentasi rasmi MLBOX, ia menyediakan faedah berikut:
AutoGlounDitujukan kepada pengamal pembelajaran mesin pakar dan bukan pakar, memfokuskan pada penyepaduan tindanan automatik, pembelajaran mendalam dan aplikasi dunia Nyata daripada data jadual.
Menurut dokumentasi dalam talian AutoGloun, AutoGLoun membolehkan pengguna untuk:
Microsoft Neural Network Intelligence , juga dikenali sebagai NNI, ialah kit alat yang direka untuk pembelajaran mendalam Automate feature engineering , carian seni bina saraf, penalaan hiperparameter dan pemampatan model.
Alat NNI menyokong PyTorch, TensorFlow, Scikit-learn, XGBoost, LightGBM dan rangka kerja lain. Faedah utama menggunakan Rangkaian Neural Microsoft ialah carian seni bina saraf, alat NNI menyokong pelbagai jejak (carian grid, evolusi teratur, IRL berasaskan dasar, dll.) dan satu pukulan (DARTS, ENAS FBNet, dll.) carian seni bina saraf. .
Alat ini menyediakan pelbagai algoritma penalaan hiperparameter, seperti pengoptimuman Bayesian, carian menyeluruh dan carian heuristik. Lihat fail README NNI di Github untuk mengetahui lebih lanjut tentang perkara lain yang ditawarkan oleh alat ini.
TransmogrifAI direka untuk membantu pembangun meningkatkan produktiviti pembelajaran mesin. TransmogrifAI berjalan pada Apache Spark.
Seperti yang dinyatakan secara ringkas dalam Github readme pada Transmogrif, "Dengan automasi, ia boleh mencapai ketepatan hampir dengan penalaan model secara manual, dan dalam masa hampir 100x lebih sedikit." >Seperti rangka kerja autoML lain yang dinyatakan, alat TransmogrifAI mampu memilih algoritma terbaik untuk set data yang dipilih pengguna.
10. Pembelajaran Mesin Automatik H2OIa juga menyokong algoritma statistik dan pembelajaran mesin yang paling banyak digunakan, termasuk mesin penggalak kecerunan, model linear umum dan pembelajaran mendalam.
Antara muka autoML H2O menampung pengguna pembelajaran mesin baharu dengan memerlukan seberapa sedikit parameter yang mungkin. Tugas utama pengguna apabila menggunakan alat H2O adalah untuk menyediakan set data. Alat AutoML Berguna Lain1. HypertunityHypertunity menyokong pengoptimuman Bayesian menggunakan GPyOpt, penjadual serasi Slurm dan visualisasi masa nyata menggunakan Tensorboard (melalui pemalam HParams).
2. DragonflyPengoptimuman Bayesian digunakan untuk menilai fungsi kotak hitam yang sangat mahal melebihi pengoptimuman biasa.
Dragonfly membenarkan pengguna baharu menyelesaikan ralat pengoptimuman Bayesian berskala dengan pengetahuan minimum. 3. Ray TuneSebagai alat pengoptimuman hiperparameter kedua kami,Ia membolehkan penskalaan beban kerja AI yang mudah melalui pemprosesan data teragih, latihan teragih, penalaan hiperparameter boleh skala, pembelajaran tetulang boleh skala dan perkhidmatan boleh atur cara boleh skala.
Pembelajaran Graf Automatik ialah rangka kerja autoML unik yang memfokuskan pada pembelajaran mesin bagi set data graf, sangat mudah dan ringkas.
Mereka menggunakan set data untuk mengekalkan set data bagi pembelajaran mesin berasaskan graf berdasarkan Pytorch Geometric atau Set Data daripada Perpustakaan Graf Dalam.
Dengan kemajuan dalam bidang mesin dan pembelajaran mendalam, keperluan untuk pakar pembelajaran mesin telah meningkat dengan ketara tanpa ditangani.
Di sinilah automasi alatan dan teknik pembelajaran mesin masuk, membolehkan pengguna baharu membina model yang berfungsi sepenuhnya dan sangat dioptimumkan dengan lebih mudah berbanding sebelum ini.
Ringkasnya, apabila mencari alat pembelajaran mesin automatik yang sempurna, anda harus menumpukan pada perkara yang anda cuba capai dengan model tertentu dan bahagian tepat proses pembelajaran mesin yang ingin anda automasi. Kami mengesyorkan agar anda mencuba sendiri beberapa alatan autoML di atas dan hanya menggunakan alat yang anda rasa cekap dan mudah digunakan.
Atas ialah kandungan terperinci Sepuluh repositori GitHub untuk AutoML. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!