Rumah >Peranti teknologi >AI >Bagaimana untuk mereka bentuk penderia lembut melalui algoritma pembelajaran mesin?
Dengan memahami keupayaan algoritma pembelajaran mesin, jurutera boleh menjana penderia lembut yang berkesan untuk aplikasi mereka.
Penderia lembut, juga dikenali sebagai penderia maya, ialah perisian yang boleh memproses ratusan data ukuran secara menyeluruh. Pengurus kilang yang ingin menambah penderia lembut mungkin keliru dengan skop pembelajaran mesin yang berfungsi dengan penderia lembut. Walau bagaimanapun, penyelaman yang lebih mendalam ke dalam subjek mendedahkan bahawa terdapat beberapa algoritma teras yang mendasari kebanyakan reka bentuk sensor lembut.
Pemilihan, latihan dan pelaksanaan model ini selalunya menjadi tugas saintis data, tetapi pengurus loji dan pakar operasi lain juga akan mahu membiasakan diri dengan keupayaan mereka.
Penderia lembut dicipta dalam persekitaran perisian tetapi boleh memberikan faedah yang sama seperti rakan sejawatnya di dunia sebenar. Dalam sesetengah kes, penderia lembut mungkin diutamakan berbanding penderia sebenar.
Terdapat banyak sebab mengapa pakar operasi dan saintis data harus bekerjasama untuk mereka bentuk penderia. Satu sebab ialah keinginan untuk pengukuran masa nyata atau hampir masa nyata bagi parameter utama yang diperlukan untuk hasil tertentu. Pengukuran ini penting untuk meningkatkan prestasi keseluruhan.
Kes penggunaan lain untuk sensor lembut termasuk:
Dalam amalan pembelajaran mesin, corak kitaran sering diikuti. Pertama, data disediakan dan dibersihkan. Seterusnya, saintis data akan memilih algoritma untuk dijadikan asas model. Ahli sains data kemudiannya akan mula melatih model menggunakan siri masa dan data kontekstual yang tidak diproses atau dipraproses. Akhirnya, model diuji dan digunakan. Kemudian, kitar semula untuk menambah baik model.
Secara umumnya, terdapat dua jenis model utama untuk dipilih:
Di antara model ini, model yang diselia ialah pilihan yang lebih baik untuk membangunkan penderia lembut atau mencipta label ramalan. Walaupun terdapat ratusan model pembelajaran mesin yang diselia, hanya beberapa—dari kelas yang dipanggil algoritma regresi—berguna untuk mencipta penderia lembut. Berikut ialah penerangan bagi setiap model:
Ini adalah salah satu cara yang paling berguna dan paling mudah untuk mencipta penderia lembut. Walau bagaimanapun, beberapa prosedur, seperti mengukur kelikatan polimer, adalah terlalu kompleks untuk regresi linear. Algoritma ini menjana fungsi yang meramalkan nilai pembolehubah sasaran. Ia adalah fungsi yang merupakan gabungan linear bagi satu set satu atau lebih pembolehubah. Apabila satu pembolehubah digunakan, ia dipanggil regresi linear univariat. Pembolehubah berbilang memberikannya nama regresi linear berganda. Faedah menggunakan model ini ialah kejelasannya. Mudah untuk menentukan pembolehubah yang mempunyai kesan terbesar pada matlamat anda. Ini dipanggil kepentingan ciri.
Secara teorinya, pepohon keputusan boleh mempunyai seberapa banyak peraturan dan cawangan yang mereka perlukan untuk memuatkan data. Mereka menggunakan peraturan ini daripada pembolehubah bebas, yang dipanggil set ciri. Hasilnya ialah anggaran berterusan sekeping bagi nilai sasaran. Kerana mereka boleh mempunyai banyak peraturan dan cawangan, mereka boleh menjadi sangat fleksibel.
Sebaliknya, mereka juga menghadapi risiko terlebih memasang data. Overfitting berlaku apabila model dilatih terlalu lama. Ini membolehkan model mula menyesuaikan diri dengan bunyi dalam set data dan mula merawatnya seperti biasa. Kekurangan data juga boleh berlaku. Dalam kes ini, algoritma tidak dilatih cukup lama dan oleh itu tidak mempunyai data yang mencukupi untuk menentukan cara pembolehubah bebas mungkin berkaitan dengan pembolehubah sasaran, atau kesan yang mungkin ada pada pembolehubah sasaran.
Data overfitting dan underfitting akan menyebabkan model gagal. Model ini tidak lagi boleh mengendalikan data baharu dan tidak boleh digunakan dengan penderia lembut. Konsep overfitting dan underfitting data bukanlah unik kepada model pepohon keputusan.
Ini pada asasnya adalah gabungan beberapa model pepohon keputusan dalam satu model. Ia memberikan lebih fleksibiliti, membolehkan lebih banyak ciri dan memberikan kuasa ramalan yang lebih besar. Walau bagaimanapun, ia juga membawa risiko yang tinggi untuk overfitting data.
Dalam pembelajaran mesin, gradient boosting selalunya dipanggil model ensemble. Seperti Random Forest, Gradient Boosting menggabungkan berbilang pokok keputusan. Tetapi apa yang menjadikannya berbeza ialah ia mengoptimumkan setiap pokok untuk meminimumkan fungsi kehilangan yang dikira terakhir. Model ini boleh menjadi sangat berkesan, tetapi lama kelamaan ia menjadi lebih sukar untuk ditafsirkan.
Apa yang dipanggil pembelajaran mendalam ialah konsep model regresi rangkaian saraf. Model ini menerima pembolehubah input dan, apabila digunakan pada masalah regresi, menghasilkan nilai untuk pembolehubah sasaran. Rangkaian saraf yang paling asas ialah perceptron berbilang lapisan. Dalam model ini, hanya satu susunan neuron digunakan. Lebih biasa, rangkaian saraf akan mempunyai lapisan input, satu atau lebih lapisan tersembunyi (masing-masing mempunyai banyak neuron), dan lapisan output untuk mendapatkan nilai.
Nilai input berwajaran dalam setiap neuron dalam lapisan tersembunyi dijumlahkan dan melalui fungsi pengaktifan (seperti fungsi Sigmoid). Fungsi ini menjadikan model tidak linear. Sebaik sahaja fungsi itu melalui model, ia mencapai lapisan keluaran, yang mengandungi satu neuron. Apabila melatih model, tentukan berat dan berat sebelah yang paling sesuai dengan ciri dan nilai sasaran.
Bagi mereka yang baru dalam reka bentuk, salah tanggapan biasa ialah terdapat satu model yang sesuai yang sesuai dengan semua keperluan khusus. Tetapi sebenarnya, ia tidak. Memilih satu model berbanding model lain adalah keputusan yang kompleks berdasarkan sebahagiannya pada pengalaman saintis data.
Selain itu, model regresi yang diselia ini tidak akan menghasilkan keputusan yang sama setiap kali. Oleh itu, tidak ada model "terbaik", tetapi sesetengah model mungkin lebih sesuai untuk situasi tertentu.
Kerjasama antara saintis data dan pakar operasi dalam mana-mana latihan pembelajaran mesin bermula dengan pemahaman bersama tentang parameter yang terlibat, penggunaan sasaran, pembangunan dan kaedah penggunaan.
Atas ialah kandungan terperinci Bagaimana untuk mereka bentuk penderia lembut melalui algoritma pembelajaran mesin?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!