Rumah > Artikel > Peranti teknologi > Kaedah pembelajaran sifar pukulan untuk memetakan hubungan kategori yang tidak diketahui
Zero-shot Learning (ZSL) ialah tugas pembelajaran mesin yang baru muncul. Matlamatnya adalah untuk mengklasifikasikan kategori yang tidak diketahui dengan mempelajari hubungan pemetaan antara kategori yang diketahui dan kategori yang tidak diketahui. Berbanding dengan tugas pembelajaran tradisional yang diselia, pembelajaran sifar pukulan tidak memerlukan mendapatkan kategori data yang tidak diketahui terlebih dahulu semasa fasa latihan. Ia mencapai klasifikasi kategori yang tidak diketahui dengan mempelajari hubungan semantik antara kategori yang diketahui dan kategori yang tidak diketahui, membuat kesimpulan sifat-sifat kategori yang tidak diketahui dan kedudukannya dalam ruang ciri. Kelebihan kaedah ini ialah ia boleh mengendalikan kategori yang tidak diketahui, memberikan model keupayaan generalisasi yang lebih baik.
Pembelajaran sifar pukulan adalah teknologi yang digunakan secara meluas, terutamanya dalam bidang pemprosesan bahasa semula jadi dan penglihatan komputer. Dalam pemprosesan bahasa semula jadi, pembelajaran sifar pukulan boleh digunakan untuk mengendalikan tugas seperti klasifikasi perkataan baharu dan analisis sentimen. Dalam penglihatan komputer, pembelajaran sifar tangkapan boleh digunakan untuk tugas seperti pengecaman objek baharu dan pemahaman pemandangan. Dengan pembangunan berterusan teknologi pembelajaran mendalam, pembelajaran sifar pukulan telah menjadi hala tuju penyelidikan yang telah menarik banyak perhatian.
Cabaran teras pembelajaran sifar pukulan ialah mempelajari cara memetakan kategori yang diketahui kepada kategori yang tidak diketahui. Kaedah biasa adalah untuk mempelajari hubungan pemetaan antara kategori yang diketahui dan ruang semantik, dan kemudian menggunakan fungsi ukuran persamaan dalam ruang semantik untuk memetakan kategori yang tidak diketahui kepada kedudukan dalam ruang semantik. Ruang semantik biasanya terdiri daripada atribut semantik yang diekstrak daripada pangkalan pengetahuan sedia ada, seperti hubungan leksikal dalam WordNet, hubungan entiti dalam graf pengetahuan, dsb. Pendekatan ini membolehkan kita menyimpulkan sifat dan ciri kategori yang tidak diketahui tanpa pengetahuan terdahulu, sekali gus memanjangkan keupayaan pembelajaran kita. Dengan mewujudkan hubungan pemetaan yang tepat dalam ruang semantik, kami boleh memahami dan memproses kategori data yang tidak diketahui dengan lebih baik.
Secara khusus, proses pembelajaran zero-shot boleh dibahagikan kepada langkah-langkah berikut:
1) Dapatkan data kategori yang diketahui
Dalam fasa latihan, dapatkan data nyatakan kategori mereka dan ekstrak . Ciri ini boleh menjadi ciri rekaan tangan atau ciri yang dipelajari daripada data mentah menggunakan model pembelajaran mendalam.
2) Bina ruang semantik
Ekstrak atribut semantik daripada pangkalan pengetahuan sedia ada dan bentukkannya menjadi ruang semantik. Sebagai contoh, dalam pemprosesan bahasa semula jadi, anda boleh menggunakan perhubungan dalam WordNet untuk membina ruang semantik dalam penglihatan komputer, anda boleh menggunakan perhubungan entiti dalam graf pengetahuan untuk membina ruang semantik;
3) Ketahui hubungan pemetaan daripada kategori yang diketahui kepada ruang semantik
Gunakan data kategori yang diketahui dan perwakilan cirinya untuk mempelajari hubungan pemetaan daripada kategori yang diketahui kepada ruang semantik. Ini boleh dicapai dengan melatih pengelas supaya jarak dalam ruang semantik keluaran pengelas paling sesuai dengan atribut semantik kategori yang diketahui.
4) Petakan kategori yang tidak diketahui kepada kedudukan dalam ruang semantik
Gunakan fungsi ukuran persamaan dalam ruang semantik untuk memetakan kategori yang tidak diketahui kepada kedudukan dalam ruang semantik. Ini boleh dicapai dengan mengira jarak antara kategori yang tidak diketahui dan kategori yang diketahui dalam ruang semantik dan memilih kategori yang paling hampir diketahui.
5) Pengelasan
Gunakan pengelas bagi kategori yang diketahui untuk membuat ramalan pengelasan berdasarkan kedudukan kategori yang tidak diketahui dalam ruang semantik.
Perlu diingatkan bahawa pembelajaran sifar pukulan tidak bermakna tiada data latihan sama sekali, tetapi hanya menggunakan data kategori yang diketahui semasa fasa latihan. Oleh itu, kejayaan pembelajaran sifar pukulan bergantung kepada kualiti dan kuantiti kategori yang diketahui. Jika kualiti dan kuantiti kelas yang diketahui cukup baik, pembelajaran sifar pukulan boleh mencapai klasifikasi yang tepat bagi kelas yang tidak diketahui.
Dalam aplikasi praktikal, pembelajaran zero-shot juga menghadapi beberapa cabaran, seperti:
1 Perbezaan antara asas pengetahuan dalam bidang yang berbeza: Atribut semantik dalam pangkalan pengetahuan dalam bidang yang berbeza mungkin sangat berbeza akan menjejaskan prestasi pembelajaran sifar pukulan.
2. Pemilihan dan gabungan atribut semantik: Pemilihan dan gabungan atribut semantik mempunyai kesan yang besar terhadap prestasi pembelajaran sifar pukulan, tetapi tiada jawapan yang jelas tentang cara memilih dan menggabungkan atribut semantik.
3 Masalah jarang data: Dalam aplikasi praktikal, data kategori yang tidak diketahui selalunya sangat jarang, yang akan menjejaskan ketepatan pembelajaran sifar pukulan.
4 Keupayaan generalisasi pembelajaran sifar pukulan: Pembelajaran sifar pukulan perlu mempelajari sifat-sifat kategori yang tidak diketahui daripada kategori yang diketahui terhad, tetapi bagaimana untuk memastikan bahawa atribut yang dipelajari boleh digeneralisasikan kepada kategori yang tidak diketahui masih menjadi persoalan terbuka. soalan.
Pada masa hadapan, dengan perkembangan berterusan teknologi pembelajaran mendalam, pembelajaran sifar pukulan akan digunakan dengan lebih meluas. Pada masa yang sama, penyelidik juga perlu meneroka lebih lanjut bagaimana untuk menyelesaikan cabaran yang dihadapi dalam pembelajaran sifar pukulan untuk meningkatkan ketepatan dan keupayaan generalisasi pembelajaran sifar pukulan.
Atas ialah kandungan terperinci Kaedah pembelajaran sifar pukulan untuk memetakan hubungan kategori yang tidak diketahui. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!