Rumah >Peranti teknologi >AI >Menganalisis definisi dan kepentingan pembelajaran sifar pukulan (ZSL)

Menganalisis definisi dan kepentingan pembelajaran sifar pukulan (ZSL)

WBOY
WBOYke hadapan
2024-01-22 19:00:121135semak imbas

Menganalisis definisi dan kepentingan pembelajaran sifar pukulan (ZSL)

Pembelajaran sifar pukulan (ZSL) ialah paradigma pembelajaran mesin yang menggunakan model pembelajaran mendalam yang telah terlatih untuk menyamaratakan sampel kepada kategori baharu. Idea terasnya adalah untuk memindahkan pengetahuan dalam contoh latihan sedia ada kepada tugas klasifikasi contoh ujian. Secara khusus, teknik pembelajaran sifar pukulan meramalkan data baharu dengan mempelajari lapisan semantik perantaraan dan atribut dan kemudian menggunakan pengetahuan ini semasa inferens. Kaedah ini membolehkan model pembelajaran mesin mengklasifikasikan pada kategori yang belum pernah dilihat sebelum ini, mencapai keupayaan untuk mengenal pasti kategori yang tidak diketahui. Melalui pembelajaran sifar pukulan, model boleh memperoleh keupayaan generalisasi yang lebih luas daripada data latihan yang terhad, meningkatkan kebolehsuaiannya kepada masalah baharu dalam dunia sebenar.

Perlu diingatkan bahawa set latihan dan ujian adalah bercabang dalam pembelajaran sifar pukulan.

Pembelajaran sifar pukulan ialah subbidang pembelajaran pemindahan, yang digunakan terutamanya dalam situasi di mana ruang ciri dan label berbeza sama sekali. Tidak seperti pembelajaran pemindahan isomorfik biasa, pembelajaran sifar pukulan adalah lebih daripada sekadar menyempurnakan model pra-latihan Ia memerlukan pembelajaran cara menangani masalah baharu tanpa sebarang sampel. Matlamat pembelajaran sifar pukulan adalah untuk menggunakan pengetahuan dan pengalaman sedia ada untuk memindahkan pengetahuan ini ke kawasan baharu untuk menyelesaikan masalah baharu. Pembelajaran pemindahan heterogen ini sangat berguna untuk menangani situasi di mana tiada atau sedikit label, kerana ia boleh melakukan ramalan dan pengelasan dengan memanfaatkan maklumat label sedia ada. Oleh itu, pembelajaran sifar pukulan mempunyai potensi besar untuk memainkan peranan penting dalam banyak aplikasi dunia sebenar.

Klasifikasi data pembelajaran sifar pukulan

Kelas Dilihat: Kelas data yang digunakan untuk melatih model pembelajaran mendalam, seperti data latihan berlabel.

Kelas Ghaib: Kelas data yang perlu digeneralisasikan oleh model dalam sedia ada, seperti data latihan tidak berlabel.

Maklumat tambahan: Memandangkan tiada contoh berlabel milik kelas ghaib tersedia, beberapa maklumat tambahan diperlukan untuk menyelesaikan masalah pembelajaran sifar. Maklumat tambahan tersebut hendaklah merangkumi semua kelas maklumat yang tidak kelihatan.

Pembelajaran sifar pukulan juga bergantung pada set latihan berlabel kelas yang boleh dilihat dan tidak kelihatan. Kedua-dua kelas yang kelihatan dan tidak kelihatan adalah berkaitan dalam ruang vektor berdimensi tinggi yang dipanggil ruang semantik, di mana pengetahuan daripada kelas yang boleh dilihat boleh dipindahkan ke kelas yang tidak kelihatan.

Fasa pembelajaran sifar pukulan

Pembelajaran sifar pukulan melibatkan dua fasa latihan dan inferens:

Latihan: memperoleh pengetahuan tentang set sampel data berlabel.

Inferens: Lanjutkan pengetahuan yang diperoleh sebelum ini untuk menggunakan maklumat tambahan yang disediakan untuk set kelas baharu.

Kaedah pembelajaran sifar pukulan

Kaedah berasaskan pengelas

Kaedah berasaskan pengelas sedia ada biasanya menggunakan penyelesaian satu-ke-banyak untuk melatih pengelas sifar pukulan berbilang kelas. Iaitu, untuk setiap kelas ghaib, latih pengelas satu sama satu binari. Kami mengelaskan lagi kaedah berasaskan pengelas kepada tiga kategori mengikut kaedah membina pengelas.

①Kaedah surat-menyurat

Kaedah surat-menyurat bertujuan untuk membina pengelas untuk kelas-kelas yang tidak kelihatan melalui surat-menyurat antara pengelas satu-dengan-satu binari untuk setiap kelas dan prototaip kelas yang sepadan. Setiap kelas hanya mempunyai satu prototaip yang sepadan dalam ruang semantik. Oleh itu, prototaip ini boleh dilihat sebagai "perwakilan" kelas. Pada masa yang sama, dalam ruang ciri, untuk setiap kategori, terdapat pengelas satu sama satu binari yang sepadan, yang juga boleh dianggap sebagai "perwakilan" kategori. Kaedah surat menyurat bertujuan untuk mempelajari fungsi surat menyurat antara dua "perwakilan" ini.

②Kaedah Perhubungan

kaedah bertujuan untuk membina pengelas atau kelas halimunan berdasarkan hubungan antara kelas dan dalam kelas bagi kelas halimunan. Dalam ruang ciri, pengelas satu sama satu binari bagi kelas yang dilihat boleh dipelajari menggunakan data yang tersedia. Pada masa yang sama, hubungan antara kelas kelihatan dan tidak kelihatan boleh diperolehi dengan mengira hubungan antara prototaip yang sepadan.

③Kaedah gubahan

Kaedah gubahan menerangkan idea membina pengelas untuk kelas halimunan dengan menggabungkan pengelas untuk elemen asas yang membentuk kelas.

Dalam kaedah gubahan, dianggap terdapat senarai "elemen asas" yang membentuk kelas. Setiap titik data dalam kelas boleh dilihat dan tidak kelihatan adalah gabungan elemen asas ini. Dicerminkan dalam ruang semantik, ia dianggap bahawa setiap dimensi mewakili elemen asas, dan setiap prototaip kelas mewakili gabungan elemen asas kelas yang sepadan ini.

Setiap dimensi prototaip kelas mengambil masa 1 atau 0, menunjukkan sama ada kelas itu mempunyai elemen yang sepadan. Oleh itu, kaedah jenis ini sesuai terutamanya untuk ruang semantik.

Kaedah berasaskan instance

Kaedah berasaskan instance bertujuan untuk mendapatkan tika berlabel kelas ghaib dahulu dan kemudian menggunakan tika ini untuk melatih pengelas sifar pukulan. Mengikut sumber kejadian ini, kaedah berasaskan contoh sedia ada boleh dibahagikan kepada tiga subkategori:

①Kaedah unjuran

Idea kaedah unjuran adalah untuk menayangkan kejadian ruang ciri dan prototaip ruang semantik ke dalam perkongsian ruang untuk mendapatkan contoh kelas yang tidak kelihatan.

Terdapat contoh latihan berlabel dalam ruang ciri kepunyaan kelas yang boleh dilihat. Pada masa yang sama, terdapat prototaip kelas kelihatan dan kelas tidak kelihatan dalam ruang semantik. Ruang ciri dan semantik ialah ruang sebenar, dan contoh serta prototaip ialah vektor di dalamnya. Dari perspektif ini, prototaip juga boleh dilihat sebagai contoh berlabel. Oleh itu, kami melabel kejadian dalam ruang ciri dan ruang semantik.

②Kaedah peminjaman contoh

Kaedah ini mengendalikan mendapatkan contoh berlabel untuk kelas halimunan dengan meminjam daripada contoh latihan. Kaedah peminjaman contoh adalah berdasarkan persamaan antara kelas. Dengan pengetahuan tentang kelas serupa ini, contoh kepunyaan kelas ghaib boleh dikenal pasti.

③Kaedah sintesis

Kaedah sintesis adalah untuk mendapatkan contoh teg kelas halimunan dengan mensintesis kejadian pseudo menggunakan strategi berbeza. Untuk mensintesis kejadian pseudo, diandaikan bahawa kejadian setiap kelas mengikut pengedaran tertentu. Pertama, parameter pengedaran kelas ghaib perlu dianggarkan. Kemudian, sintesiskan contoh kelas halimunan.

Keterbatasan pembelajaran sifar pukulan

Seperti konsep lain, pembelajaran sifar pukulan juga mempunyai hadnya. Berikut ialah beberapa cabaran yang paling biasa apabila menggunakan pembelajaran sifar pukulan dalam amalan.

1. Bias

Semasa fasa latihan, model hanya boleh mengakses data dan label kelas yang boleh dilihat. Ini menyebabkan model meramalkan sampel data kelas yang tidak kelihatan semasa ujian sebagai kelas yang boleh dilihat. Masalah berat sebelah menjadi lebih ketara jika semasa ujian model dinilai pada sampel dari kedua-dua kelas yang boleh dilihat dan tidak kelihatan.

2. Pemindahan domain

Model pembelajaran sifar-shot dibangunkan terutamanya untuk melanjutkan model pra-latihan ke kelas baharu apabila data ini tersedia secara beransur-ansur. Oleh itu, masalah pemindahan domain adalah perkara biasa dalam pembelajaran sifar pukulan. Anjakan domain berlaku apabila taburan statistik data dalam set latihan dan set ujian adalah berbeza dengan ketara.

3. Masalah Pusat

Masalah pusat berkaitan dengan kutukan dimensi yang dikaitkan dengan pencarian jiran terdekat. Dalam pembelajaran zero-shot, masalah utama berlaku atas dua sebab.

Kedua-dua input dan ciri semantik wujud dalam ruang dimensi tinggi. Apabila vektor berdimensi tinggi sedemikian diunjurkan ke dalam ruang dimensi rendah, varians dikurangkan, menyebabkan titik yang dipetakan dikelompokkan menjadi pusat.

Regresi rabung, digunakan secara meluas dalam pembelajaran sifar pukulan, menimbulkan isu utama. Ia boleh membawa kepada ramalan berat sebelah, iaitu, kebanyakannya hanya beberapa kelas yang diramalkan tidak kira apa pertanyaannya.

4. Kehilangan maklumat

Apabila latihan tentang kelas boleh dilihat, model hanya mempelajari sifat penting yang membezakan kelas kelihatan ini. Walaupun beberapa maklumat berpotensi mungkin wujud dalam kelas yang boleh dilihat, ia tidak akan dipelajari jika ia tidak menyumbang dengan ketara kepada proses membuat keputusan. Walau bagaimanapun, maklumat ini penting semasa fasa ujian kelas halimunan. Ini mengakibatkan kehilangan maklumat.

Atas ialah kandungan terperinci Menganalisis definisi dan kepentingan pembelajaran sifar pukulan (ZSL). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:163.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam