Rumah >Peranti teknologi >AI >Kajian 'pembelajaran berterusan' terbaru Tsinghua, 32 muka surat memperincikan semakan teori, kaedah dan aplikasi pembelajaran berterusan
Dalam pengertian umum, pembelajaran berterusan jelas dihadkan oleh pelupaan bencana, dan pembelajaran tugasan baharu selalunya membawa kepada penurunan mendadak dalam prestasi pada tugasan lama.
Di samping itu, terdapat peningkatan bilangan kemajuan dalam beberapa tahun kebelakangan ini yang telah meluaskan pemahaman dan aplikasi pembelajaran berterusan ke tahap yang besar.
Minat yang semakin meningkat dan meluas ke arah ini menunjukkan kepentingan dan kerumitan praktikalnya.
Alamat kertas: https://www.php.cn/link/82039d16dce0aab3913b6a7ac73deff7
Artikel ini menjalankan tinjauan menyeluruh tentang pembelajaran dan percubaan berterusan untuk Membuat perkaitan antara tetapan asas, asas teori, kaedah perwakilan dan aplikasi praktikal.
Berdasarkan hasil teori dan empirikal yang sedia ada, matlamat umum pembelajaran berterusan diringkaskan sebagai: memastikan pertukaran kestabilan-keplastikan yang sesuai, dan kecukupan tugas, dalam konteks kecekapan sumber Keupayaan generalisasi dalam/antara tugas.
Menyediakan taksonomi terkini dan terperinci, menyediakan analisis yang meluas tentang cara strategi perwakilan menangani pembelajaran berterusan dan cara ia menyesuaikan diri dengan cabaran khusus dalam pelbagai aplikasi.
Melalui perbincangan mendalam tentang trend semasa dalam pembelajaran berterusan, prospek merentas arah dan hubungan antara disiplin dengan neurosains, saya percaya perspektif holistik ini boleh memajukan bidang ini dan seterusnya. -penerokaan naik.
Pembelajaran adalah asas untuk sistem pintar menyesuaikan diri dengan persekitaran. Untuk menghadapi perubahan di dunia luar, evolusi telah menjadikan manusia dan organisma lain sangat mudah menyesuaikan diri dan dapat terus memperoleh, mengemas kini, mengumpul, dan menggunakan pengetahuan [148], [227], [322]. Sememangnya, kami menjangkakan sistem kecerdasan buatan (AI) menyesuaikan diri dengan cara yang sama. Ini telah memberi inspirasi kepada penyelidikan tentang pembelajaran berterusan, di mana tetapan biasa adalah untuk mempelajari urutan kandungan satu demi satu dan berkelakuan seolah-olah ia diperhatikan secara serentak (Rajah 1, a). Ini boleh menjadi kemahiran baharu, contoh baharu kemahiran lama, persekitaran berbeza, konteks berbeza, dsb., dan mengandungi cabaran dunia sebenar yang khusus [322], [413]. Oleh kerana kandungan disediakan secara beransur-ansur sepanjang hayat, pembelajaran berterusan juga dipanggil pembelajaran tambahan atau pembelajaran sepanjang hayat dalam banyak kesusasteraan, tetapi tidak ada perbezaan yang ketat [70], [227].
Berbeza daripada model pembelajaran mesin tradisional berdasarkan pengedaran data statik, pembelajaran berterusan dicirikan oleh pembelajaran daripada pengedaran data dinamik. Cabaran utama dikenali sebagai pelupaan bencana [291], [292], di mana penyesuaian kepada pengedaran baharu sering mengakibatkan keupayaan yang sangat berkurangan untuk menangkap pengedaran lama. Dilema ini adalah salah satu aspek pertukaran antara keplastikan pembelajaran dan kestabilan ingatan: terlalu banyak perkara terdahulu mengganggu yang kedua, dan sebaliknya. Di luar sekadar mengimbangi "nisbah" kedua-dua aspek ini, penyelesaian ideal untuk pembelajaran berterusan harus mencapai keupayaan generalisasi yang kukuh untuk menyesuaikan diri dengan perbezaan pengagihan dalam dan antara tugas (Rajah 1, b). Sebagai garis dasar yang naif, melatih semula semua sampel latihan lama (jika dibenarkan) boleh menyelesaikan cabaran di atas dengan mudah, tetapi menimbulkan overhed pengiraan dan penyimpanan yang besar (dan potensi isu privasi). Malah, tujuan utama pembelajaran berterusan adalah untuk memastikan kecekapan sumber kemas kini model, sebaik-baiknya hampir dengan hanya mempelajari sampel latihan baharu.
Banyak usaha telah ditumpukan untuk menyelesaikan cabaran di atas, yang boleh dibahagikan secara konsep kepada lima kumpulan (Rajah 1, c): Menambah istilah regularisasi dengan merujuk kepada model lama (regularization -kaedah berasaskan); Menghampirkan dan memulihkan pengedaran data lama (pendekatan berasaskan ulangan secara eksplisit (pendekatan berasaskan pengoptimuman yang mantap dan digeneralisasikan dengan baik (pendekatan berasaskan perwakilan); seni bina Parameter penyesuaian (pendekatan berasaskan seni bina). Taksonomi ini memanjangkan kemajuan terkini dalam taksonomi yang biasa digunakan dan menyediakan sub-arah yang diperhalusi untuk setiap kategori. Ia meringkaskan bagaimana kaedah ini mencapai matlamat umum yang dicadangkan, dan menyediakan analisis yang meluas tentang asas teori dan pelaksanaan biasa mereka. Khususnya, kaedah ini berkait rapat, seperti regularisasi dan main semula akhirnya membetulkan arah kecerunan dalam pengoptimuman, dan sangat sinergi, contohnya, kesan main semula boleh dipertingkatkan dengan mengekstrak pengetahuan daripada model lama.
Aplikasi kehidupan sebenar menimbulkan cabaran khas kepada pembelajaran berterusan, yang boleh dibahagikan kepada kerumitan pemandangan dan kekhususan tugas. Untuk yang pertama, sebagai contoh, oracle tugas (iaitu tugas yang perlu dilaksanakan) mungkin hilang dalam latihan dan ujian, dan sampel latihan boleh diperkenalkan dalam kelompok kecil atau sekali gus. Disebabkan oleh kos dan kekurangan pelabelan data, pembelajaran berterusan perlu berkesan dalam senario few-shot, separa penyeliaan atau bahkan tanpa seliaan. Bagi yang terakhir, sementara kemajuan semasa tertumpu terutamanya pada klasifikasi visual, medan visual lain seperti pengesanan objek, segmentasi semantik dan penjanaan imej, serta bidang lain yang berkaitan seperti pembelajaran pengukuhan (RL), pemprosesan bahasa semula jadi (NLP) dan etika. pertimbangan ) semakin mendapat perhatian, peluang dan cabarannya.
Memandangkan pertumbuhan ketara dalam minat dalam pembelajaran berterusan, kami percaya tinjauan terbaru dan komprehensif ini boleh memberikan perspektif holistik untuk kerja seterusnya. Walaupun terdapat beberapa penyiasatan awal tentang pembelajaran berterusan dengan liputan yang agak luas [70], [322], kemajuan penting dalam beberapa tahun kebelakangan ini tidak disertakan. Sebaliknya, tinjauan baru-baru ini secara amnya hanya mengumpulkan aspek tempatan pembelajaran berterusan, mengenai asas biologinya [148], [156], [186], [227], dan tetapan khusus untuk pengelasan visual [85], [283], [ 289], [346], dan sambungan dalam NLP [37], [206] atau RL [214]. Untuk pengetahuan terbaik kami, ini adalah tinjauan pertama yang merumuskan secara sistematik kemajuan terkini dalam pembelajaran berterusan. Berdasarkan kekuatan ini, kami menyediakan perbincangan mendalam tentang pembelajaran berterusan mengenai trend semasa, prospek merentas arah (seperti model resapan, pra-latihan berskala besar, pengubah visual, AI yang terkandung, pemampatan saraf, dll.), dan hubungan antara disiplin dengan neurosains.
Sumbangan utama termasuk:
(1) Semakan yang terkini dan menyeluruh tentang pembelajaran berterusan , untuk menghubungkan kemajuan dalam teori, kaedah dan aplikasi
(2) Berdasarkan hasil teori dan empirikal yang sedia ada, matlamat umum pembelajaran berterusan diringkaskan; , dan Klasifikasi terperinci bagi strategi perwakilan;
(3) Bahagikan cabaran khas aplikasi kehidupan sebenar kepada kerumitan adegan dan kekhususan tugas, dan Analisis meluas tentang bagaimana strategi pembelajaran berterusan menyesuaikan diri dengan cabaran ini;
(4) Penerokaan mendalam tentang trend penyelidikan dan hala tuju pembangunan semasa, dengan tujuan untuk menyediakan rujukan untuk kerja seterusnya dalam bidang yang berkaitan .
Kertas kerja ini disusun seperti berikut: Dalam Bahagian 2, kami memperkenalkan tetapan pembelajaran berterusan, termasuk formula asasnya, senario biasa dan metrik penilaian. Dalam Bahagian 3, kami meringkaskan beberapa usaha teori tentang pembelajaran berterusan dengan matlamat amnya. Dalam Bahagian 4, kami menyediakan klasifikasi strategi perwakilan yang terkini dan terperinci, menganalisis motivasi dan pelaksanaan biasa mereka. Dalam Bahagian 5 dan 6, kami menerangkan cara strategi ini menyesuaikan diri dengan cabaran dunia sebenar kerumitan adegan dan kekhususan tugas. Dalam Bahagian 7, kami menyediakan perbincangan tentang arah aliran semasa, prospek arah persimpangan dan hubungan antara disiplin dalam neurosains.
Dalam bahagian ini, kami memperincikan klasifikasi kaedah pembelajaran berterusan perwakilan (lihat Rajah 3 dan Rajah 1,c) , dan menganalisis secara meluas motivasi utama, pelaksanaan tipikal dan sifat empirikalnya.
Kaedah berasaskan penyelarasan
Arah ini dicirikan dengan menambahkan istilah regularisasi yang jelas untuk mengimbangi tugas lama dan baharu, yang selalunya memerlukan penyimpanan salinan beku model lama untuk rujukan (lihat Rajah 4). Mengikut matlamat regularisasi, kaedah tersebut boleh dibahagikan kepada dua kategori.
Kaedah berasaskan ulangan
Kaedah kumpulan untuk menganggar dan memulihkan pengedaran data lama ke arah ini (lihat Rajah 5). Bergantung pada kandungan tayangan semula, kaedah ini boleh dibahagikan lagi kepada tiga sub-arah, setiap satu dengan cabarannya sendiri.
Kaedah berasaskan pengoptimuman
Pembelajaran berterusan boleh dicapai bukan sahaja dengan menambahkan istilah tambahan pada fungsi kehilangan (seperti penetapan dan main semula), tetapi juga dengan mereka bentuk dan mengendalikan pengoptimum secara eksplisit.
Kaedah berasaskan perwakilan
Kaedah untuk mencipta dan memanfaatkan perwakilan pembelajaran berterusan termasuk dalam kategori ini. Sebagai tambahan kepada kerja awal untuk mendapatkan perwakilan yang jarang melalui meta-latihan [185], kerja baru-baru ini telah cuba untuk menggabungkan pembelajaran penyeliaan kendiri (SSL) [125], [281], [335] dan pra-latihan berskala besar [295]. ], [380], [456] untuk menambah baik perwakilan dalam permulaan dan pembelajaran berterusan. Ambil perhatian bahawa kedua-dua strategi ini berkait rapat, kerana data pra-latihan selalunya besar dan tidak dilabel secara eksplisit, manakala prestasi SSL itu sendiri dinilai terutamanya oleh penalaan halus (serangkaian) tugas hiliran. Di bawah, kita membincangkan sub-arah perwakilan.
Pendekatan berasaskan seni bina
Strategi di atas tertumpu terutamanya pada pembelajaran semua tugasan tambahan dengan set parameter dikongsi (iaitu, model tunggal dan ruang parameter), yang merupakan punca utama gangguan antara tugas. Sebaliknya, membina parameter khusus tugasan boleh menyelesaikan masalah ini secara eksplisit. Kerja sebelumnya biasanya membahagikan arah ini kepada pengasingan parameter dan seni bina dinamik berdasarkan sama ada seni bina rangkaian tetap atau tidak. Kertas kerja ini memberi tumpuan kepada cara untuk melaksanakan parameter khusus tugasan, melanjutkan konsep di atas kepada penetapan parameter, penguraian model dan rangkaian modular (Rajah 8).
Atas ialah kandungan terperinci Kajian 'pembelajaran berterusan' terbaru Tsinghua, 32 muka surat memperincikan semakan teori, kaedah dan aplikasi pembelajaran berterusan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!