Rumah >Peranti teknologi >AI >Kuaishou mencadangkan sistem ensiklopedia video pendek berbilang modal peringkat bilion - Kuaipedia

Kuaishou mencadangkan sistem ensiklopedia video pendek berbilang modal peringkat bilion - Kuaipedia

王林
王林ke hadapan
2023-05-20 17:10:082234semak imbas
Pengenalan

Pada masa ini, semakin ramai pengguna video pendek bukan sahaja berharap untuk menggunakan masa berpecah-belah mereka untuk masa lapang dan hiburan, tetapi juga mula berharap untuk menjadi boleh menggunakan video pendek dalam video pendek Dapatkan lebih banyak pengetahuan di platform. Pada tahun 2021, volum main balik kandungan pengetahuan pan Kuaishou meningkat sebanyak 58.11% tahun ke tahun, dan platform itu mempunyai lebih daripada 33 juta siaran langsung pengetahuan pan sepanjang tahun [1]. Untuk lebih memahami dan mengatur video pengetahuan pan, Kuaishou MMU bekerjasama dengan Institut Teknologi Harbin dan lain-lain untuk mencadangkan ensiklopedia video pendek pelbagai mod pertama dalam industri - "Kuaipedia": menggunakan teknologi graf berbilang modal dan graf pengetahuan untuk mengekstrak maklumat daripada video pendek besar-besaran中Melombong video pengetahuan berskala besar dan berkualiti tinggi dan menstrukturkannya untuk membentuk pangkalan pengetahuan ensiklopedia video pendek yang sistematik, memberikan pengguna pengalaman pemerolehan pengetahuan yang lebih baik, sambil merangsang pencipta untuk mencipta kandungan pengetahuan berkualiti tinggi dan membina ekosistem perkongsian pengetahuan yang sihat.

Kuaishou mencadangkan sistem ensiklopedia video pendek berbilang modal peringkat bilion - Kuaipedia

Pautan kertas: https://www.php.cn/link/b0da9d8dd88178e3bb138e08742eb2e2

Laman utama projek: >​https://www.php.cn/link/1a725948eb0c738707b5c026a65ba618

Pasukan ini melombong ratusan juta video pengetahuan daripada video pendek besar Kuaishou, menstrukturkannya dan membina sistem ensiklopedia video berpuluh juta penyertaan dan mata pengetahuan. Cadangan "Kuaipedia" membantu komuniti akademik mempromosikan AI untuk memahami pengetahuan dunia melalui maklumat pelbagai modal, dan ia mempunyai ruang imaginasi yang hebat untuk dilaksanakan dalam industri.

PengenalanKuaishou mencadangkan sistem ensiklopedia video pendek berbilang modal peringkat bilion - Kuaipedia

Ensiklopedia, sejak zaman Greece dan Rom, juga 17- Pencapaian cemerlang Pencerahan Perancis pada abad ke-18. Ensiklopedia pengetahuan biasanya merujuk kepada buku rujukan atau ringkasan yang memperkenalkan secara ringkas semua pengetahuan manusia atau bidang atau subjek tertentu Dengan perkembangan pesat Internet, ensiklopedia dalam talian telah menjadi pembawa pengetahuan baru, seperti Wikipedia, Ensiklopedia Baidu, dll. Walau bagaimanapun, ensiklopedia ini biasanya menggunakan grafik, teks dan jadual sebagai pembawa, menjadikannya sukar untuk menyatakan beberapa pengetahuan yang memerlukan demonstrasi yang jelas, seperti pengetahuan tutorial (Cara-cara). Rajah 1 menunjukkan dilema menggunakan gambar dan teks untuk memberitahu pengetahuan "Shiba Inu" - "cara melukis". Melalui video pendek, kami dapat menerangkan dan mempelajari ilmu ini dengan baik.

Untuk video tertentu, lihat

https://www.php .cn /link/70e9dbe24ba303f2d25ac34d3ae945c5.

Kuaishou mencadangkan sistem ensiklopedia video pendek berbilang modal peringkat bilion - Kuaipedia

Rajah 1: Dilema pemindahan pengetahuan dengan gambar dan teks, gambar dan teks datang daripada video pendek Tangkapan skrin bingkai

Dengan pengulangan berterusan industri kandungan dan bentuk media, video pendek semakin menjadi medium utama penyebar ilmu, terutamanya dalam penyebaran pengetahuan tentang kemahiran dan kepakaran tertentu kelebihan. Pada masa ini, walaupun terdapat ensiklopedia dalam talian awam dengan kandungan video, ia biasanya dalam bentuk pengenalan ringkas (seperti Ensiklopedia Pemahaman Segera), dan video pendek tidak digunakan secara maksimum Oleh itu, keupayaan ekspresif video pendek dalam ensiklopedia pengetahuan telah dipandang remeh. Sebagai contoh, apabila orang bercakap tentang "Shiba Inu", sebagai tambahan kepada "pengenalan", orang juga memberi perhatian kepada "cara memilih", "cara menyikat rambut", "cara membetulkan perlindungan makanan", dll. Oleh itu, kami percaya bahawa menstrukturkan video pendek berasaskan pengetahuan ke dalam ensiklopedia video pendek berstruktur ialah cara yang berkesan untuk memahami pengetahuan dunia dan membantu manusia menyebarkan pengetahuan dengan lebih cekap.

Rujukan standard kebangsaanPengetahuan sains popular , kategori kemahiran (Bagaimana) dipecahkan kepada Pengetahuan tutorial, di Kuaishou's video besar-besaran Temui video pengetahuan berkualiti tinggi. Di samping itu, kami mempersembahkan badan pengetahuan yang diekstrak daripada video pendek dalam bentuk entri ( seperti Shiba Inu) , dan ekstrak mata pengetahuan khusus (seperti pemilihan Shiba Inu, Shiba Inu - perlindungan dan pembetulan makanan, dsb.), akhirnya membentuk sistem pengetahuan ensiklopedia video pendek, seperti yang ditunjukkan dalam Rajah 2.

Kuaishou mencadangkan sistem ensiklopedia video pendek berbilang modal peringkat bilion - Kuaipedia

Rajah 2: Pengetahuan Pantas - Gambaran keseluruhan ensiklopedia video pendek pelbagai mod

Cadangan "Kuaipedia" mempunyai sumbangan berikut:

Definisi "Kuaipedia" : Kami telah mempelopori ensiklopedia pengetahuan pelbagai mod baharu, yang berdasarkan entri, mata pengetahuan, video pendek pengetahuan dan hubungan antara mereka. Ini adalah ensiklopedia video pendek pelbagai mod berstruktur pertama dalam industri.

Kaedah untuk membina ensiklopedia video pendek berskala besar : Kami mencadangkan untuk menggunakan video pengetahuan Gabungan pengiktirafan, perlombongan titik pengetahuan kemasukan, dan pautan pengetahuan pelbagai mod digunakan untuk membina ensiklopedia video pendek berskala besar. Dan mempelopori tugas "penghubungan pengetahuan pelbagai mod" sebagai lanjutan dan lanjutan dari pautan entiti tradisional.

Aplikasi penuh potensi dan imaginasi : Secara akademik, "cepat" "Pengetahuan " menggunakan bentuk organisasi video pendek yang serba baharu bagi mata pengetahuan, yang boleh menembusi had atas pemahaman mesin semasa tentang pengetahuan dunia dengan hanya bergantung pada graf pengetahuan grafik (KG). Dalam beberapa tugas hiliran KG, seperti entiti pemautan, klasifikasi entiti atau NLP, CV, dll. Ia mempunyai potensi besar untuk tugas hiliran pemahaman kandungan. Dalam industri, borang seperti "Kuaizhi" boleh membantu platform video pendek beroperasi dengan cekap, menyusun kandungan dan meningkatkan pemahaman pengguna tentang pengetahuan dan kecekapan penggunaan.

Tinjauan Teknikal

Untuk mencapai struktur ensiklopedia video pendek yang disebutkan di atas, teknologi teras merangkumi tiga langkah utama berikut, seperti yang ditunjukkan dalam Rajah 3.

Pengecaman video pengetahuan: Melalui model pra-latihan video pelbagai mod, memahami Dan mengenal pasti video berasaskan pengetahuan dalam video besar-besaran

Penggalian entri dan titik pengetahuan: Membina sistem kemasukan "atas ke bawah" melalui penyepaduan pelbagai sumber pangkalan pengetahuan , dan kemudian "bottom-up" membina hubungan antara istilah dan titik pengetahuan dengan melombong pertanyaan carian pengguna, membentuk pokok titik pengetahuan istilah

Rajah 3: Pautan Teknologi Pembinaan Pengetahuan Pantas

Kuaishou mencadangkan sistem ensiklopedia video pendek berbilang modal peringkat bilion - Kuaipedia

Melalui sebilangan besar ulasan manual terperinci, mata pengetahuan dan video yang dilombong oleh KuaiZhi mempunyai ketepatan dan kualiti yang tinggi. Untuk algoritma yang lebih terperinci dan data percubaan, sila rujuk kertas atau halaman utama Github kami (lihat permulaan artikel).

Mohon

Pertama sekali, sistem ensiklopedia video pendek pelbagai mod seperti "Kuaipedia" mempunyai potensi besar dalam bidang akademik untuk menggalakkan pembangunan teknologi AI untuk memahami pengetahuan dunia. Di satu pihak, "Pengetahuan Pantas" menerobos batasan grafik, teks dan jadual, dan menerangkan entiti atau konsep melalui mata pengetahuan yang lebih kaya dan video pendek Pendekatan ini boleh menggalakkan pembangunan teknologi graf pengetahuan pelbagai modal. Sebaliknya, mata pengetahuan dan video pendek ini membantu AI untuk memahami pengetahuan dunia dengan lebih baik, terutamanya beberapa pengetahuan Cara-cara yang sukar untuk dinyatakan dalam gambar dan teks Pengetahuan pelbagai mod ini boleh meningkatkan pemahaman AI tentang dunia dan meningkatkan pemahaman AI tentang dunia aplikasi hiliran dalam KG, NLP, CV dan bidang lain sangat membantu. Mengenai tugas memaut entiti CCKS, kami telah membuktikan bahawa pengenalan mudah pengetahuan pelbagai mod "pengetahuan cepat" boleh meningkatkan prestasi BERT dengan berkesan dalam pautan entiti dan klasifikasi entiti.

Selain itu, pelaksanaan "Kuaizhi" dalam industri adalah sangat imaginatif Dalam proses mengembangkan ekologi video pendek kepada "pan-knowledge". bentuk sedia ada Dengan mengekang kaedah komunikasinya, "Kuaizhi" boleh meningkatkan kecekapan operasi dan pengedaran platform melalui kandungan berstruktur dan lebih memenuhi permintaan pengguna untuk pengetahuan. Kami mula-mula mencuba untuk melaksanakan teknologi ini dalam kategori kesihatan Pasukan Kuaishou Health sebelum ini telah melombong sekumpulan kandungan PUGC berkualiti tinggi secara manual semata-mata menggunakan jenis penyakit sebagai dimensi organisasi Walau bagaimanapun, terdapat sistem pengetahuan penyakit yang tidak sempurna dan video pengetahuan yang berwibawa. Dengan titik kesakitan yang kecil, sukar untuk membina sistem video penyakit yang lengkap, berskala besar dan berstruktur dengan cekap. Selepas menggunakan teknologi "Kuaizhi", sekumpulan mata pengetahuan dan video pengetahuan berkualiti tinggi dengan ciri Kuaishou dilombong secara automatik, yang memperkaya kandungan penyakit dan lebih cekap daripada pembinaan manual semata-mata

Berpuluh kali

. Pada masa ini, kumpulan kandungan ini telah dilancarkan pada halaman Kuaishou App yang dipilih: klik pada "bar bawah" video berkaitan penyakit dalam strim video yang dipilih untuk membangkitkan halaman separuh skrin "Kuaishou Health", dan pengguna boleh gunakan kandungan yang berkaitan di bawah entri yang menjadi milik mata Pengetahuan dan video pengetahuan yang berkaitan ditunjukkan dalam Rajah 4. Gambar 4: Kuai Zhi dilaksanakan dalam bidang kesihatan

Kuaishou mencadangkan sistem ensiklopedia video pendek berbilang modal peringkat bilion - Kuaipedia

Selain kesihatan, "Kuaizhi" juga merangkumi kandungan pengetahuan dalam banyak bidang seperti pendidikan, makanan, pertanian, kawasan luar bandar, petani, ibu bapa, anak, undang-undang, teknologi, kewangan, dan lain-lain, dan mempunyai kehebatan potensi aplikasi.

Kesimpulan

Berdepan dengan prospek pembangunan kandungan pengetahuan am dalam industri video pendek, kami mencadangkan sistem ensiklopedia video pendek berbilang modal "Kuaipedia" Bermula dari pendek besar-besaran kandungan video, kami melombong ratusan juta video pengetahuan berkualiti tinggi melalui teknologi pembinaan graf pengetahuan pelbagai mod, dan menstrukturkan kandungan pengetahuan untuk membina pangkalan pengetahuan ensiklopedia video pendek sistematik berskala besar pertama dalam industri, yang mempunyai kepentingan yang besar dalam kalangan akademik Terdapat potensi besar dan ruang untuk imaginasi di dunia dan industri.

Pengenalan kepada pengarang

Pengarang pertama: Pan Haojie

Ahli Pusat Graf Pengetahuan MMU Kuaishou, ketua projek Kuaizhi, lulus dari Universiti Zhejiang dan Universiti Sains dan Teknologi Hong Kong dengan ijazah sarjana muda dan sarjana , dan bertanggungjawab untuk algoritma NLP berskala besar di Alibaba Cloud PAI dan rangka kerja, menerbitkan lebih daripada 10 kertas kerja dalam persidangan dan jurnal teratas seperti ACL, EMNLP, KDD, AIJ, dll., dan berbilang paten domestik dan AS Untuk butiran, jumpa Zhihu. Sertai Kuaishou pada tahun 2021.

Pengarang yang sepadan: Fu Ruiji

Ketua Pusat Graf Pengetahuan MMU Kuaishou Beliau lulus dari Institut Teknologi Harbin dengan ijazah sarjana muda, ijazah sarjana dan Ph.D. , dan merupakan felo pasca doktoral di Universiti Sains dan Teknologi China. Beliau pernah berkhidmat sebagai timbalan pengarah Institut Penyelidikan AI iFlytek HKUST dan memenangi hadiah pertama Anugerah Kemajuan Teknologi Kepintaran Buatan Wu Wenjun. Beliau telah menerbitkan banyak kertas akademik dalam persidangan dan jurnal antarabangsa seperti ACL, EMNLP, Coling, IJCAI, TASLP, dsb., dan memohon (memperoleh) lebih daripada 40 paten ciptaan negara. Sertai Kuaishou pada tahun 2021.

Guru bekerjasama: Liu Ming

Profesor/penyelia kedoktoran, Jabatan Pengkomputeran, Institut Teknologi Harbin. Beliau telah berturut-turut mempengerusikan banyak projek dana seperti Projek Program R&D Utama Negara, Yayasan Sains Semula Jadi Kebangsaan, Geran Khas Yayasan Sains Pasca doktoral China, Geran Kelas Pertama Yayasan Sains Pascadoktoral China, dan Dana Am Wilayah Heilongjiang. Memenangi hadiah pertama Anugerah Sains dan Teknologi Wilayah Heilongjiang, Pencapaian Sains dan Teknologi Harbin City, dan hadiah pertama Persidangan Inovasi dan Keusahawanan Kecerdasan Buatan Belia Kebangsaan Ke-6. Dalam beberapa tahun kebelakangan ini, beliau telah menerbitkan lebih daripada 20 kertas CCFA/B sebagai pengarang pertama atau pengarang yang sepadan, mengambil bahagian dalam penyuntingan satu buku teks, dan menterjemah satu ke dalam bahasa Inggeris. Beliau berkhidmat sebagai pengerusi bidang graf pengetahuan NLPCC2020, CCKS2020, dan COLING2022, pengerusi penerbitan CCKS2019, pengerusi penilaian CCKS2021, dan pengerusi bengkel CCKS2022.

Rujukan

[1] Kuaishou, Laporan Ekosistem Kandungan Pan-Knowledge Kuaishou 2022.

[2] Jawatankuasa Standard Kebangsaan: Rangka Kerja Pengurusan Pengetahuan, GB/T 23703.

Atas ialah kandungan terperinci Kuaishou mencadangkan sistem ensiklopedia video pendek berbilang modal peringkat bilion - Kuaipedia. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam