Rumah >Peranti teknologi >AI >Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain
. bentuk interaktif; Sebaliknya, berdasarkan model besar bersatu Baidu, kami telah menyepadukan data dan pengalaman pengesyoran dalam semua senario. Penyatuan interaksi dan data boleh mencapai menang-menang ekologi dengan lebih baik dan menggalakkan pembangunan jangka panjang Video Baidu.
Perlu dinyatakan bahawa Baidu bermula sebagai enjin carian, dan kadar penggunaan carian adalah sangat tinggi dalam senario cadangan Data digunakan untuk memenuhi keperluan pengguna melalui enjin dwi "search + push". Carian terutamanya "orang yang mencari kandungan", pengguna akan memasukkan keperluan mereka dengan jelas, manakala pengesyoran ialah "kandungan mencari orang". Mengintegrasikan isyarat carian dan isyarat pengesyoran merentas domain untuk mencapai penyepaduan pengesyoran dan carian yang lebih baik juga merupakan salah satu kelebihan Baidu.
1. Masalah diselesaikan oleh sistem pengesyoran bilangan orang yang boleh dipertimbangkan.
penonton kurang memahami cadangan teknologi, adalah perlu Memperkenalkan secara ringkas masalah yang perlu diselesaikan oleh teknologi yang disyorkan. Platform yang disyorkan mempunyai tiga pemain:
Pengguna: Terokai dunia dan temui persepsi baharu di sini.
Pengiklan: Menyediakan sokongan kewangan untuk kelangsungan platform kebanyakan platform mencari rezeki daripada pengiklanan.
Apabila mereka bentuk matlamat, kita perlu mempertimbangkan secara menyeluruh dua misi sistem pengesyoran
, kami tidak mahu memperkenalkan semua. aplikasi Reka bentuk objektif dalam cadangan video
Pertama sekali, sila fikirkan tentang cara mereka bentuk sasaran sistem pengesyoran dalam senario mendalam video?
Dalam sistem pengesyoran tradisional, pengguna menggunakan sumber dengan mengklik pada kandungan atau video, dengan itu menyatakan dengan jelas keutamaan mereka terhadap sumber tersebut. Oleh itu, dalam senario pengesyoran tradisional, gelagat klik ialah isyarat yang sangat penting dan kaedah maklum balas yang jelas dan mudah. Walau bagaimanapun, dalam senario yang mengasyikkan, disebabkan kekurangan maklum balas yang jelas, keutamaan pengguna sering dinyatakan melalui gelagat "tersembunyi" Pada masa ini, masa tontonan menjadi isyarat yang amat penting dalam senario pengesyoran yang mengasyikkan
Selain daripada. di atas Selain masa penggunaan, ia juga perlu untuk mempertimbangkan tingkah laku pengguna yang keluar secara aktif dalam sistem, seperti mengikuti, mengulas, berkongsi, dan menyukai. Walau bagaimanapun, berbanding dengan data main balik, data tingkah laku ini sangat jarang, mungkin hanya seperseribu daripada pesanan Selain isyarat interaktif ini, terdapat juga bahagian yang sangat penting dalam data dalam pengesyoran APP Baidu, iaitu isyarat carian. . 70% pengguna di Baidu menggunakan kedua-dua aliran maklumat dan carian yang disyorkan Oleh itu, sistem pengesyoran juga perlu menggambarkan isyarat kepuasan domain carian pengguna.
Pencipta sebelah B memerlukan satu set mekanisme persaingan untuk menyaring pencipta yang lebih rendah dan merangsang potensi kreatif pencipta berkualiti tinggi di samping isyarat penggunaan yang pengguna sisi C berpuas hati dengannya, dengan itu mencapai kitaran pengeluaran yang baik dan penggunaan
2. Dimensi yang dipertimbangkan dalam reka bentuk sasaran
Dari perspektif sistem pengesyoran, pengguna ialah pengulas contoh, dan pengguna mempunyai beberapa ekspresi positif yang jelas. , suka, mengumpul, mengulas dan tingkah laku lain Terdapat juga beberapa ungkapan negatif yang jelas, seperti Tidak suka, komen negatif, laporan, dsb. Selain ungkapan eksplisit, pengguna juga akan mempunyai beberapa ungkapan tersirat, seperti kesukaan yang dinyatakan melalui penyiapan main balik, tempoh main balik, penggunaan halaman pengarang, membaca cadangan berkaitan, dsb., atau tidak suka dinyatakan melalui main balik pendek, pop timbul pantas, dsb. . Oleh itu, apabila mereka bentuk matlamat, kita mesti berfikir dalam semua aspek, mengimbangi isyarat eksplisit dan isyarat tersirat, dan mengelakkan mereka bentuk sistem pengesyoran "separa".
3. Pemodelan Kepuasan Komprehensif
Selain daripada matlamat asas di atas, kami juga akan mereka bentuk beberapa matlamat peringkat tinggi, tidak lagi hanya menggunakan maklum balas pengguna. Sebagai contoh, seperti yang ditunjukkan di sebelah kanan rajah di atas, kami telah melancarkan model berdasarkan maklum balas kepuasan pengguna. Pada peringkat pertama, melalui isyarat padat seperti penyiapan dan tempoh siaran, peraturan atau model mudah digunakan untuk menyesuaikan maklum balas kepuasan pengguna untuk mendapatkan label kepuasan pengguna yang agak padat. Pada peringkat kedua, model kepuasan dibina berdasarkan label ini, menggunakan Pembenaman yang dijana oleh model carian tolak berskala besar, Pembenaman asas Wenxin dan pemodelan ciri potret dan jujukan tingkah laku pengguna untuk menilai keuntungan kepuasan relatif domain yang disyorkan ke domain carian. Jika pengguna telah menggunakan titik minat tertentu dalam carian, sistem pengesyoran boleh mengesyorkan kandungan berkualiti tinggi berdasarkan model kepuasan, yang boleh menjadikan penyepaduan carian dan mendorong minat carian yang lebih lancar dan memindahkan minat carian ke suapan dengan lebih baik.
4. Pemodelan Nilai Jangka Panjang (Nilai Jangka Panjang)
Dalam artikel sebelum ini, kami memperkenalkan cara menganggarkan masa bermain dan interaksi kandungan semasa. Kami boleh menggunakan gelagat penggunaan sejarah pengguna sebagai sampel atau ciri untuk meramalkan sama ada kandungan yang akan datang akan mendapat maklum balas positif atau negatif, dan sama ada akan wujud interaksi dan penggunaan yang memuaskan
Kita boleh memikirkan lagi sama ada terdapat hubungan antara kandungan penggunaan masa depan pengguna dan kandungan penggunaan semasa? Sebagai contoh, jika pengguna sedang menonton video Guo Degang sekarang, dan jika mereka terus menggunakan video Yu Qian pada hari ke N berikutnya, adakah video Yu Qian ini "diilhamkan" oleh video Guo Degang? Bolehkah mengambil tempat menarik masa hadapan dianggap sebagai "sambungan" tempat menarik semasa? Jawapannya ya. Oleh itu, kami memperkenalkan sistem LTV dalam sistem untuk mengaitkan kandungan nilai jangka panjang masa hadapan kepada pengesyoran video semasa
Anggap V0 ialah nilai video semasa, V1 . boleh dikaitkan dengan V0 . Terdapat banyak kaedah atribusi Mengikut senario perniagaan Suapan Baidu, atribusi termasuk tiga bahagian berikut: Atribusi fungsional: Jika anda melihat sumber yang dipasang melalui pengesyoran yang berkaitan, maka Bahagian ini daripada pengesyoran. Isyarat penggunaan sumber boleh dikaitkan dengan V
0.
Berdasarkan abstraksi dan menyisir situasi perniagaan semasa, kami akan bermula dari tiga arah berikut untuk membuat ringkasan ringkas semasa mereka bentuk matlamat sistem pengesyoran
tujuan utama berbilang daripada pemodelan sasaran fizikal asas, Seterusnya ialah pemodelan beberapa matlamat peringkat tinggi untuk menggambarkan kepuasan keseluruhan pemandangan, dan juga perlu mengawal selia ekologi.
Adegan "Discover": Sebaliknya, suapan utama lebih berorientasikan maklumat, manakala "Discover" lebih meriah dan dekat dengan kehidupan.
Adegan "Immersive": aliran penggunaan video tulen.Pertama, mari kita lihat apa yang telah dilakukan oleh industri. Sama ada MMoE, PLE, atau rangkaian STAR, PEPNet dan struktur lain yang sedang diusahakan oleh Alibaba, serta syarikat seperti Google dan Tencent, mereka tidak berusaha keras untuk mereka bentuk pelbagai struktur rangkaian berdasarkan perniagaan mereka sendiri, dengan harapan dapat berkongsi mereka dalam senario heterogen. Maklumat yang lebih berguna. Kerja-kerja ini terutamanya menyelesaikan dua masalah:
Begitu juga, sistem cadangan Baidu juga menghadapi dua masalah ini.
Terdapat banyak sasaran subdomain yang berbeza dalam senario Baidu, dan korelasi antara sasaran ini adalah rendah, yang mungkin membawa kepada penghijrahan negatif antara berbilang sasaran. Untuk menyelesaikan masalah ini, seseorang perlu menganalisis PNR antara sasaran yang berbeza dan mengetahui perbezaan korelasi antara mereka. Dalam erti kata lain, cara untuk menerangkan maklumat pengguna dalam senario heterogen dan cara melaksanakan pemindahan maklumat heterogen adalah masalah yang perlu diselesaikan oleh struktur model
Menurut keperluan perniagaan Baidu, kami mereka bentuk lapisan merentas domain. struktur rangkaian berbilang objektif mengamalkan struktur Gating. Struktur ini terbahagi kepada tiga lapisan: yang pertama ialah rangkaian perkongsian yang diperibadikan sebagai lapisan bawah; lapisan kedua ialah rangkaian GCG untuk pengekstrakan maklumat merentas domain dan lapisan terakhir ialah rangkaian sub-domain berbilang objektif; Melalui reka bentuk ini, kami boleh melakukan anggaran berbilang objektif untuk setiap domain sambil berkongsi maklumat
Penyelesaian ini telah meningkat dengan ketara berbanding dengan berbilang objektif domain tunggal AUC pelancaran pertama telah meningkat kira-kira 3-9 ribu. titik. Seperti yang ditunjukkan di sudut kanan bawah rajah di atas, selepas memperoleh pembenaman ciri pengguna dalam berbilang domain dan melakukan pengurangan dimensi TSNE, kecuali carian C dan lompatan kedua adalah agak hampir, perbezaan antara dua senario lain masih agak jelas, menunjukkan bahawa Model boleh mempelajari perbezaan antara adegan. Adalah munasabah bahawa tidak banyak perbezaan antara senario carian C dan senario hop kedua Kedua-duanya adalah senario video, dan interaksi dan minat pengguna tidak begitu berbeza.
Senario perniagaan Baidu mempunyai lebih daripada 40 sasaran fizikal, 4 subdomain besar dan 6 borang, termasuk video, grafik, dinamik, program kecil, dsb. Kami berharap model itu boleh berprestasi baik dalam banyak perniagaan yang kompleks. Mari kita perkenalkan secara ringkas struktur model. Lapisan pertama ialah rangkaian biasa, yang berfungsi sebagai asas untuk pembahagian domain, menyaring sampel berbilang sasaran yang memuaskan dalam setiap adegan, dan melaksanakan pemetaan benam yang diperibadikan melalui rangkaian get. Lapisan kedua ialah pengekstrakan maklumat antara domain, yang melaksanakan ciri unik dan ciri kongsi yang diperibadikan dalam domain melalui rangkaian CGC. Kedua-duanya bersama-sama membina pengekstrakan maklumat merentas domain Kelebihannya ialah ia bukan sahaja mengekalkan kekayaan maklumat dalam domain, tetapi juga mengekstrak maklumat kongsi adegan heterogen. Lapisan ketiga ialah pemodelan berbilang objektif subdomain. Kami juga mempunyai kertas kerja berkaitan yang diterbitkan mengenai topik ini. Rakan-rakan yang berminat dengan butiran boleh membaca kertas tersebut.
Baidu pelbagai objektif proses evolusi adalah serupa dengan proses evolusi gabungan pelbagai objektif Yang pertama ialah gabungan pengetahuan sedia ada, yang walaupun mudah dan mudah, memerlukan tenaga kerja yang ramai. Kemudian kami menaik taraf kepada LTR, dan kesannya adalah luar biasa Namun, kelemahannya ialah ia memerlukan pelarasan yang kerap apabila perniagaan berubah Pada masa yang sama, hubungan pesanan separa juga berubah dengan perubahan dalam stratifikasi perniagaan dan pengguna. Selepas itu, kami menggunakan model nilai gabungan berbilang objektif, menggunakan pendekatan optimum berurutan. Selepas tempoh penggunaan yang singkat, kami menaik taraf kepada kaedah yang kami gunakan sekarang - ES (Strategi Evolusi) pembelajaran evolusi
Untuk menggunakan ES, anda perlu menentukan ganjaran terlebih dahulu, iaitu Bintang Utara penunjuk. Ganjaran Baidu ialah kedalaman sesi (tempoh + panjang langkah) dan interaksi Penunjuk perniagaan yang sepadan dengan tempoh dan panjang langkah ialah tempoh dan volum main balik video ini mencerminkan pengekalan pengguna, iaitu LT. Selain itu, terdapat maklumat interaktif, yang mewakili pengumpulan aset pengguna dalam APP, seperti memberi perhatian kepada tingkah laku pengarang Malah, dia berharap dapat mencari pengarang selepas dia mengemas kini. Sama ada meningkatkan bilangan penggunaan atau interaksi, kami berharap pengguna dapat menggunakan APP ini untuk tempoh masa yang lebih lama
Versi awal kami ialah model heuristik yang mudah, manakala ES dalam talian semasa melakukan pengiraan yang lebih maju, seperti memperkenalkan maklumat tentang senario dan kumpulan orang yang berbeza
Atas ialah kandungan terperinci Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!