Rumah >Peranti teknologi >AI >Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

WBOY
WBOYke hadapan
2023-12-01 11:47:181139semak imbas

. bentuk interaktif; Sebaliknya, berdasarkan model besar bersatu Baidu, kami telah menyepadukan data dan pengalaman pengesyoran dalam semua senario. Penyatuan interaksi dan data boleh mencapai menang-menang ekologi dengan lebih baik dan menggalakkan pembangunan jangka panjang Video Baidu.

Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

Untuk memupuk tabiat penggunaan video pengguna dengan lebih baik, kami juga telah mencipta pintu masuk peringkat pertama untuk penggunaan video (pintu masuk bar navigasi bawah). Jika anda berminat, anda boleh memuat turun APP Baidu Jika anda mempunyai cadangan yang baik atau kes yang buruk, anda sentiasa dialu-alukan untuk memberi maklum balas kepada kami.

2. Cari + tolak enjin dwi untuk memenuhi keperluan pengguna

Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

Perlu dinyatakan bahawa Baidu bermula sebagai enjin carian, dan kadar penggunaan carian adalah sangat tinggi dalam senario cadangan Data digunakan untuk memenuhi keperluan pengguna melalui enjin dwi "search + push". Carian terutamanya "orang yang mencari kandungan", pengguna akan memasukkan keperluan mereka dengan jelas, manakala pengesyoran ialah "kandungan mencari orang". Mengintegrasikan isyarat carian dan isyarat pengesyoran merentas domain untuk mencapai penyepaduan pengesyoran dan carian yang lebih baik juga merupakan salah satu kelebihan Baidu.

2. Gambaran keseluruhan sistem pengesyoran

1. Masalah diselesaikan oleh sistem pengesyoran bilangan orang yang boleh dipertimbangkan.

Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain penonton kurang memahami cadangan teknologi, adalah perlu Memperkenalkan secara ringkas masalah yang perlu diselesaikan oleh teknologi yang disyorkan. Platform yang disyorkan mempunyai tiga pemain:

Pengguna: Terokai dunia dan temui persepsi baharu di sini.

Pencipta: Asas untuk pengesyoran platform dan bekalan kandungan untuk platform itu memberi mereka ruang yang luas untuk memberi inspirasi dan penciptaan tanpa had mereka.

Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

Pengiklan: Menyediakan sokongan kewangan untuk kelangsungan platform kebanyakan platform mencari rezeki daripada pengiklanan.

  • Platform pengesyoran berharap dapat mencapai kitaran pengeluaran, penggunaan dan pendapatan yang baik Sebagai komponen teras platform, sistem pengesyoran terutamanya menyelesaikan dua masalah:
  • mekanisme pemilihan kandungan untuk kelangsungan hidup. the fittest (B-side): Cara mendapatkan lebih banyak pengedaran kandungan berkualiti tinggi dan mengekalkan pencipta berkualiti tinggi.
  • Pengalaman penggunaan pengguna muktamad (C-side): Hanya apabila permintaan pengguna dipenuhi, peningkatan berterusan dalam skala boleh dipromosikan.

Apabila mereka bentuk matlamat, kita perlu mempertimbangkan secara menyeluruh dua misi sistem pengesyoran

  • 2 Gambaran keseluruhan sistem pengesyoran
  • proses mengikut
  • secara kasarnya. : sumber yang disemak akan terlebih dahulu Ditolak ke pangkalan data ke hadapan bersatu yang menyimpan maklumat meta selepas menerima permintaan, sistem pengesyoran mula-mula memanggil semula sumber yang berkaitan melalui enjin graf, penarikan semula berbilang sasaran, dan sebagainya, ia akan melalui dua; pusingan pengisihan, iaitu pengisihan kasar dan pengisihan halus, dan kemudian Model gabungan berbilang objektif memilih beberapa kandungan yang sangat relevan kepada pengguna akhirnya, melalui penderiaan kepelbagaian, pemodelan jujukan, mekanisme pengedaran trafik dan strategi lain, senarai video adalah dijana dan dihantar ke telefon bimbit pengguna.
  • Kandungan berikut akan tertumpu terutamanya pada gabungan reka bentuk dan model sasaran yang disusun dengan tepat

3 reka bentuk dan pemodelan pelbagai objektif

, kami tidak mahu memperkenalkan semua. aplikasi Reka bentuk objektif dalam cadangan videoBerlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

1. Pemikiran tentang reka bentuk sasaran

Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

Pertama sekali, sila fikirkan tentang cara mereka bentuk sasaran sistem pengesyoran dalam senario mendalam video?

Dalam sistem pengesyoran tradisional, pengguna menggunakan sumber dengan mengklik pada kandungan atau video, dengan itu menyatakan dengan jelas keutamaan mereka terhadap sumber tersebut. Oleh itu, dalam senario pengesyoran tradisional, gelagat klik ialah isyarat yang sangat penting dan kaedah maklum balas yang jelas dan mudah. Walau bagaimanapun, dalam senario yang mengasyikkan, disebabkan kekurangan maklum balas yang jelas, keutamaan pengguna sering dinyatakan melalui gelagat "tersembunyi" Pada masa ini, masa tontonan menjadi isyarat yang amat penting dalam senario pengesyoran yang mengasyikkan

Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

Selain daripada. di atas Selain masa penggunaan, ia juga perlu untuk mempertimbangkan tingkah laku pengguna yang keluar secara aktif dalam sistem, seperti mengikuti, mengulas, berkongsi, dan menyukai. Walau bagaimanapun, berbanding dengan data main balik, data tingkah laku ini sangat jarang, mungkin hanya seperseribu daripada pesanan Selain isyarat interaktif ini, terdapat juga bahagian yang sangat penting dalam data dalam pengesyoran APP Baidu, iaitu isyarat carian. . 70% pengguna di Baidu menggunakan kedua-dua aliran maklumat dan carian yang disyorkan Oleh itu, sistem pengesyoran juga perlu menggambarkan isyarat kepuasan domain carian pengguna.

Pencipta sebelah B memerlukan satu set mekanisme persaingan untuk menyaring pencipta yang lebih rendah dan merangsang potensi kreatif pencipta berkualiti tinggi di samping isyarat penggunaan yang pengguna sisi C berpuas hati dengannya, dengan itu mencapai kitaran pengeluaran yang baik dan penggunaan

2. Dimensi yang dipertimbangkan dalam reka bentuk sasaran


Dari perspektif sistem pengesyoran, pengguna ialah pengulas contoh, dan pengguna mempunyai beberapa ekspresi positif yang jelas. , suka, mengumpul, mengulas dan tingkah laku lain Terdapat juga beberapa ungkapan negatif yang jelas, seperti Tidak suka, komen negatif, laporan, dsb. Selain ungkapan eksplisit, pengguna juga akan mempunyai beberapa ungkapan tersirat, seperti kesukaan yang dinyatakan melalui penyiapan main balik, tempoh main balik, penggunaan halaman pengarang, membaca cadangan berkaitan, dsb., atau tidak suka dinyatakan melalui main balik pendek, pop timbul pantas, dsb. . Oleh itu, apabila mereka bentuk matlamat, kita mesti berfikir dalam semua aspek, mengimbangi isyarat eksplisit dan isyarat tersirat, dan mengelakkan mereka bentuk sistem pengesyoran "separa". Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

3. Pemodelan Kepuasan Komprehensif

Selain daripada matlamat asas di atas, kami juga akan mereka bentuk beberapa matlamat peringkat tinggi, tidak lagi hanya menggunakan maklum balas pengguna. Sebagai contoh, seperti yang ditunjukkan di sebelah kanan rajah di atas, kami telah melancarkan model berdasarkan maklum balas kepuasan pengguna. Pada peringkat pertama, melalui isyarat padat seperti penyiapan dan tempoh siaran, peraturan atau model mudah digunakan untuk menyesuaikan maklum balas kepuasan pengguna untuk mendapatkan label kepuasan pengguna yang agak padat. Pada peringkat kedua, model kepuasan dibina berdasarkan label ini, menggunakan Pembenaman yang dijana oleh model carian tolak berskala besar, Pembenaman asas Wenxin dan pemodelan ciri potret dan jujukan tingkah laku pengguna untuk menilai keuntungan kepuasan relatif domain yang disyorkan ke domain carian. Jika pengguna telah menggunakan titik minat tertentu dalam carian, sistem pengesyoran boleh mengesyorkan kandungan berkualiti tinggi berdasarkan model kepuasan, yang boleh menjadikan penyepaduan carian dan mendorong minat carian yang lebih lancar dan memindahkan minat carian ke suapan dengan lebih baik. Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

4. Pemodelan Nilai Jangka Panjang (Nilai Jangka Panjang)

Dalam artikel sebelum ini, kami memperkenalkan cara menganggarkan masa bermain dan interaksi kandungan semasa. Kami boleh menggunakan gelagat penggunaan sejarah pengguna sebagai sampel atau ciri untuk meramalkan sama ada kandungan yang akan datang akan mendapat maklum balas positif atau negatif, dan sama ada akan wujud interaksi dan penggunaan yang memuaskanBerlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

Kita boleh memikirkan lagi sama ada terdapat hubungan antara kandungan penggunaan masa depan pengguna dan kandungan penggunaan semasa? Sebagai contoh, jika pengguna sedang menonton video Guo Degang sekarang, dan jika mereka terus menggunakan video Yu Qian pada hari ke N berikutnya, adakah video Yu Qian ini "diilhamkan" oleh video Guo Degang? Bolehkah mengambil tempat menarik masa hadapan dianggap sebagai "sambungan" tempat menarik semasa? Jawapannya ya. Oleh itu, kami memperkenalkan sistem LTV dalam sistem untuk mengaitkan kandungan nilai jangka panjang masa hadapan kepada pengesyoran video semasa

Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

Anggap V0 ialah nilai video semasa, V1 . boleh dikaitkan dengan V0 . Terdapat banyak kaedah atribusi Mengikut senario perniagaan Suapan Baidu, atribusi termasuk tiga bahagian berikut: Atribusi fungsional: Jika anda melihat sumber yang dipasang melalui pengesyoran yang berkaitan, maka Bahagian ini daripada pengesyoran. Isyarat penggunaan sumber boleh dikaitkan dengan V

0

.

  • Atribusi persatuan ingat semula: Contohnya, peringkat penarikan balik secara tersirat dipanggil semula melalui itemCF dan sebagainya. Korelasi: Contohnya, korelasi antara sumber boleh diukur melalui pembenaman berbilang modal atau pembenaman model besar yang disyorkan, seperti V
  • n
  • dan V mempunyai skor korelasi yang agak tinggi, nilai Vn boleh dikaitkan dengan V0 Sudah tentu, atribusi ini ditimbangkan Kami menggunakan selang masa dari V0 dan korelasi V0 untuk melaraskan berat atribusi penggunaan video masa hadapan pengguna, dengan itu memperoleh The semasa. nilai jangka panjang video V
  • 0
. Selepas mempunyai matlamat nilai jangka panjang, pembelajaran adalah agak mudah Langkah pertama ialah menormalkan matlamat, dan kemudian secara langsung memodelkannya.

Berdasarkan abstraksi dan menyisir situasi perniagaan semasa, kami akan bermula dari tiga arah berikut untuk membuat ringkasan ringkas semasa mereka bentuk matlamat sistem pengesyoran

Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

tujuan utama berbilang daripada pemodelan sasaran fizikal asas, Seterusnya ialah pemodelan beberapa matlamat peringkat tinggi untuk menggambarkan kepuasan keseluruhan pemandangan, dan juga perlu mengawal selia ekologi.

  • Cipta nilai masa hadapan.
  • Selain dimensi sumber, dimensi lain juga boleh dipertimbangkan, seperti pemodelan dimensi pengarang.
  • Untuk mempertimbangkan pelbagai hala tuju pembangunan secara menyeluruh, matlamat sistem pengesyoran perlu didekati dari pelbagai sudut5 perubahan teknologi model Suapan Baidu, evolusi pengalaman yang dipautkan

. senario cadangan semasa Baidu Ia telah dibahagikan kepada tiga senario utama:

Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

Aliran maklumat "Disyorkan": Ia telah wujud selama bertahun-tahun.

Adegan "Discover": Sebaliknya, suapan utama lebih berorientasikan maklumat, manakala "Discover" lebih meriah dan dekat dengan kehidupan.

Adegan "Immersive": aliran penggunaan video tulen.
  • Perkembangan dan evolusi produk Baidu telah membawa kepada perubahan beransur-ansur matlamat ranking. Pada mulanya, ia hanya mempunyai matlamat utama satu bidang, dan kemudian berkembang menjadi berbilang bidang dan berbilang matlamat Kini ia telah mencapai pemodelan menyeluruh bagi seluruh bidang, menyepadukan sampel daripada pelbagai bidang untuk mencapai perkongsian maklumat sepenuhnya. Berikut akan memperkenalkan kandungan khusus pemodelan komprehensif dalam semua bidang
6.

Pertama, mari kita lihat apa yang telah dilakukan oleh industri. Sama ada MMoE, PLE, atau rangkaian STAR, PEPNet dan struktur lain yang sedang diusahakan oleh Alibaba, serta syarikat seperti Google dan Tencent, mereka tidak berusaha keras untuk mereka bentuk pelbagai struktur rangkaian berdasarkan perniagaan mereka sendiri, dengan harapan dapat berkongsi mereka dalam senario heterogen. Maklumat yang lebih berguna. Kerja-kerja ini terutamanya menyelesaikan dua masalah:

  • Masalah penghijrahan isyarat merentas domain dan cara untuk berhijrah dengan lebih baik antara dua domain berbeza untuk mencapai perkongsian maklumat merentas domain.
  • Masalah pemindahan negatif antara berbilang sasaran ialah kesan jungkat-jungkit daripada berbilang sasaran.

Begitu juga, sistem cadangan Baidu juga menghadapi dua masalah ini.

Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

Terdapat banyak sasaran subdomain yang berbeza dalam senario Baidu, dan korelasi antara sasaran ini adalah rendah, yang mungkin membawa kepada penghijrahan negatif antara berbilang sasaran. Untuk menyelesaikan masalah ini, seseorang perlu menganalisis PNR antara sasaran yang berbeza dan mengetahui perbezaan korelasi antara mereka. Dalam erti kata lain, cara untuk menerangkan maklumat pengguna dalam senario heterogen dan cara melaksanakan pemindahan maklumat heterogen adalah masalah yang perlu diselesaikan oleh struktur model

Menurut keperluan perniagaan Baidu, kami mereka bentuk lapisan merentas domain. struktur rangkaian berbilang objektif mengamalkan struktur Gating. Struktur ini terbahagi kepada tiga lapisan: yang pertama ialah rangkaian perkongsian yang diperibadikan sebagai lapisan bawah; lapisan kedua ialah rangkaian GCG untuk pengekstrakan maklumat merentas domain dan lapisan terakhir ialah rangkaian sub-domain berbilang objektif; Melalui reka bentuk ini, kami boleh melakukan anggaran berbilang objektif untuk setiap domain sambil berkongsi maklumat

Penyelesaian ini telah meningkat dengan ketara berbanding dengan berbilang objektif domain tunggal AUC pelancaran pertama telah meningkat kira-kira 3-9 ribu. titik. Seperti yang ditunjukkan di sudut kanan bawah rajah di atas, selepas memperoleh pembenaman ciri pengguna dalam berbilang domain dan melakukan pengurangan dimensi TSNE, kecuali carian C dan lompatan kedua adalah agak hampir, perbezaan antara dua senario lain masih agak jelas, menunjukkan bahawa Model boleh mempelajari perbezaan antara adegan. Adalah munasabah bahawa tidak banyak perbezaan antara senario carian C dan senario hop kedua Kedua-duanya adalah senario video, dan interaksi dan minat pengguna tidak begitu berbeza.

Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

Senario perniagaan Baidu mempunyai lebih daripada 40 sasaran fizikal, 4 subdomain besar dan 6 borang, termasuk video, grafik, dinamik, program kecil, dsb. Kami berharap model itu boleh berprestasi baik dalam banyak perniagaan yang kompleks. Mari kita perkenalkan secara ringkas struktur model. Lapisan pertama ialah rangkaian biasa, yang berfungsi sebagai asas untuk pembahagian domain, menyaring sampel berbilang sasaran yang memuaskan dalam setiap adegan, dan melaksanakan pemetaan benam yang diperibadikan melalui rangkaian get. Lapisan kedua ialah pengekstrakan maklumat antara domain, yang melaksanakan ciri unik dan ciri kongsi yang diperibadikan dalam domain melalui rangkaian CGC. Kedua-duanya bersama-sama membina pengekstrakan maklumat merentas domain Kelebihannya ialah ia bukan sahaja mengekalkan kekayaan maklumat dalam domain, tetapi juga mengekstrak maklumat kongsi adegan heterogen. Lapisan ketiga ialah pemodelan berbilang objektif subdomain. Kami juga mempunyai kertas kerja berkaitan yang diterbitkan mengenai topik ini. Rakan-rakan yang berminat dengan butiran boleh membaca kertas tersebut.

4. Gabungan pelbagai objektif

Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

Baidu pelbagai objektif proses evolusi adalah serupa dengan proses evolusi gabungan pelbagai objektif Yang pertama ialah gabungan pengetahuan sedia ada, yang walaupun mudah dan mudah, memerlukan tenaga kerja yang ramai. Kemudian kami menaik taraf kepada LTR, dan kesannya adalah luar biasa Namun, kelemahannya ialah ia memerlukan pelarasan yang kerap apabila perniagaan berubah Pada masa yang sama, hubungan pesanan separa juga berubah dengan perubahan dalam stratifikasi perniagaan dan pengguna. Selepas itu, kami menggunakan model nilai gabungan berbilang objektif, menggunakan pendekatan optimum berurutan. Selepas tempoh penggunaan yang singkat, kami menaik taraf kepada kaedah yang kami gunakan sekarang - ES (Strategi Evolusi) pembelajaran evolusi

Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain

Untuk menggunakan ES, anda perlu menentukan ganjaran terlebih dahulu, iaitu Bintang Utara penunjuk. Ganjaran Baidu ialah kedalaman sesi (tempoh + panjang langkah) dan interaksi Penunjuk perniagaan yang sepadan dengan tempoh dan panjang langkah ialah tempoh dan volum main balik video ini mencerminkan pengekalan pengguna, iaitu LT. Selain itu, terdapat maklumat interaktif, yang mewakili pengumpulan aset pengguna dalam APP, seperti memberi perhatian kepada tingkah laku pengarang Malah, dia berharap dapat mencari pengarang selepas dia mengemas kini. Sama ada meningkatkan bilangan penggunaan atau interaksi, kami berharap pengguna dapat menggunakan APP ini untuk tempoh masa yang lebih lama

Versi awal kami ialah model heuristik yang mudah, manakala ES dalam talian semasa melakukan pengiraan yang lebih maju, seperti memperkenalkan maklumat tentang senario dan kumpulan orang yang berbeza

Atas ialah kandungan terperinci Berlatih dan berfikir tentang anggaran dan gabungan berbilang objektif pengesyoran video Baidu merentas domain. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam