Rumah >Peranti teknologi >AI >Penerokaan dan amalan pengoptimuman kedudukan kasar carian Meituan
Pengarang: Xiaojiang Suogui Li Xiang et al
Kedudukan kasar ialah pencarian dan promosi dalam industri modul penting sistem. Dalam penerokaan dan amalan mengoptimumkan kesan kedudukan kasar, pasukan kedudukan carian Meituan mengoptimumkan kedudukan kasar daripada dua aspek: pautan kedudukan halus dan pengoptimuman bersama kesan dan prestasi berdasarkan senario perniagaan sebenar, meningkatkan kesan kedudukan kasar.
Seperti yang kita semua tahu, dalam carian, pengesyoran, pengiklanan dan bidang aplikasi industri berskala besar lain, untuk mengimbangi prestasi dan kesan, sistem kedudukan biasanya digunakan seni bina Cascade [1,2], seperti yang ditunjukkan dalam Rajah 1 di bawah. Mengambil sistem kedudukan carian Meituan sebagai contoh, keseluruhan kedudukan dibahagikan kepada peringkat pengisihan kasar, pengisihan halus, penyusunan semula dan peringkat pengisihan bercampur terletak di antara pengisihan semula dan pengisihan halus, dan ia perlu menapis item seratus peringkat; set daripada set item calon peringkat seribu Berikannya kepada lapisan mendayung yang halus.
Rajah 1 Corong Isih
Melihat modul kedudukan kasar dari perspektif pautan penuh Meituan kedudukan carian , pada masa ini terdapat beberapa cabaran dalam pengoptimuman lapisan pengisihan kasar:
Artikel ini akan menumpukan pada cabaran di atas untuk berkongsi penerokaan dan amalan yang berkaitan pengoptimuman lapisan ranking kasar carian Meituan Antaranya, kami meletakkan masalah bias pemilihan sampel bersama-sama dalam masalah hubungan kedudukan halus. Artikel ini terbahagi terutamanya kepada tiga bahagian: bahagian pertama akan memperkenalkan secara ringkas laluan evolusi lapisan kedudukan kasar kedudukan carian Meituan bahagian kedua memperkenalkan penerokaan dan amalan pengoptimuman kedudukan kasar yang berkaitan, yang pertama adalah menggunakan pengetahuan penyulingan dan pembelajaran perbandingan untuk membuat perkaitan yang baik antara pengisihan kasar dan pengisihan kasar untuk mengoptimumkan kesan pengisihan kasar Tugas kedua ialah mempertimbangkan prestasi pengisihan kasar dan pengoptimuman pengoptimuman pengisihan kasar Semua kerja berkaitan telah dalam talian sepenuhnya kesannya adalah penting; bahagian terakhir ialah ringkasan dan pandangan Saya harap kandungan ini berguna dan memberi inspirasi kepada semua orang.
Evolusi teknologi ranking kasar Meituan Search dibahagikan kepada peringkat berikut:
Pada peringkat ini, model dua menara yang biasa digunakan dalam model susun atur kasar dalam industri, seperti Tencent [3] dan model NN interaktif, seperti Alibaba Baba[1,2]. Perkara berikut terutamanya memperkenalkan kerja pengoptimuman berkaitan Carian Meituan dalam proses menaik taraf kedudukan kasar kepada model NN, yang terutamanya merangkumi dua bahagian: pengoptimuman kesan kedudukan kasar dan pengoptimuman gabungan kesan & prestasi.
Dengan banyak kerja pengoptimuman kesan [5,6] yang dilaksanakan dalam model NN Kedudukan Halus Carian Meituan, kami juga mula meneroka pengoptimuman NN kedudukan kasar model . Memandangkan pengisihan kasar mempunyai kekangan prestasi yang ketat, ia tidak boleh digunakan untuk menggunakan semula secara langsung kerja pengoptimuman pengisihan halus kepada pengisihan kasar. Berikut akan memperkenalkan pengoptimuman kesan kaitan pengisihan halus dengan memindahkan keupayaan pengisihan pengisihan halus kepada pengisihan kasar, serta pengoptimuman tukar ganti bagi kesan dan prestasi carian automatik berdasarkan struktur rangkaian saraf.
Model pengisihan kasar dihadkan oleh kekangan prestasi pemarkahan, yang akan membawa kepada struktur model yang lebih mudah dan bilangan ciri yang lebih kecil daripada model pengisihan halus jauh lebih rendah daripada pengisihan halus, jadi kesan pengisihan adalah lebih buruk daripada pengisihan halus. Untuk mengimbangi kehilangan kesan yang disebabkan oleh struktur ringkas dan ciri yang lebih sedikit bagi model penarafan kasar, kami mencuba kaedah penyulingan pengetahuan [7] untuk memautkan kedudukan halus untuk mengoptimumkan kedudukan kasar.
Penyulingan pengetahuan ialah kaedah biasa dalam industri untuk memudahkan struktur model dan meminimumkan kehilangan kesan Ia mengamalkan paradigma Guru-Pelajar: model dengan struktur yang kompleks dan keupayaan pembelajaran yang kukuh digunakan sebagai model Guru Model dengan struktur yang agak mudah digunakan sebagai model Pelajar, dan model Guru digunakan untuk membantu latihan model Pelajar, seterusnya memindahkan "pengetahuan" model Guru kepada model Pelajar untuk menambah baik. kesan model Pelajar. Gambarajah skema penyulingan baris halus dan penyulingan baris kasar ditunjukkan dalam Rajah 2 di bawah Skim penyulingan dibahagikan kepada tiga jenis berikut: penyulingan hasil baris halus, penyulingan skor ramalan baris halus, dan penyulingan perwakilan ciri. Pengalaman praktikal skim penyulingan ini dalam kedudukan kasar carian Meituan akan diperkenalkan di bawah.
Rajah 2 Gambarajah skema penyulingan baris halus dan baris kasar
Penyisihan kasar adalah pra-modul untuk penyortiran yang baik. tingkah laku ( klik , membuat pesanan, membayar ) sebagai sampel positif, dan mendedahkan item yang tidak berlaku sebagai sampel negatif, anda juga boleh memperkenalkan beberapa sampel positif dan negatif yang dibina melalui hasil pengisihan model pengisihan halus, yang boleh mengurangkan pengisihan kasar pada tahap tertentu Kecondongan pemilihan sampel model juga boleh memindahkan keupayaan pengisihan halus kepada pengisihan kasar. Berikut akan memperkenalkan pengalaman praktikal menggunakan hasil pengisihan halus untuk menyaring model pengisihan kasar dalam senario carian Meituan.
Strategi 1: Berdasarkan sampel positif dan negatif yang dilaporkan oleh pengguna, pilih secara rawak sebilangan kecil sampel yang tidak terdedah di bahagian bawah pengisihan halus untuk menambah pengisihan kasar sampel negatif, seperti yang ditunjukkan dalam Rajah 3. Perubahan ini mempunyai Recall@150 luar talian ( sila rujuk lampiran untuk penjelasan penunjuk) +5PP, dan CTR dalam talian +0.1%.
Rajah 3 Contoh negatif hasil pengisihan tambahan
Strategi 2 : Secara langsung melakukan pensampelan rawak dalam set yang disusun halus untuk mendapatkan sampel latihan Kedudukan yang disusun dengan halus digunakan sebagai label untuk membina pasangan untuk latihan, seperti yang ditunjukkan dalam Rajah 4 di bawah. Berbanding dengan strategi 1, kesan luar talian ialah Recall@150 +2PP, dan CTR dalam talian ialah +0.06%.
Rajah 4 Isih depan dan belakang untuk membentuk sampel pasangan
Strategi 3: Berdasarkan pemilihan set sampel strategi 2, label dibina dengan mengklasifikasikan kedudukan isihan halus, dan kemudian pasangan dibina mengikut label terperingkat untuk latihan. Berbanding dengan strategi 2, kesan luar talian ialah Recall@150 +3PP, dan CTR dalam talian ialah +0.1%.
Penyulingan sebelumnya menggunakan hasil pengisihan ialah cara kasar untuk menggunakan maklumat kedudukan yang baik Kami seterusnya menambah berdasarkan skor Ramalan ini penyulingan [8], adalah diharapkan bahawa output skor oleh model ranking kasar dan output taburan skor oleh model ranking halus akan sejajar yang mungkin, seperti yang ditunjukkan dalam Rajah 5 di bawah:
Rajah 5 Pembinaan skor ramalan kedudukan halus kerugian tambahan
Dari segi pelaksanaan khusus, kami menggunakan paradigma penyulingan dua peringkat untuk menyaring model klasifikasi kasar berdasarkan model pengelasan halus yang telah dilatih Kehilangan penyulingan menggunakan ralat kuasa dua minimum keluaran kasar model pengelasan dan keluaran model pengelasan halus , dan tambahkan parameter Lambda untuk mengawal kesan Kehilangan penyulingan pada Kehilangan akhir, seperti yang ditunjukkan dalam formula (1). Menggunakan kaedah penyulingan pecahan yang tepat, kesan luar talian ialah Recall@150 +5PP, dan kesan dalam talian ialah CTR +0.05%.
Industri menggunakan penyulingan pengetahuan untuk membimbing pemodelan perwakilan kedudukan halus dan kasar, yang telah disahkan sebagai cara yang berkesan untuk meningkatkan prestasi model [7], walau bagaimanapun, secara langsung menggunakan kaedah tradisional untuk menyaring perwakilan mempunyai kelemahan berikut: Pertama, adalah mustahil untuk menyaring hubungan pengisihan antara pengisihan kasar dan pengisihan halus Seperti yang dinyatakan di atas, penyulingan hasil pengisihan dalam senario kami adalah di luar talian dan dalam talian. Kesannya ditambah baik ke atas semua perkara di atas; yang kedua ialah skim penyulingan pengetahuan tradisional yang menggunakan perbezaan KL sebagai ukuran perwakilan, yang merawat setiap dimensi perwakilan secara bebas dan tidak dapat menyaring maklumat yang sangat relevan dan berstruktur [9]. Walau bagaimanapun, di Amerika Syarikat, Dalam senario carian kumpulan, data adalah sangat berstruktur, jadi menggunakan strategi penyulingan pengetahuan tradisional untuk penyulingan perwakilan mungkin tidak dapat menangkap pengetahuan berstruktur ini dengan baik.
Kami menggunakan teknologi pembelajaran kontrastif untuk model ranking kasar, supaya model ranking kasar juga boleh menyaring hubungan tertib semasa menyuling perwakilan model ranking halus. Kami menggunakan untuk mewakili model kasar dan untuk mewakili model yang baik. Katakan q ialah permintaan dalam set data ialah contoh positif di bawah permintaan dan ialah contoh k negatif yang sepadan di bawah permintaan itu.
Kami memasukkan masing-masing ke dalam rangkaian kedudukan kasar dan halus, dan mendapatkan perwakilan sepadannya , dan Pada pada masa yang sama, kami memasukkan ke dalam rangkaian ranking kasar untuk mendapatkan perwakilan yang dikodkan oleh model ranking kasar. Untuk pemilihan pasangan contoh negatif untuk pembelajaran perbandingan, kami menggunakan penyelesaian dalam Strategi 3 untuk membahagikan susunan pengisihan halus ke dalam tong. dan pengisihan halus antara tong berbeza dianggap sebagai contoh positif. Pasangan perwakilan dianggap sebagai contoh negatif, dan kemudian InfoNCE Loss digunakan untuk mengoptimumkan matlamat ini:
di mana mewakili hasil darab titik dua vektor, dan ialah pekali suhu. Dengan menganalisis sifat kehilangan InfoNCE, tidak sukar untuk mendapati bahawa formula di atas pada asasnya bersamaan dengan sempadan bawah yang memaksimumkan maklumat bersama antara perwakilan kasar dan perwakilan halus. Oleh itu, kaedah ini pada asasnya memaksimumkan ketekalan antara perwakilan halus dan perwakilan kasar pada tahap maklumat bersama, dan boleh menyaring pengetahuan berstruktur dengan lebih berkesan.
Rajah 6 Pemindahan maklumat peringkat halus pembelajaran kontrastif
Berdasarkan formula di atas (1) Pada selain itu, kehilangan penyulingan perwakilan pembelajaran kontrastif tambahan, kesan luar talian Recall@150 +14PP, CTR dalam talian +0.15%. Untuk butiran kerja berkaitan, sila rujuk kertas kami [10] (di bawah penyerahan).
Seperti yang dinyatakan sebelum ini, calon kedudukan kasar yang ditetapkan untuk ramalan dalam talian adalah agak besar Memandangkan kekangan prestasi pautan penuh sistem, kedudukan kasar perlu dipertimbangkan kecekapan ramalan. Kerja yang dinyatakan di atas semuanya dioptimumkan berdasarkan paradigma DNN + penyulingan mudah, tetapi terdapat dua masalah:
Menurut pengalaman praktikal kami, memperkenalkan secara langsung ciri silang ke dalam lapisan kasar tidak dapat memenuhi keperluan kependaman dalam talian. Oleh itu, untuk menyelesaikan masalah di atas, kami telah meneroka dan melaksanakan penyelesaian pemodelan ranking kasar berdasarkan carian seni bina rangkaian saraf Penyelesaian ini secara serentak mengoptimumkan kesan dan prestasi model ranking kasar dan memilih gabungan ciri dan model terbaik yang memenuhi. keperluan kelewatan kedudukan kasar, rajah seni bina keseluruhan ditunjukkan dalam Rajah 7 di bawah:
Rajah 7 Ciri dan struktur model berdasarkan NAS
Pilih Di bawah kami akan memperkenalkan secara ringkas dua perkara teknikal utama pencarian seni bina rangkaian saraf (NAS) dan pengenalan pemodelan kecekapan:
Untuk penggunaan masa ciri, jangkaan kelewatan setiap ciri fi boleh dimodelkan seperti yang ditunjukkan dalam formula (5), di mana ialah kelewatan setiap ciri yang direkodkan oleh pelayan.
Dalam situasi sebenar, ciri boleh dibahagikan kepada dua kategori Satu bahagian ialah ciri penghantaran telus hulu, dan kelewatannya terutamanya datang dari huluan masa kelewatan penghantaran; jenis ciri lain datang daripada pemerolehan tempatan (membaca KV atau pengiraan), maka kelewatan setiap gabungan ciri boleh dimodelkan sebagai:
di mana dan mewakili bilangan set ciri yang sepadan, dan Memodelkan ciri sistem tarik serentak.
Untuk pemodelan kelewatan struktur model, sila rujuk bahagian kanan Rajah 7 di atas Memandangkan pelaksanaan Mixops ini dilakukan secara berurutan, kita boleh mengira kelewatan struktur model secara rekursif. . Apabila , penggunaan masa keseluruhan bahagian model boleh dinyatakan oleh lapisan terakhir Mixop Gambarajah skematik ditunjukkan dalam Rajah 8 di bawah:
Rajah 8 Sambungan model Gambarajah pengiraan masa
Sebelah kiri Rajah 8 ialah rangkaian kasar yang dilengkapi dengan pemilihan seni bina rangkaian, yang mewakili berat unit neural ke lapisan. Di sebelah kanan ialah gambarajah skema pengiraan kelewatan rangkaian. Oleh itu, penggunaan masa bagi keseluruhan bahagian ramalan model boleh dinyatakan oleh lapisan terakhir model, seperti yang ditunjukkan dalam formula (7):
Akhir sekali, kami memperkenalkan indeks kecekapan ke dalam model, Kehilangan akhir latihan model ditunjukkan dalam formula berikut (8), di mana f mewakili rangkaian kedudukan halus, mewakili faktor keseimbangan, dan mewakili output pemarkahan bagi ranking kasar dan ranking halus masing-masing.
Secara bersama mengoptimumkan kesan dan prestasi ramalan model kedudukan kasar melalui pemodelan carian seni bina rangkaian saraf, Recall@150 +11PP luar talian, akhirnya dalam talian Apabila kelewatan atas tidak meningkat, penunjuk dalam talian CTR +0.12% untuk kerja terperinci, sila rujuk [13], yang telah diterima oleh KDD 2022;
Bermula dari 2020, kami telah melaksanakan model MLP berlapis kasar melalui sejumlah besar pengoptimuman prestasi kejuruteraan akan diteruskan ke Berdasarkan model MLP, model penarafan kasar diulang secara berterusan untuk meningkatkan kesan penarafan kasar.
Pertama sekali, kami menggunakan skim penyulingan yang biasa digunakan dalam industri untuk menghubungkan kedudukan baik untuk mengoptimumkan kedudukan kasar, dan menjalankan tiga peringkat penyulingan hasil kedudukan halus, skor ramalan kedudukan halus penyulingan, dan penyulingan perwakilan ciri Sebilangan besar eksperimen telah dijalankan untuk menambah baik kesan model reka letak kasar tanpa meningkatkan kelewatan dalam talian. Kedua, memandangkan kaedah penyulingan tradisional tidak dapat mengendalikan maklumat berstruktur ciri dengan baik dalam senario pengisihan, kami membangunkan skema yang dibangunkan sendiri untuk memindahkan maklumat pengisihan halus kepada pengisihan kasar berdasarkan pembelajaran kontrastif.
Akhirnya, kami seterusnya mempertimbangkan bahawa pengoptimuman kasar pada asasnya adalah pertukaran antara kesan dan prestasi Kami menerima pakai idea pemodelan berbilang objektif untuk mengoptimumkan kesan dan prestasi secara serentak, dan melaksanakan seni bina rangkaian saraf secara automatik Teknologi carian digunakan untuk menyelesaikan masalah, membolehkan model memilih set ciri dan struktur model secara automatik dengan kecekapan dan kesan terbaik. Pada masa hadapan, kami akan terus mengulangi teknologi lapisan kasar dari aspek berikut:
Penunjuk luar talian pengisihan tradisional kebanyakannya berdasarkan penunjuk NDCG, MAP dan AUC Untuk pengisihan kasar, intipatinya adalah berat sebelah terhadap tugas mengingat semula yang menyasarkan pemilihan set, jadi penunjuk kedudukan tradisional tidak kondusif untuk mengukur kesan lelaran model kedudukan kasar. Kami merujuk kepada penunjuk Recall dalam [6] sebagai ukuran kesan luar talian pengisihan kasar, iaitu, menggunakan hasil pengisihan halus sebagai kebenaran asas untuk mengukur tahap penjajaran keputusan TopK bagi pengisihan kasar dan pengisihan halus. Takrifan khusus penunjuk Recall adalah seperti berikut:
Maksud fizikal formula ini adalah untuk mengukur pertindihan antara K atas isihan kasar dan K atas isihan halus ini penunjuk lebih konsisten dengan pemilihan set pengisihan kasar intipati.
Xiaojiang, Suogui, Li Xiang, Cao Yue, Peihao, Xiao Yao, Dayao, Chen Sheng, Yunsen, Li Qian dsb., semua daripada Platform Meituan/ Jabatan Algoritma Pengesyoran Carian.
Atas ialah kandungan terperinci Penerokaan dan amalan pengoptimuman kedudukan kasar carian Meituan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!