Rumah > Artikel > Peranti teknologi > Aplikasi model UPLIFT mendalam dalam senario pertumbuhan pengguna Tencent Financial
Perkongsian hari ini tertumpu terutamanya pada model UPLIFT mendalam, termasuk cabaran teknikal utama dan sejarah pembangunan model jenis ini, dan juga memperkenalkan kes klasik model UPLIFT mendalam yang membantu pertumbuhan pengguna Tencent FinTech.
Pertama sekali, mari perkenalkan model UPLIFT.
Senario klasik: Bagaimana untuk mencari kumpulan pelanggan yang optimum untuk aktiviti pemasaran? Atau bagaimana untuk mencari kaedah insentif pemasaran yang optimum?
Idea biasa adalah untuk menyasarkan pengguna dengan kesanggupan yang tinggi (Perkara Pasti dan Kuadran Boleh Diyakinkan dalam rajah di atas), tetapi masalah terbesar dengan idea ini ialah: ia mengabaikan aliran semula jadi pengguna Penukaran pengguna. Pertama sekali, sesetengah pengguna berniat tinggi (pengguna kuadran Sure Things) boleh menukar secara semula jadi tanpa pengiklanan di samping itu, di bawah model pemasaran kupon diskaun, pengiklanan terus kepada pengguna yang berniat tinggi sering mengakibatkan kerugian kos tinggi. Adakah mungkin untuk beralih kepada pengguna dengan kesediaan yang rendah (Do Note Disturbs and Lost Causes kuadran)? Meningkatkan kesediaan mereka untuk mengambil melalui pengiklanan? Malah, bagi pengguna yang mempunyai kesediaan yang rendah, kebarangkalian penukaran mereka adalah sangat rendah. Mereka mungkin tidak menukar tidak kira berapa banyak yang anda laburkan, atau mereka mungkin hilang secara kekal, tetapi ini akan memakan banyak kos pemasaran.
Oleh itu, sebelum menyelesaikan masalah pemasaran jenis ini, kita perlu kembali kepada konsep pemasaran - "marketing gain". "Keuntungan pemasaran" bermakna aktiviti pemasaran kami harus menumpukan pada bahagian pengguna yang boleh mengubah pendirian mereka. Dalam istilah awam, kumpulan pelanggan sasaran yang kami cari ialah kumpulan orang yang tidak akan menukar sebelum pemasaran, tetapi akan menukar selepas pemasaran (kumpulan kuadran yang boleh diyakinkan), dan model UPLIFT adalah untuk mencari kumpulan orang ini yang sensitif terhadap insentif pemasaran.
Apabila menilai sama ada pengguna akan menukar selepas pemasaran kepada pengguna, model adalah Model Respons yang sering dibina Model ini akan meramalkan kadar penukaran setiap pengguna Kemudian kami akan menentukan ambang kadar penukaran berdasarkan satu siri analisis data, anggaran kos, dsb., dan menghantar kepada pengguna yang diramalkan lebih tinggi daripada ini. ambang kadar penukaran. Model tindak balas adalah mudah dan cekap, dan boleh dibina secara langsung menggunakan semua model pembelajaran mesin arus perdana/pembelajaran mendalam Walau bagaimanapun, masalah terbesarnya ialah ia tidak mengambil kira bahagian trafik penukaran semula jadi yang boleh ditukar tanpa pemasaran, jadi matlamat pemodelan dan matlamat perniagaan tidak sama.
Model UPLIFT menggunakan satu atau lebih model untuk meramalkan kadar penukaran pengguna di bawah kadar penukaran pemasaran dan bukan pemasaran , perbezaan antara dua nilai ini ialah UPLIFT. Pada akhirnya, kami memutuskan sama ada untuk melancarkan berdasarkan saiz nilai UPLIFT.
Membandingkan model tindak balas dan keluk model UPLIFT dalam rajah di atas, kita dapat melihat bahawa model UPLIFT akan membawa kepada masa intervensi yang lebih awal. Dalam senario amaran awal churn pengguna, operasi perlu mengekalkan pengguna yang akan kehilangan lebih awal. Dalam aplikasi praktikal, adalah tidak bermakna untuk meramalkan masa tertentu perputaran pengguna. Menggunakan langkah pengekalan kepada pengguna ini mungkin telah terlepas masa intervensi terbaik, dan meramalkan pengguna yang boleh dikekalkan oleh langkah operasi adalah bernilai praktikal.
Model UPLIFT itu sendiri adalah dalam bidang inferens sebab rajah di atas meringkaskan secara ringkas inferens sebab penyelidikan pemerhatian. Pertama, ia termasuk kaedah inferens penyebab klasik Kaedah ini terutamanya mengkaji kesan intervensi purata dan membentuk penilaian keseluruhan kesan strategi Contohnya, beberapa sarjana mengkaji "sama ada merokok berbahaya kepada kesihatan" dan membuat kesimpulan bahawa jangka panjang merokok akan mengurangkan jangka hayat Kesimpulannya selalunya berarah dan tidak dapat membentuk strategi khusus Ini adalah masalah yang kita hadapi dalam kerja amali - iaitu bagaimana untuk melaksanakan kaedah inferens penyebab. Sebaliknya, model UPLIFT ialah model yang mengkaji kesan sebab akibat heterogen. Didapati bahawa kesan intervensi ke atas kumpulan yang berbeza atau individu yang berbeza adalah berbeza, dengan itu menemui peraturan mekanisme intervensi dan membentuk strategi yang diperibadikan.
Seterusnya kami memperkenalkan beberapa definisi:(1) Rangka kerja hasil yang berpotensi Neyman-Rubin: Individu (sampel) mempersembahkan hasil yang berpotensi berdasarkan atribut sedia ada mereka sendiri ini selalunya hanya mempunyai satu pihak dalam dunia sebenar, yang akan membawa kepada Inilah masalah besar: Bias Induktif.
(2) CATE: Matlamat pemodelan model UPLIFT.
(3) Andaian asas unconfoundedness (Unconfoundedness) : Hanya dengan mengawal faktor pengacau (dan tiada faktor pengacau yang belum ditemui) CATE yang tidak berat sebelah boleh dianggarkan.
Model UPLIFT mempunyai pelbagai aplikasi industri, dan kaedah aplikasi boleh dibahagikan secara kasar kepada dua kategori: satu adalah untuk menilai campur tangan Kesan heterogen HTE. Mengambil ujian A/B sebagai contoh, kesan intervensi yang diperhatikan secara keseluruhan mungkin tidak ketara, tetapi menelusuri model UPLIFT boleh mencari subkumpulan dengan kesan intervensi yang ketara. Kategori pertama ialah pengoptimuman strategi, termasuk penyesuaian strategi dalam bidang perkhidmatan awam dan pemasaran Internet yang diperibadikan.
Pemodelan UPLIFT secara amnya, kami mula-mula membuat percubaan terkawal secara rawak, dan semua kumpulan eksperimen Intervensi dijalankan, dan tiada campur tangan dalam kumpulan kawalan Kemudian sampel dikumpulkan dan dimodelkan menggunakan model UPLIFT.
Mengambil T-Leaner sebagai contoh, sampel intervensi boleh membina model tindak balas, dan sampel bukan intervensi boleh membina model tindak balas Perbezaan skor akhir ialah nilai UPLIFT.
Terdapat dua isu teras dalam pemodelan UPLIFT:
Disebabkan bias pemilihan yang disebabkan oleh mekanisme intervensi, taburan ciri sampel intervensi dan sampel bukan campur tangan adalah tidak konsisten, mengakibatkan faktor mengelirukan. Jenis faktor yang mengelirukan ini mempengaruhi kedua-dua campur tangan dan hasilnya. Disebabkan kehadiran faktor yang mengelirukan, kita tidak boleh mendapatkan kesan sebab yang bersih. Kes khusus seperti:
① Bias populariti: Pendedahan tertumpu pada campur tangan yang popular.
② Bias pemilihan: Perbezaan dalam pendedahan item dalam kalangan kumpulan orang yang berbeza.
Pemodelan berdasarkan sampel sedemikian mungkin tidak akan membawa kepada kesimpulan berkeyakinan tinggi.
Penyelesaian utama:
① Memperkenalkan istilah penyelarasan skor kecenderungan dalam kerugian.
② Memperkenalkan rantaian kecenderungan dan struktur konfrontasi ke dalam struktur model.
③ Pensampelan berwajaran songsang skor kecenderungan.
④ Perwakilan pemisahan: Cuba untuk mengasingkan istilah faktor pengacau kepada vektor.
Seperti yang ditunjukkan dalam rajah di bawah: apabila sampel/individu masing-masing diberi markah di bawah model intervensi/bukan intervensi Apabila pengedaran akhir tidak konsisten, apabila kami melakukan statistik pengedaran pada perbezaan skor intervensi-bukan intervensi (CATE), kami akan mendapati bahawa jitter adalah sangat teruk, dan sukar untuk membezakan perbezaan UPLIFT antara individu/kumpulan yang berbeza , yang menunjukkan bahawa ramalan model UPLIFT pada asasnya tidak sah.
Kes ini menunjukkan masalah kecondongan induktif: dari perspektif seni bina model, menganggarkan hasil kontrafak tanpa diawasi Isyarat, atau tahap penyelarasan anggaran hasil yang berpotensi adalah tidak konsisten, menyebabkan anggaran UPLIFT akhir tidak stabil.
Kembali kepada rangka kerja hasil potensi Neyman-Rubin, untuk individu yang berbeza kita hanya mengetahui hasil intervensi atau hasil tanpa campur tangan Adalah mustahil untuk mengetahui hasil intervensi dan bukan campur tangan pada masa yang sama , yang membawa kepada dua ramalan hasil yang berpotensi Agihan anggaran adalah tidak konsisten dan matlamat pemodelan model mendalam kami selalunya CTR atau CVR, yang tidak dapat memperoleh skor keuntungan secara langsung (UPLIFT), yang menghasilkan matlamat pemodelan dan penunjuk penilaian akhir kami. menjadi tidak konsisten. Dalam rajah kita dapat melihat bahawa pengagihan CATE adalah tidak konsisten sepenuhnya dengan pengagihan skor anggaran hasil yang berpotensi. Kami meringkaskan siri masalah ini sebagai masalah bias induktif. Masalah paranoia induktif adalah masalah teras model UPLIFT Pada masa ini, komuniti akademik telah mencadangkan empat penyelesaian berikut:
① Konsistensi vektor keluaran kontrafaktual, MMD dan kaedah penjajaran pengedaran yang lain;
④ Memperkenalkan penjumlahan semula ke dalam struktur model, EUEN.3. Cabaran aplikasi model UPLIFT
Selepas memperkenalkan isu teras UPLIFT, mari kita bincangkan secara ringkas tentang cabaran aplikasi model UPLIFT. Terdapat dua kategori utama dalam bidang kewangan: Satu ialah campur tangan berbilang nilai/nilai berterusan, dan satu lagi ialah ramalan hasil berterusan.
3. Konteks pembangunan model UPLIFT mendalam
Yang pertama dan paling asas ialah Meta-Learner Penyelesaian pemodelan yang mewakili adalah S-Learner dan T-Learner Selepas memasuki pembelajaran mendalam, ia berkembang menjadi DragonNet, DESCN, S yang diwakili dengan menyelesaikan bias hibrid. Net, CFRNet, dsb., dan FlexTENet, S-Net, EUEN, DESCN, GANITE, CFRNet, dsb., diwakili dengan menyelesaikan bias induktif.
4. Kes Permohonan: Pemasaran Kupon Bayaran Balik Kad KreditBerikut memperkenalkan kes aplikasi model UPLIFT dalam bidang teknologi kewangan. Penggunaan model UPLIFT selalunya memerlukan gabungan langkah operasi dan lelaran model. Dalam aktiviti operasi, kami bermula dengan penghantaran rawak trafik kecil untuk mengumpul sampel intervensi/bukan campur tangan, dan kemudian menjalankan pengesahan kebolehlaksanaan dan reka bentuk eksperimen, penghantaran kumpulan pelanggan strategik, pembinaan model UPLIFT dan penilaian penghantaran.Penyelesaian model UPLIFT telah melengkapkan tiga generasi lelaran:
(1) Penyelesaian generasi pertama: Meta-Learner
Pertama Penyelesaian semasa terutamanya Meta-Learner, yang boleh dilancarkan dengan cepat untuk mencapai matlamat perniagaan Perkara yang menyakitkan perniagaan adalah untuk mengawal ROI pemasaran dan meningkatkan volum.(2) Penyelesaian generasi kedua: dari CFRnet ke EFIN
Generasi kedua terutamanya berdasarkan seni bina pembelajaran mendalam, dan tujuan utamanya ialah Agar untuk merealisasikan operasi peribadi berbilang baucar, ia adalah masalah campur tangan berbilang nilai. Model utama yang digunakan ialah CRFnet dan EFIN yang dibangunkan sendiri (Explicit Feature Interaction uplift Network).
Di sini kami memberi tumpuan kepada model EFIN yang dibangunkan sendiri. Algoritma ini terutamanya mempunyai tiga modul:
Modul pertama ialah lapisan interaksi kendiri, yang menggunakan rangkaian Self-Attetion untuk mempelajari sepenuhnya ciri pengguna berskala besar.
Modul kedua ialah kunci kepada keseluruhan algoritma Pembolehubah pencelah T diwakili secara eksplisit dan dipelajari secara berasingan, yang bermanfaat untuk menyelesaikan masalah intervensi berbilang nilai. Intervensi T dan ciri X kemudiannya bersilang menggunakan mekanisme perhatian untuk meningkatkan pembelajaran kesan heterogen, yang merupakan matlamat model UPLIFT. Dan kaedah reparametrization digunakan sebagai anggaran output, yang mengurangkan masalah taburan pemarkahan yang tidak konsisten bagi hasil yang berpotensi. Modul ketiga menggunakan kekangan intervensi untuk menyukarkan model untuk membezakan sama ada sampel telah diintervensi, dalam usaha menyelesaikan masalah bias yang mengelirukan.Untuk memodelkan Ctr-Lift dan Value-Lift secara serentak, model UPLIFT berbilang objektif dijangka mencapai ROI>1 sambil mencapai pertumbuhan GMV. Kesukaran terbesar ialah kesukaran dalam memodelkan amaun UPLIFT, kerana varians dua anggaran counterfaktual amaun itu sendiri adalah sangat besar, dan varians UPLIFT yang diperoleh dengan menolaknya adalah lebih besar lagi UPLIFT yang stabil Pada masa ini, Masih berusaha untuk menyelesaikannya.
Dalam kuliah ini, kami memperkenalkan dua isu teras pemodelan UPLIFT serta dua cabaran aplikasi dan tiga generasi penyelesaian tertumpu pada model EFIN yang dibangunkan sendiri. Pada masa hadapan, kami akan menjalankan penyelidikan yang lebih mendalam dalam satu siri arah seperti pemodelan UPLIFT berbilang objektif, kekangan ROI, pemodelan UPLIFT dinamik dan pembetulan data pemerhatian.
A1: Ini pasti berkesan Kami biasanya memilih kaedah skor kecenderungan ini untuk memodelkan data pemerhatian . Satu lagi cara yang lebih langsung ialah dengan melakukan persampelan berwajaran sampel secara langsung berdasarkan taburan skor kecenderungan.
J2: Sebenarnya, gambar yang baru saya buat menjelaskan perkara ini dengan lebih jelas, kerana model pembelajaran mendalam kami masing-masing menganggarkan dua CTR kontrafaktual, dan matlamat pemodelan mereka sebenarnya adalah dua CTR Ini Jika anda mendapati perbezaan antara dua CTR , anda akan mendapati bahawa varians perbezaan ini agak besar.
A3: Masalah ini bukan masalah UPLIFT Secara amnya, Benam digunakan dan One-Hot digunakan untuk jenis kategori.
A4: Ya, S-Learner juga mempunyai DNN di dalamnya.
A5: Kelebihan terbesar model dalam ialah penggunaan struktur rangkaian yang kompleks, seperti persimpangan ciri, mekanisme perhatian, dsb., untuk mempelajari ciri sepenuhnya kelebihan terbesar model hutan dan pokok ialah kestabilan, dan model hutan mempunyai Sasaran pemodelan adalah secara langsung CATE.
A6: Kami terutamanya menggunakan AUUC dan QINI untuk penunjuk penilaian luar talian dalam talian, kami mungkin menukarnya kepada penunjuk kewangan untuk melihat ROI yang dibawa oleh pemasarannya, bergantung pada matlamat misi kami.
J7: Sebenarnya terdapat carian dan promosi dalam senario kewangan, tetapi memang benar bahawa senario kewangan mempunyai keunikan ini terletak pada pautan penukarannya yang sangat panjang, yang melibatkan pemberian kredit, pengesahan kelulusan proses untuk kad, dsb., dan cara menganggarkan jumlah dalam kewangan juga merupakan satu kesukaran.
A8: Kedua-dua Model UPLIFT dan DML digunakan untuk menyelesaikan CATE. Model UPLIFT menggunakan pembelajaran mesin sebagai alat utamanya, seperti model pokok dan pembelajaran mendalam, dan juga menggabungkan idea inferens sebab. Model DML menggunakan idea ekonometrik untuk membimbing alatan pembelajaran mesin untuk menganggarkan CATE. Model UPLIFT ialah kategori yang lebih besar, dan sesetengah model turut menggunakan idea DML.
A9: Isu magnitud sebenarnya adalah Isu yang sangat kritikal. Tetapi tahap pendedahan sebenarnya bukanlah yang paling penting.
J10: Kertas kerja akan diperoleh daripada sumber terbuka selepas semakan.
Atas ialah kandungan terperinci Aplikasi model UPLIFT mendalam dalam senario pertumbuhan pengguna Tencent Financial. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!