Rumah >Peranti teknologi >AI >Bagaimana untuk membina sistem percubaan AB dalam senario pertumbuhan pengguna?
Inilah panorama UG.
UG Dapatkan pelanggan dan alihkan trafik ke APP melalui saluran seperti Iklan Berbayar, ASO, SEO dan saluran lain. Seterusnya, kami akan melakukan beberapa operasi dan panduan untuk orang baru untuk mengaktifkan pengguna dan membawa mereka ke peringkat kematangan. Pengguna seterusnya mungkin perlahan-lahan menjadi tidak aktif, memasuki tempoh penolakan, atau bahkan memasuki tempoh churn. Dalam tempoh ini, kami akan melakukan beberapa amaran awal untuk churn, panggil balik untuk mempromosikan pengaktifan, dan kemudian beberapa panggilan balik untuk pengguna yang hilang.
boleh diringkaskan seperti formula dalam gambar di atas iaitu DAU bersamaan dengan DNU darab LT. Semua kerja dalam senario UG boleh dibongkar berdasarkan formula ini.
Tujuan percubaan AB adalah untuk memperuntukkan trafik secara rawak sepenuhnya dan menggunakan strategi yang berbeza untuk kumpulan eksperimen dan kumpulan kawalan yang berbeza. Akhirnya, keputusan saintifik dibuat dengan menggabungkan kaedah statistik dan hipotesis eksperimen, yang membentuk rangka kerja keseluruhan eksperimen. Pada masa ini, jenis pengedaran percubaan di pasaran dibahagikan secara kasar kepada dua jenis: pengedaran platform percubaan dan pengedaran tempatan pelanggan
Pengedaran platform eksperimen mempunyai prasyarat. Ia memerlukan peranti boleh mendapatkan ID yang stabil selepas pemula . Berdasarkan ini ID meminta platform percubaan untuk melengkapkan logik berkaitan pemuatan, mengembalikan ID pemuatan ke terminal, dan kemudian terminal membuat strategi yang sepadan berdasarkan ID yang diterima. Kelebihannya ialah ia mempunyai platform eksperimen yang dapat memastikan keseragaman dan kestabilan shunt. Kelemahannya ialah peralatan mesti dimulakan sebelum shunting eksperimen boleh dijalankan.
Kaedah pemunggahan lain ialah pemunggahan tempatan sebelah pelanggan. Kaedah ini agak khusus dan sesuai terutamanya untuk beberapa adegan UG, adegan pembukaan skrin pengiklanan dan adegan permulaan prestasi. Dengan cara ini, semua logik pemuatan selesai apabila klien dimulakan. Kelebihannya adalah jelas, iaitu, tiada kelewatan dan pengedaran boleh dijalankan serta-merta selepas dihidupkan. Secara logiknya, keseragaman pengedarannya juga boleh dijamin. Walau bagaimanapun, dalam senario perniagaan sebenar, selalunya terdapat masalah dengan keseragaman pengedarannya. Sebabnya akan diperkenalkan seterusnya
UG Masalah pertama yang sebenarnya dihadapi oleh senario tersebut ialah mengalihkan trafik seawal mungkin.
Berikut ialah contoh, seperti halaman penerimaan trafik di sini Pengurus produk merasakan bahawa UI boleh dioptimumkan untuk menambah baik penunjuk teras. Dalam senario sedemikian, kami berharap percubaan akan dicuba secepat mungkin.
Semasa proses pemuatan pada halaman 1, peranti akan dimulakan dan mendapatkan ID. 18.62% pengguna tidak dapat menjana ID. Jika kaedah lencongan platform eksperimen tradisional digunakan, 18.62% pengguna tidak akan dikumpulkan, mengakibatkan masalah bias pemilihan yang wujud
Selain itu, trafik pengguna baharu adalah sangat berharga, dengan 18.62% pengguna baharu Ia tidak boleh digunakan untuk percubaan, dan akan terdapat kerugian besar dalam tempoh percubaan dan kecekapan penggunaan trafik.
Di masa hadapan, untuk menyelesaikan masalah pemunggahan eksperimen seawal mungkin, kami akan menggunakan pelanggan untuk memunggah eksperimen secara tempatan. Kelebihannya ialah pemunggahan selesai apabila peranti dimulakan. Prinsipnya ialah pertama, apabila memulakan pada terminal, ia boleh menjana nombor rawak dengan sendirinya, mencincang nombor rawak dan kemudian mengumpulkannya dengan cara yang sama, dengan itu menghasilkan kumpulan eksperimen dan kumpulan kawalan. Pada dasarnya, adalah mungkin untuk memastikan bahawa pengagihan trafik adalah sekata Walau bagaimanapun, melalui set data dalam rajah di atas, kita boleh mendapati bahawa lebih daripada 21% pengguna berulang kali memasuki kumpulan yang berbeza.
Terdapat senario di mana pengguna beberapa produk yang sangat popular, seperti Honor of Kings atau Douyin, mudah ketagih. Pengguna baharu akan menyahpasang dan memasang semula beberapa kali semasa kitaran percubaan. Mengikut logik lencongan tempatan yang baru disebut, penjanaan dan lencongan nombor rawak akan membolehkan pengguna memasuki kumpulan yang berbeza, supaya ID lencongan dan ID statistik tidak boleh sepadan dengan satu sama satu. Ini menyebabkan masalah pengagihan tidak sekata.
Dalam senario pengguna baharu, kami juga menghadapi masalah kriteria penilaian eksperimen.
Kami telah menyusun semula carta masa trafik pengguna baharu yang mengambil alih senario ini. Pada permulaan aplikasi, kami memilih untuk memunggah. Andaikan bahawa kita boleh mencapai pemasaan pengedaran seragam dan menghasilkan kesan strategik yang sepadan pada masa yang sama. Seterusnya, masa menjana ID statistik penunjuk adalah lewat daripada masa kesan strategi, dan hanya selepas itu data boleh diperhatikan. Masa pemerhatian data jauh ketinggalan berbanding pemasaan kesan strategi, yang akan membawa kepada berat sebelah yang terselamat
Untuk menyelesaikan masalah di atas, kami mencadangkan satu eksperimen baharu sistem , dan mengesahkannya secara saintifik
Seperti yang dinyatakan sebelum ini, keperluan pemilihan lencongan untuk pengguna baharu akan agak tinggi, jadi bagaimana untuk memilih eksperimen pengguna baharu Bagaimana pula dengan ID shunt? Berikut ialah beberapa prinsip:
Selepas memilih ID pemunggahan, keupayaan pemunggahan selalunya diselesaikan dalam dua cara, yang pertama melalui platform percubaan, dan yang kedua ialah melalui platform percubaan.
Selepas anda mempunyai ID pemunggahan, berikan ID pemunggahan ke platform percubaan dan lengkapkan keupayaan pemunggahan dalam platform percubaan. Sebagai platform pengedaran, perkara paling asas adalah untuk mengesahkan kerawaknya. Yang pertama ialah keseragaman. Dalam lapisan percubaan yang sama, trafik dibahagikan sama rata kepada banyak baldi dan bilangan kumpulan dalam setiap baldi hendaklah genap. Ia boleh dipermudahkan di sini Jika terdapat hanya satu eksperimen pada satu lapisan dan ia dibahagikan kepada dua kumpulan, a dan b, bilangan pengguna dalam kumpulan kawalan dan kumpulan eksperimen hendaklah lebih kurang sama, dengan itu mengesahkan keseragaman bagi keupayaan lencongan. Kedua, untuk eksperimen berbilang lapisan, eksperimen berbilang lapisan hendaklah ortogon antara satu sama lain dan tidak terjejas. Begitu juga, ia juga perlu untuk mengesahkan keortogonan antara eksperimen pada lapisan yang berbeza. Keseragaman dan ortogonal boleh disahkan melalui ujian kategori statistik.
Selepas memperkenalkan ID pemilihan lencongan dan keupayaan lencongan, akhirnya kami perlu mengesahkan sama ada keputusan lencongan yang baru dicadangkan memenuhi keperluan eksperimen AB dari tahap keputusan penunjuk.
Dengan menggunakan platform dalaman, kami menjalankan berbilang simulasi AA
untuk membandingkan sama ada kumpulan kawalan dan kumpulan eksperimen memenuhi keperluan eksperimen pada penunjuk yang sepadan. Seterusnya, mari kita lihat set data ini.
Saya telah mencuba beberapa kumpulan indeks ujian t Dapat difahami bahawa untuk banyak eksperimen, kadar ralat jenis satu sepatutnya sangat tinggi. Kebarangkalian kecil, dengan mengandaikan bahawa kadar ralat jenis satu dijadualkan sekitar 0. 055%, selang keyakinannya sebenarnya seharusnya sekitar 1000 kali, iaitu antara 0. 0365- 0. 0635. Anda boleh melihat bahawa beberapa penunjuk yang dijadikan sampel dalam lajur pertama berada dalam julat pelaksanaan ini, jadi dari perspektif kadar ralat jenis satu, sistem percubaan sedia ada adalah OK.
Pada masa yang sama, memandangkan ujian itu adalah ujian untuk statistik t, statistik t yang sepadan hendaklah lebih kurang mematuhi taburan normal di bawah taburan trafik yang besar. Anda juga boleh menguji taburan normal statistik ujian-t. Ujian taburan normal digunakan di sini, dan anda boleh melihat bahawa keputusan ujian juga jauh lebih besar daripada 0.05, iaitu, hipotesis nol ditubuhkan, iaitu, statistik t yang lebih kurang mematuhi taburan normal.
Untuk setiap ujian, nilai p bagi keputusan ujian statistik t adalah lebih kurang mematuhi pengagihan seragam dalam banyak eksperimen, dan ia juga boleh Anda juga boleh melihat hasil yang serupa dengan menguji taburan seragam pvalue, pvalue_uniform_test, yang juga lebih besar daripada 0.05. Oleh itu, hipotesis nol bahawa nilai p lebih kurang mematuhi taburan seragam juga adalah OK.
Di atas telah disahkan daripada surat-menyurat satu-dengan-satu antara ID lencongan dan kaliber pengiraan penunjuk, keupayaan lencongan dan keputusan penunjuk hasil lencongan sifat saintifik sistem lencongan eksperimen ini.
Berikut akan diterangkan secara terperinci berdasarkan kes permohonan sebenar dalam Senario UG. Bagaimana untuk menjalankan penilaian eksperimen untuk menyelesaikan masalah ketiga yang dinyatakan sebelum ini
Ini adalah senario penerimaan trafik UG yang biasa Banyak pengoptimuman akan dilakukan semasa bimbingan pengguna baharu NUJ atau tugas pengguna baharu untuk meningkatkan penggunaan trafik. Piawaian penilaian pada masa ini selalunya adalah kadar pengekalan, yang merupakan pemahaman umum semasa dalam industri.
Dengan mengandaikan proses daripada muat turun pengguna baharu kepada pemasangan kepada permulaan pertama, PM merasakan proses sedemikian berguna untuk pengguna , terutamanya bagi pengguna yang tidak pernah mengalami penggunaan produk, ambang adalah terlalu tinggi Sekiranya pengguna membiasakan diri dengan produk dahulu, mengalami detik hip-hop produk, dan kemudian dibimbing untuk log masuk?
Seterusnya, pengurus produk mengemukakan hipotesis lain, iaitu bagi pengguna yang tidak pernah mengalami produk, dalam Kurangkan rintangan dalam log masuk pengguna baharu atau senario NUJ pengguna baharu. Bagi pengguna yang telah mengalami produk dan pengguna yang telah menukar peranti, proses dalam talian
adalah berdasarkan ID penunjuk Kaedah pemunggahan terlebih dahulu memperoleh ID penunjuk dan kemudian memunggahnya. Kaedah pemisahan ini biasanya seragam, dan tidak banyak perbezaan daripada keputusan eksperimen dan kadar pengekalan. Berdasarkan keputusan sedemikian, sukar untuk membuat keputusan yang komprehensif. Percubaan jenis ini sebenarnya membazirkan sebahagian daripada trafik dan mempunyai masalah berat sebelah pemilihan. Oleh itu, kami akan menjalankan eksperimen lencongan tempatan Rajah di bawah menunjukkan keputusan eksperimen lencongan tempatan
The. ahli baharu yang menyertai kumpulan Akan terdapat perbezaan ketara dalam bilangan peranti, dan ia boleh dipercayai. Pada masa yang sama, terdapat peningkatan dalam kadar pengekalan, tetapi ia sebenarnya negatif dalam penunjuk teras lain, dan arah negatif ini sukar difahami kerana ia sebenarnya sangat berkaitan dengan pengekalan. Oleh itu, berdasarkan data sedemikian, sukar untuk menjelaskan atau mengaitkannya, dan juga sukar untuk membuat keputusan yang komprehensif.
Anda boleh memerhati situasi pengguna yang telah berulang kali memasuki kumpulan, dan anda akan mendapati bahawa lebih daripada 20% pengguna berulang kali diberikan kepada kumpulan yang berbeza. Ini memusnahkan kerawak eksperimen AB dan menyukarkan untuk membuat keputusan perbandingan saintifik
Akhir sekali, lihat hasil eksperimen dengan shunt baharu yang dicadangkan.
Ia boleh dialihkan apabila ia dihidupkan Kapasiti pengalihan dijamin oleh platform dalaman, yang boleh memastikan keseragaman dan kestabilan pengalihan ke tahap yang besar. Berdasarkan data eksperimen, ia hampir hampir Apabila melakukan ujian punca kuasa dua, kita juga dapat melihat bahawa ia memenuhi keperluan sepenuhnya. Pada masa yang sama, kita dapat melihat bahawa bilangan peranti baharu yang berkesan telah meningkat dengan ketara, sebanyak 1%, dan kadar pengekalan juga telah bertambah baik. Pada masa yang sama, jika anda melihat kumpulan kawalan atau kumpulan percubaan sahaja, anda boleh melihat kadar penukaran trafik berdasarkan ID lencongan kepada peranti baharu yang akhirnya dihasilkan Kumpulan percubaan adalah 1% lebih tinggi daripada kumpulan kawalan. Sebab keputusan ini ialah kumpulan eksperimen sebenarnya telah membesarkan titik masuk pengguna dalam NUJ dan NUT, menjadikannya lebih mudah bagi lebih ramai pengguna untuk masuk, mengalami produk, dan kemudian kekal.
Bahagikan data percubaan kepada bahagian log masuk dan bukan log masuk Ia boleh didapati bahawa bagi pengguna dalam kumpulan percubaan, lebih ramai pengguna memilih mod bukan log masuk untuk mengalami produk, dan kadar pengekalan juga telah. bertambah baik. Ini Hasilnya juga selari dengan jangkaan
Anda boleh melihat penunjuk mengikut harian Jumlah pengguna yang memasuki kumpulan sebenarnya ditulis dalam tempoh masa yang panjang, ia meningkat secara berterusan, dan penunjuk pengekalan juga telah bertambah baik. Berbanding dengan kumpulan kawalan, kumpulan eksperimen telah bertambah baik dalam bilangan peranti dan pengekalan yang berkesan.
Untuk senario penerimaan trafik pengguna baharu, penunjuk penilaian lebih dinilai daripada dimensi pengekalan atau LT jangka pendek. Di sini, pengoptimuman sebenarnya hanya dilakukan pada ruang satu dimensi pada tahap LT
Dalam sistem percubaan baharu, pengoptimuman satu dimensi ditukar kepada pengoptimuman dua dimensi, dan keseluruhan DNU Shenshang LT telah bertambah baik, jadi Ruang strategi telah berubah daripada satu dimensi sebelumnya kepada dua dimensi, dan pada masa yang sama, kehilangan sebahagian LT boleh diterima dalam beberapa senario.
Akhir sekali, mari kita ringkaskan pembinaan keupayaan percubaan dan piawaian penilaian percubaan dalam senario pengguna baharu.
Atas ialah kandungan terperinci Bagaimana untuk membina sistem percubaan AB dalam senario pertumbuhan pengguna?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!