Rumah >Peranti teknologi >AI >Pembinaan sistem tag potret dan amalan aplikasi
Qunar telah membina sistem tag imej bebas dalam setiap proses pembangunan perniagaan. Memandangkan syarikat terus berkembang, adalah perlu untuk menyepadukan sistem pelabelan potret setiap perniagaan. Dari perspektif teknikal, proses penyepaduan adalah agak mudah, tetapi penyepaduan di peringkat perniagaan adalah lebih kompleks. Oleh kerana setiap label mempunyai takrifan yang berbeza dalam perniagaan yang berbeza, ini meningkatkan kesukaran penyepaduan. Bagi memastikan sistem label bersepadu dapat memberi perkhidmatan yang lebih baik kepada strategi keseluruhan syarikat, pengekstrakan dan pengoptimuman kata kunci yang mendalam diperlukan untuk memastikan logik dan konsistensi setiap label.
Tingkah laku pengguna merujuk kepada operasi yang dilakukan oleh pengguna dalam aplikasi, manakala log perniagaan merujuk kepada data yang dijana oleh pengguna di bahagian pelayan, seperti klik, pesanan dan gelagat Carian. Teg potret ialah data berbilang dimensi pengguna yang diperoleh dengan menganalisis gelagat pengguna dan data perniagaan melalui statistik peraturan dan algoritma perlombongan. Dengan menganalisis gelagat pengguna dan data perniagaan, kami dapat memahami dengan lebih baik pilihan dan keperluan pengguna, dengan itu menyediakan pengguna dengan perkhidmatan yang lebih diperibadikan dan tepat. Teg potret pengguna ini boleh membantu syarikat mencari kumpulan pengguna sasaran dengan lebih baik, merangka strategi pemasaran yang disasarkan dan meningkatkan pengalaman pengguna. Melalui analisis mendalam tentang tingkah laku pengguna dan data perniagaan, syarikat boleh lebih memahami corak tingkah laku pengguna dan menyediakan pengguna dengan produk dan perkhidmatan yang lebih baik, sekali gus meningkatkan kepuasan dan kesetiaan pengguna 2. Permintaan untuk tag potret Source
Apabila setiap perniagaan. jabatan membina platform pelabelan potretnya sendiri, keperluannya juga berbeza kerana matlamat yang berbeza Sebagai contoh, perniagaan tiket penerbangan biasanya menyasarkan pemasaran, dan perniagaan hotel biasanya menyasarkan perkhidmatan. Kita harus bermula dari keperluan perniagaan sebenar dan berkomunikasi dengan pelbagai jabatan, termasuk pengurusan syarikat, pelatih dan kakitangan lain di peringkat yang berbeza, untuk menjalankan penyelidikan permintaan yang mendalam bagi memastikan sistem pelabelan bersepadu dapat memenuhi keperluan perniagaan dengan lebih baik. Semasa proses penyepaduan, keperluan label potret pengguna terbahagi terutamanya kepada tiga kategori: kawalan risiko pemasaran, aplikasi analisis perniagaan dalaman dan menerangkan pengguna.
Kawalan risiko pemasaran: pemasaran pengguna, pengesyoran diperibadikan, pengiklanan yang tepat dan kawalan risiko pengguna.
dibahagikan kepada klasifikasi perniagaan dan klasifikasi teknikal dalam proses membina tag potret.
Selain itu, mengikut keperluan teknikal yang berbeza, kita perlu memilih timbunan teknologi yang sesuai untuk merealisasikan penjanaan, penyimpanan dan panggilan tag potret.
Pertama sekali, adalah perlu untuk menjelaskan definisi dan matlamat tag potret untuk menentukan teknologi yang perlu digunakan. Kedua, kitaran kemas kini dan kaedah akses teg perlu dipertimbangkan, yang menentukan sama ada teg perlu diproses dalam talian atau luar talian, dan sumber storan yang dipilih. Akhir sekali, berdasarkan faktor ini, kita boleh memilih timbunan teknologi yang sesuai untuk melaksanakan sistem pelabelan potret dan memastikan prestasi dan kestabilan sistem. Melalui klasifikasi teknikal sedemikian, sistem tag potret boleh diurus dan diselenggara dengan lebih baik, dan kebolehskalaan dan kebolehgunaannya dapat dipertingkatkan
Sebagai tambahan kepada kitaran kemas kini setiap jam, mingguan dan bulanan yang disenaraikan, pada masa ini kami turut melaksanakan kemas kini label masa nyata, yang lebih dekat dengan kemas kini penstriman.
Memandangkan platform pelabelan potret perlu memproses sejumlah besar data dan permintaan pengguna, adalah perlu untuk memilih kaedah akses yang sesuai berdasarkan susunan teknologi latar belakang Bagi sesetengah syarikat besar , bilangan pengguna dan volum data adalah sangat besar , jadi kami perlu mempertimbangkan cara menyimpan dan memanggil semula teg dengan cekap. Sesetengah teg mungkin hanya perlu dibina di luar talian, manakala yang lain mungkin perlu dipanggil dalam talian. Untuk teg luar talian, kami boleh memilih sumber yang tidak memerlukan kos storan yang tinggi, seperti menyimpan data dalam Redis atau HBase. Untuk teg dalam talian, adalah perlu untuk memastikan sistem dapat bertindak balas dengan cepat kepada permintaan pengguna dan menyediakan perkhidmatan yang stabil. Oleh itu, apabila memilih kaedah capaian, kita perlu membuat pertukaran dan pilihan berdasarkan situasi sebenar untuk memastikan prestasi dan kestabilan sistem.
Dalam proses pengeluaran sistem label potret, kita perlu melakukan satu siri pemprosesan pada pelbagai sumber data untuk akhirnya menghasilkan label. Antaranya, Pemetaan ID adalah pautan utama. Matlamat Pemetaan ID adalah untuk menyelesaikan masalah ID berbeza yang menunjuk kepada orang yang sama, terutamanya untuk syarikat peringkat awal Disebabkan pelbagai kaedah pendaftaran, berbilang ID mungkin sepadan dengan pengguna yang sama. Sebagai contoh, pengguna boleh mengikat atau menukar nombor telefon mudah alih selepas mendaftar melalui e-mel, atau telah dibenarkan menggunakannya tanpa log masuk. Situasi ini boleh mengakibatkan berbilang ID yang sepadan dengan pengguna yang sama.
Untuk menyelesaikan masalah ini, Pemetaan ID mengambil tugas untuk merealisasikan perkaitan berbilang peranti. Selain itu, Pemetaan ID juga merupakan langkah asas yang penting untuk kawalan risiko. Melalui Pemetaan ID, pengguna peranti berbeza boleh dikenal pasti dan dikaitkan dengan lebih baik, membolehkan kawalan risiko dan pengurusan keselamatan yang lebih baik. Melalui reka bentuk dan pengurusan Pemetaan ID yang munasabah, kami boleh melindungi privasi pengguna dan keselamatan data dengan lebih baik, sambil meningkatkan ketepatan dan kebolehpercayaan sistem pelabelan potret.
Platform penandaan imej juga dipanggil platform CDP, yang merangkumi pengeluaran tag imej, analisis data, aplikasi perniagaan, analisis kesan dan perkhidmatan lain. Rajah di bawah menunjukkan seni bina berfungsi platform CDP Qunar.
Di Qunar.com, selepas wabak itu, ia mengukuhkan pembinaan keupayaan dalaman dan tag imej bersepadu dengan platform strategi arus perdana. Pada masa ini, platform merangkumi keseluruhan kitaran hayat tag potret, dan boleh merealisasikan fungsi seperti pembinaan potret, pemilihan orang ramai dan tindakan pemasaran akhir. Melalui penyepaduan sedemikian, strategi pemasaran terdorong data dapat direalisasikan dengan lebih baik dan potret pengguna serta aktiviti pemasaran dapat dihubungkan dengan lancar. Ini membantu meningkatkan keberkesanan pemasaran dan kepuasan pengguna, dan juga kondusif untuk penyepaduan data dan kerja kolaboratif dalam perusahaan.
Dalam amalan, berdasarkan sampel dan susunan teknologi, anda boleh digunakan secara biasa algoritma untuk pelabelan model dibahagikan kepada kategori berikut:
(1) Algoritma pengelasan: Menggunakan label kelas ramalan untuk pemilihan bulatan dan penapisan perniagaan dalam proses perniagaan memerlukan data sampel yang mencukupi untuk melatih dan mengoptimumkan model, dengan itu meningkatkan ketepatan ramalan. Teg ramalan tidak terhad kepada ramalan pembayaran pesanan, tetapi juga boleh termasuk ramalan pembayaran carian, ramalan carian, ramalan halaman perincian, dsb.
(2) Algoritma pengesyoran: berkaitan dengan pengisihan dan keutamaan, memerlukan rangkaian pengetahuan dan teknologi termaju yang lebih luas. Matlamat algoritma pengesyoran adalah untuk mengesyorkan jenis bilik hotel yang sesuai kepada pengguna daripada set penarikan balik. Contohnya, untuk senario perjalanan ibu bapa dan anak, algoritma pengesyoran boleh mengesyorkan jenis bilik hotel yang sesuai seperti bilik kembar atau suite kepada pengguna.
(3) Graf pengetahuan: Gunakan teknologi pangkalan data graf untuk mendedahkan pengguna dan hubungan sekeliling mereka dengan lebih baik. Terdapat banyak aplikasi dalam senario kawalan risiko, seperti mengenal pasti pengguna tidak normal dan menentukan sama ada mereka pengguna berniat jahat.
(4) Inferens sebab: Contoh digunakan untuk menerangkan kesan penghantaran mesej teks dan mesej tolak kepada pengguna tentang keberkesanan pemasaran, dan melibatkan isu kos.
(5) Grafik dan imej: Gabungkan grafik dan teknologi pemprosesan imej untuk menandakan grafik dan imej. Ia melibatkan pembahagian imej, pengecaman dan teknologi lain, tetapi lebih kerap ia digunakan secara terbalik pada pelabelan imej melalui teg pengguna. Contohnya, bagi pengguna yang menyiarkan ulasan yang tidak sesuai, label mereka diekstrak dan digunakan pada algoritma pelabelan imej grafik untuk meningkatkan kecekapan dan ketepatan pelabelan.
(6) Robot NLP
(7) algoritma pemasaran yang serupa: algoritma untuk pemasaran pengembangan melalui pengguna benih.
Akan terdapat kaedah pengelasan yang berbeza berdasarkan jenis permintaan:
Berbanding dengan peraturan persatuan tradisional dan label potret, inferens sebab dapat menyelesaikan masalah yang lebih mendalam. Peraturan persatuan dan label potret terutamanya menyelesaikan masalah korelasi, seperti "pengguna yang membeli bir juga boleh membeli lampin", tetapi tidak dapat menjelaskan sebab korelasi ini wujud. Korelasi ini mungkin tidak berlaku dalam budaya dan pasaran yang berbeza. Oleh itu, melalui inferens sebab melalui data dan model sejarah, faktor utama yang mempengaruhi tingkah laku dan penukaran pengguna boleh ditemui. Faktor utama ini boleh didapati melalui penemuan perhubungan, yang seterusnya membantu kami memahami tingkah laku pengguna dan proses perniagaan dengan lebih baik.
Sebagai contoh, bahagian merah di penjuru kanan sebelah atas menapis bahagian yang lebih mencerminkan proses perniagaan melalui pemahaman tentang perniagaan, untuk mengembangkan lebih ramai pengguna.
Dalam proses membina potret objek, kami memberi tumpuan terutamanya pada sifat dan ciri objek, seperti bandar, dll. daerah perniagaan, dalam potret hotel dan lain-lain. Sifat ini membantu kami menerangkan dan memahami objek dengan lebih tepat serta menyediakan kandungan yang kaya untuk potret mereka.
Berbanding dengan potret pengguna, potret objek menekankan persamaan antara objek. Dalam amalan, kami biasanya menggunakan persamaan objek untuk operasi seperti pengesyoran dan pemeringkatan. Untuk mengukur persamaan antara objek, pelbagai kaedah boleh digunakan, seperti vektor atribut dan benam. Kaedah ini boleh mewakili objek sebagai vektor dan menggunakan vektor ini untuk melakukan pengiraan persamaan. Perlu diingat bahawa walaupun proses membina potret objek adalah serupa dengan proses membina potret pengguna, dalam aplikasi sebenar, kami perlu membuat pelarasan dan pengoptimuman yang sesuai berdasarkan keperluan dan senario perniagaan. Pada masa yang sama, analisis mendalam tentang perhubungan dan struktur hierarki antara objek juga perlu dilakukan untuk memastikan potret objek mencerminkan keperluan perniagaan dengan tepat.
Selain itu, dalam proses membina imej objek, kita juga perlu memberi perhatian kepada beberapa isu utama.
(1) Serupa bukan bermaksud serupa. Sebagai contoh, apabila menggunakan kaedah pembenaman, jika kumpulan pengguna bernilai tinggi sedang mencari hotel lima bintang, korelasi antara hotel lima bintang ini mungkin kukuh. Tetapi dalam sesetengah senario perniagaan, korelasi ini mungkin tidak terpakai. Oleh itu, kita perlu mempertimbangkan dengan teliti persamaan objek berdasarkan senario perniagaan tertentu.
(2) Masalah mula sejuk. Contohnya, dalam pemprofilan hotel, apabila hotel baharu datang dalam talian, ia mungkin kekurangan data gelagat pengguna. Untuk menyelesaikan masalah ini, kita boleh menggunakan jarak atribut untuk mengekstrak atribut label berdimensi besar, membina label potret mesra pengguna dan menggunakan label ini untuk melakukan pengiraan persamaan. .
Teg Potret Memainkan penting peranan dalam proses pemilihan dan penyebaran pemasaran. Dengan menggunakan tag potret secara rasional, pengendali boleh menjalankan analisis dan penyaringan yang lebih terperinci bagi kumpulan pengguna yang dipilih Apabila pengendali merasakan bahawa kumpulan pengguna yang dipilih pada mulanya terlalu besar atau terlalu kecil, atau kesan pemasaran perlu diperluaskan atau dioptimumkan lagi, Ia boleh. disebarkan atau dipilih semula melalui tag potret untuk mencapai hasil pemasaran yang lebih baik.
Namun, apabila memilih dan menyebarkan tag potret, masalah yang paling biasa ialah empat kuadran penukaran pengguna dan campur tangan operasi. Empat kuadran ini masing-masing mewakili keadaan penukaran pengguna dan strategi intervensi operasi yang berbeza, yang memerlukan tindak balas yang berbeza kepada situasi yang berbeza. Sebagai contoh, bagi pengguna yang mempunyai penukaran yang tinggi dan campur tangan yang rendah, anda boleh menggunakan strategi untuk mengekalkan status quo bagi pengguna yang mempunyai penukaran yang rendah dan campur tangan yang rendah, anda boleh menggunakan strategi untuk mempromosikan penukaran, dsb.
Berikut ialah empat peringkat pemilihan pemasaran dan penyebaran tag potret dalam proses permohonan:
Analisis saintifik: Menggali data pengguna secara mendalam dan mencari kumpulan sasaran dengan tepat untuk meningkatkan kesan penukaran.
Pemilihan bulatan tambahan: Gunakan tag untuk menapis pengguna sasaran dengan cekap dan mempertingkatkan kepentingan dan kecekapan aktiviti pemasaran.
Peluasan pintar: Berdasarkan algoritma dan model, kumpulan pengguna diklasifikasikan secara bijak dan dikembangkan untuk meluaskan liputan pemasaran.
Pelaksanaan model: Digabungkan dengan aktiviti pemasaran sebenar, optimumkan tag imej dan strategi untuk mencapai hasil pemasaran yang terbaik.
Gunakan sistem tag potret untuk menganalisis kualiti penunjuk perniagaan dan seterusnya mengoptimumkan strategi. Semasa proses lelaran perniagaan, kami biasanya menggunakan kaedah seperti algoritma analisis atribusi dan analisis perniagaan untuk menjana strategi. Kemudian jalankan pengukuran eksperimen Jika strategi eksperimen berfungsi dengan baik, ia akan dilancarkan sepenuhnya.
Walau bagaimanapun, dua masalah akan dihadapi dalam proses ini: bagaimana untuk menganalisis kualiti penunjuk dan kualiti keputusan eksperimen. Untuk menyelesaikan masalah ini, kami perlu menjalankan analisis atribusi penunjuk perniagaan. Mula-mula, temui masalah perniagaan melalui laporan, penggera, dsb., ketahui punca masalah, dan jelaskan senario tertentu dan perhubungan transformasi sebenar. Seterusnya, cari punca masalah dan tentukan sama ada punca itu boleh dikawal atau tidak terkawal. Jika ia tidak terkawal, ia mungkin kegelisahan semula jadi dan tidak memerlukan terlalu banyak perhatian; jika ia boleh dikawal, adalah perlu untuk meneroka lebih lanjut sama ada terdapat senario yang tidak diketahui yang menyebabkan masalah ini.
Dalam modul analisis kualitatif, kami akan menjelaskan faktor yang boleh dikawal dan tidak terkawal, dan meneroka punca masalah dalam beberapa senario yang tidak diketahui. Akhir sekali, cadangan diberikan untuk membimbing kakitangan perniagaan dalam senario yang perlu dilakukan. Senario ini sebenarnya bermakna bahawa kadar penukaran perniagaan tertentu telah menurun Melalui proses analisis keseluruhan perniagaan, kita dapat mengetahui bahagian faktor bukan pasaran dan faktor yang boleh dikawal. Jika faktor pasaran menyumbang sebahagian besar, maka kita boleh menyelesaikan masalah itu kemudian tanpa segera menggunakan banyak tenaga kerja dan sumber bahan.
Dalam proses bertanggungjawab ke atas sistem eksperimen AB Qunar, kami sering menghadapi beberapa cabaran. Apabila pasukan produk melaburkan banyak masa dan sumber untuk menyelesaikan percubaan, jika keputusan percubaan tidak penting, mudah untuk mengemukakan soalan seperti "Mengapa percubaan tidak sah" dan "Apakah arah lelaran seterusnya?"
Untuk menyelesaikan masalah ini, kami menjalankan analisis prestasi percubaan AB, yang terbahagi terutamanya kepada tiga bahagian. Mula-mula, kami cuba menentukan sama ada keputusan percubaan yang lemah adalah disebabkan oleh peningkatan volum yang tidak mencukupi melalui model corong proses perniagaan, pengenalan label potret pengguna teras dan pengenalan label mengelirukan domain perniagaan. Kedua, gunakan kaedah analisis seperti pokok keputusan untuk meneroka sama ada terdapat masalah dengan peningkatan kualitatif, seperti konflik dalam eksperimen lain atau situasi di mana peningkatan tidak mencapai bahagian yang ketara. Akhir sekali, ukur keberkesanan tindakan dan jelaskan kesan setiap tindakan terhadap matlamat.
Melalui proses analisis ini, kami boleh memberikan panduan khusus kepada pasukan produk untuk membantu mereka memilih arah yang lebih cekap untuk pengoptimuman, dengan itu mencapai peningkatan kualitatif. Analisis ini bukan sahaja membantu mengoptimumkan arah lelaran produk, tetapi juga menjimatkan sumber dan masa untuk syarikat dan meningkatkan hasil perniagaan secara keseluruhan.
A1: Data gelagat pengguna terutamanya merekodkan gelagat interaktif pengguna di sisi APP, seperti klik, dll. Data ini mencerminkan terutamanya proses interaksi pengguna. Data perniagaan melibatkan pelbagai maklumat yang diproses di latar belakang, seperti proses sambungan ejen, maklumat logistik, dll. Walaupun data ini tidak dapat dilihat oleh pengguna, ia juga penting untuk memahami keseluruhan proses perniagaan dan meningkatkan pengalaman pengguna. Dalam operasi sebenar, kami perlu memasukkan data ini ke dalam sistem tag potret kami untuk menganalisis dan memahami tingkah laku pengguna dan proses perniagaan dengan lebih baik. Sebagai contoh, untuk platform e-dagang, sesetengah data mungkin tidak berkaitan dengan pengguna, tetapi sesetengahnya melibatkan pengalaman pengguna dan proses perniagaan, jadi penyaringan dan pemprosesan yang sesuai diperlukan.
A2: Teg penstriman boleh dilaksanakan melalui pengkomputeran penstriman, seperti menggunakan alatan seperti Flink. Pengguna boleh menyeret dan melepaskan data yang ditentukan untuk mengira label melalui pengiraan penstriman. Pada masa yang sama, anda juga boleh memuat naik kod Python atau kod SQL untuk pengiraan tersuai. Selain itu, ia juga boleh disokong melalui Spark dan kaedah lain. Dalam teg penstriman, tetingkap amaun dan masa pengiraan perlu dihadkan untuk memenuhi keperluan yang berbeza.
Teg penstriman boleh menyokong peraturan teg yang kompleks. Pengguna boleh melaksanakan pengiraan label yang lebih kompleks dengan memuat naik kod Python atau kod SQL.
Teg penstriman boleh dilaksanakan dalam dua cara: pembangunan data dan konfigurasi visual. Pada platform Qunar, pengguna boleh menyeret dan melepaskan data yang ditentukan untuk mengira label melalui pengkomputeran penstriman, atau memuat naik kod Python atau kod SQL untuk pengiraan tersuai.
A3: Teg masa nyata merujuk kepada teg yang dikira dan digunakan dalam masa nyata apabila gelagat pengguna atau peristiwa perniagaan berlaku. Sebagai contoh, apabila pengguna menyerahkan aduan pada antara muka hadapan, sistem akan menganalisis permintaan dan isu pesanan pengguna dalam masa nyata dan melabelkan pengguna dengan label masa nyata yang sepadan. Pelabelan masa nyata jenis ini boleh mencerminkan keperluan dan masalah pengguna dengan cepat untuk pemprosesan dan pengoptimuman yang tepat pada masanya. Syarikat yang berbeza mempunyai takrifan teg masa nyata yang berbeza Bagi Qunar, apa-apa sahaja dalam masa 3 saat dianggap masa nyata, manakala jam dianggap sebagai senario bukan masa nyata.
S5: Apakah senario penggunaan label produk?
S6: Adakah label perniagaan masa nyata perlu disesuaikan dan dibangunkan?
S7: Bagaimana untuk menguruskan kitaran hayat tag?
A8: Untuk syarikat perniagaan yang lebih kecil, trafik mungkin tidak mencukupi secara kongenital Jika anda ingin mencapai saiz sampel minimum, ia tidak mungkin di peringkat operasi, jadi kami perlu mempunyai beberapa apabila saiz sampel minimum adalah. tidak tercapai. Boleh dengan cepat dan secara kasar menyimpulkan kesan eksperimen.
A9: Tunjukkan bahawa setiap syarikat adalah berbeza. Dari perspektif storan, Qunar mempunyai pelbagai kaedah storan.
A10: Malah, melalui latihan semasa saya di Qunar, model besar digunakan secara meluas dalam pelabelan algoritma. Pertama, contoh paling mudah Apabila kami membina potret pengguna, kami sering menemui data mercu tanda POI yang diekstrak dari beberapa dokumen model yang telah kami bina sendiri pada masa lalu. Dan apabila kita membina graf pengetahuan, kita akan menghadapi beberapa nyahkekaburan entiti, penggabungan entiti, dsb.
A11: Sebenarnya tidak, cadangan ini adalah untuk mengesyorkan jurutera, tetapi algoritma pengesyoran perlu menggunakan hasil jurutera potret itu perlu menerangkan dengan jelas kualiti label potret dan senario aplikasi itu bahawa jurutera kedudukan pengesyoran boleh Lebih baik digunakan.
Atas ialah kandungan terperinci Pembinaan sistem tag potret dan amalan aplikasi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!