Rumah >Peranti teknologi >AI >Untuk mencegah dan mengawal 'penanaman rumput palsu', pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

Untuk mencegah dan mengawal 'penanaman rumput palsu', pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

PHPz
PHPzke hadapan
2023-04-11 12:55:031486semak imbas

Artikel ini tertumpu terutamanya pada bidang amalan terbaik kawalan risiko komuniti dan e-dagang di Xiaohongshu - pengurusan volum berus.

Sebagai komuniti kandungan, bilangan pengguna aktif bulanan Xiaohongshu telah meningkat dengan stabil sejak ia melebihi 200 juta pada Oktober 2021. Berdasarkan pengumpulan berterusan aset kandungan UGC, Xiaohongshu menjadi tempat berkumpul gaya hidup yang pelbagai untuk lebih ramai pengguna. Semua ini telah menjadikan Xiaohongshu sebagai sasaran pengeluaran haram.

Dari perspektif pengguna, keselamatan perlu menyelesaikan dua masalah pada platform kandungan: Pastikan maklumat pengguna selamat di Internet dan pastikan maklumat yang diperoleh pengguna di Internet adalah sahih .

Memberus kelantangan, sebagai kaedah penipuan biasa dalam komuniti dan transaksi, akan menyebabkan maklumat yang diperoleh oleh pengguna adalah tidak benar. Sama ada trafik komuniti seperti pembacaan nota, suka dan komen, atau data e-dagang seperti paparan dan jualan produk, yang diperoleh melalui memberus, ia akan menjejaskan keselamatan kandungan kami dan menjejaskan kepercayaan pengguna terhadap platform.

1. Masuk ke dalam industri hitam untuk memahami realisasi kelantangan berus

1.1 Apakah kelantangan berus?

Dalam pemahaman asas, memberus kelantangan boleh difahami sebagai penipuan data, seperti menggunakan kaedah penipuan untuk mendapatkan suka palsu, koleksi dan data lain, untuk mendapatkan nilai komersial yang lebih tinggi. Dalam senario e-dagang, memberus lebih tertumpu pada peringkat pedagang, seperti mengupah pengguna memberus dan menggunakan logistik palsu untuk menstruktur transaksi dan mengarang GMV yang tinggi.

Untuk memahami secara mendalam sifat volum berus, kami melawat sekumpulan syarikat yang pakar dalam rantaian industri volum berus Berikut ialah pengenalan kepada tiga daripadanya dan kaedah pelaksanaannya:

1.1.1 Syarikat Memberus Kawalan Kumpulan

Syarikat ini menyediakan perkhidmatan curahan, terutamanya berdasarkan peranti kawalan kumpulan mesin, termasuk mesin rosak dan iPhone biasa. Mereka mengambil kesempatan daripada mekanisme keselamatan Apple, seperti pembungkusan imej telefon mudah alih Apple: klien yang mengandungi status log masuk pengguna dalam keseluruhan telefon dibungkus dan disimpan ke dalam fail, dan kemudian fail ini disimpan dalam persekitaran kotak pasir. Berdasarkan kaedah ini, telefon mudah alih tunggal digunakan untuk memulihkan persekitaran kotak pasir kelompok dan akaun untuk mencapai kesan kawalan kumpulan yang baik.

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

1.1.2 Syarikat penyelenggaraan akaun dan pengalihan trafik

Ini ialah syarikat e-dagang yang menjual pakaian tiruan tinggi melalui trafik lencongan. Kaedah utama adalah untuk mendaftar akaun melalui kad dewan maya dan kemudian mengekalkan akaun. Apabila akaun yang digunakan disenaraihitamkan, ia perlu membuka kedai telefon bimbit terpakai luar talian berdekatan untuk menggantikan telefon yang disenaraihitamkan pada harga yang lebih rendah (5-10 yuan). Selepas mendapat peralatan baharu, ambil sekumpulan orang sebenar, daftar akaun dan teruskan menerbitkan dan mengendalikan kandungan. Akhir sekali, lakukan promosi jenama dan dapatkan bayaran. Difahamkan, satu akaun boleh menarik ratusan ribu GMV dengan mengambil kira jumlah akaun, pendapatan syarikat adalah agak besar.


Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini


1.1.3 Syarikat memberus sumber ramai

Produk kulit hitam sumber ramai biasanya mempunyai organisasi profesional yang mencari tugas di platform utama dan merekrut orang untuk melakukan kerja sambilan boleh mendapat bayaran dengan menyelesaikan tugas menggunakan akaun mereka sendiri.

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

1.2 Takrifan semula volum berus

Adakah memberus untuk peminat dan suka sama dengan volum memberus? Ya, tetapi tidak sepenuhnya Kita perlu memahami kelantangan berus dari perspektif yang lebih tinggi.

Dalam persekitaran komuniti Xiaohongshu, kami membahagikan pengguna kepada dua kategori: penerbit kandungan dan pengguna kandungan. Penerbit kandungan bertanggungjawab untuk menghasilkan dan menyediakan kandungan yang berkualiti kepada pengguna. Pengguna kandungan, sebaliknya, membayar kos masa, kos peluang, kos maklumat, kos emosi dan nilai maklumat yang terkandung dalam kandungan yang mereka lihat. Dalam erti kata lain, penerbit dan pengguna sebenarnya terlibat dalam jenis transaksi, dan platform kandungan ialah platform ekonomi pasaran. Apabila ada pasaran, mesti ada mata wang dalam edaran. Dalam komuniti kandungan, mata wang ialah unit yang boleh diukur seperti bacaan, suka, koleksi dan ulasan.


Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini


Di bawah analogi ini, mencuci adalah bersamaan dengan membuat mata wang palsu , menerbitkan kandungan palsu adalah serupa dengan barangan palsu dan akan membawa kepada inflasi dalam pasaran keseluruhan. Walaupun token ini wujud dalam pasaran sekunder (komuniti), ia akhirnya akan didagangkan dengan pasaran utama (e-dagang, pengiklanan) untuk merealisasikan pengewangan trafik. Bagi Xiaohongshu, memberus adalah bersamaan dengan mata wang palsu dan perlu diuruskan tanpa berusaha.

2. Cabaran yang dihadapi oleh kawalan risiko

Memandangkan ia telah diklasifikasikan sebagai mata wang palsu, mengapa jumlah cucian masih wujud untuk masa yang lama? Di sini kita mesti menyebut beberapa cabaran yang dihadapi anti-penipuan: kesukaran dalam pengenalan, kesukaran dalam tadbir urus dan kesukaran dalam penyatuan.

2.1 Kesukaran dalam pengecaman

Kesukaran dalam pengecaman boleh diringkaskan kepada tiga bahagian: Terminal tidak boleh dikawal, AI lawan AI dan orang sebenar berbanding orang sebenar.

2.1.1 Terminal tidak boleh dikawal

Dalam adegan memberus gigi komuniti, terminal sebenarnya tidak boleh dikawal, dan sukar untuk kakitangan tindakan balas menilai sama ada pelanggan adalah Pengguna biasa masih produk hitam. Secara teorinya, jika kaedah komunikasi tidak boleh dipercayai, tidak ada cara untuk menjadikannya boleh dipercayai.

Kami pernah cuba merekayasa terbalik alat serangan protokol antara muka, membuka kod di dalamnya dan menghantar permintaan kepada pelayan yang menyamar sebagai pelanggan kami dengan memecahkan algoritma tandatangan. Ini adalah yang paling mudah, kaedah lain lebih sukar untuk dikawal.

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

(*Serangan protokol)

2.1.2 AI lwn. AI

Walaupun kawalan risiko sentiasa bertambah baik dan pengkomputeran AI telah digunakan secara besar-besaran untuk menentangnya, lawan kita juga sentiasa menceroboh dan menaik taraf.

Ambil kaedah kawalan kumpulan Pengeluaran Hitam dan Kelabu sebagai contoh. Gunakan kerentanan kebenaran pihak ketiga untuk menjana kelompok akaun pihak ketiga pada platform awam, dan gunakan akaun pihak ketiga untuk melengkapkan pendaftaran akaun Xiaohongshu. Kemudian gunakan alat klik skrip automatik UI untuk mengawal klik dan ketukan kekunci, dan beroperasi pada telefon mudah alih anda untuk mendapatkan suka dan pengikut dalam kelompok. Kaedah popular semasa ialah menggunakan cip telefon mudah alih 4G/EC20 untuk melakukan serangan hibrid untuk mengelakkan pengenalan IP hitam kami.

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

Promosi kecerdasan AI dalam kawalan risiko adalah perlahan. Sebabnya ialah algoritma AI pandai menyelesaikan masalah pesanan pertama, seperti sama ada gambar mengandungi kod QR pembayaran. Walau bagaimanapun, dalam senario sebenar, perkara yang perlu kita nilai ialah sama ada kandungan sembang itu berisiko. Dari perspektif manusia, tiada risiko menghantar kod QR pembayaran antara rakan yang kerap berhubung, tetapi menghantar kod QR pembayaran antara orang yang tidak dikenali yang baru berbual adalah tingkah laku berisiko tinggi. Risiko di sini bergantung pada pengagregatan dua tahap maklumat pembayaran kod QR + sembang orang yang tidak dikenali. Berbanding dengan manusia, adalah sukar bagi AI untuk menilai secara automatik pengiktirafan agregat kedua-dua dimensi ini, jadi ia memerlukan banyak campur tangan manusia.

2.1.3 Orang sebenar kepada orang sebenar

Ajak orang melalui sembang kumpulan dalam talian, tugas kecil luar talian, malah melalui saluran perekrutan rasmi pengguna dan terdapat tingkah laku normal yang sebenar. Pada satu ketika, wang akan dikumpul untuk meningkatkan jumlah, yang menjadikan keseluruhan pengenalan menjadi sangat rumit.

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

2.2 Kesukaran dalam tadbir urus

Di platform Xiaohongshu, komuniti kandungan dibahagikan kepada K (blogger), B (jenama/peniaga), organisasi MCN ( perantara), C-side (pengguna biasa). Persoalan yang menyusahkan kita sejak sekian lama ialah siapakah yang melakukan kelakuan ini untuk keuntungan, adakah pihak K-side, B-side, MCN side atau C-side? Dan adakah tingkah laku orang ini pada masa ini baik atau buruk? Semasa menguruskan, bagaimana untuk mengelakkan kecederaan akibat kemalangan?

Situasi sebenar ialah

setiap hujung boleh mengambil bahagian dalam memberus . Selepas jenama mengeluarkan keperluan pemasarannya, MCN menerima tugas itu dan mengagihkannya kepada K pada platform utama, membolehkan K menerbitkan nota yang berkaitan untuk menarik pengguna, dan akhirnya mencapai tujuan promosi pemasaran. Dalam proses ini, MCN mempunyai motivasi untuk meningkatkan volum bagi melengkapkan keperluan pendedahan pada bahagian jenama dan memperoleh keuntungan. Begitu juga, untuk menyelesaikan tugas yang dikeluarkan oleh MCN dan mengimbangi kekurangan trafiknya sendiri, K juga mempunyai motivasi untuk meningkatkan trafiknya. Peranan berbeza di bahagian jenama, seperti bahagian operasi, juga boleh meningkatkan jumlah untuk menyelesaikan tugas syarikat. Sesetengah pesaing, untuk membingkai rakan sebaya mereka, juga akan mengumpulkan pengguna akhir C untuk memberus buku nota mereka, mengakibatkan penalti kawalan risiko untuk penulis blog dan buku nota.

Apa yang lebih menyusahkan ialah sebilangan besar orang sebenar akan bercampur dalam keseluruhan kumpulan, menjadikannya sukar untuk membezakan tingkah laku memberus gigi dengan tepat. Walaupun anda boleh memberitahu, bagaimana anda boleh mengetahui sama ada tingkah laku semasa orang itu adalah normal? Akan timbul isu penarikan balik dan kerosakan yang tidak disengajakan. Ia adalah perlu untuk memastikan penarikan balik yang lengkap tanpa merosakkan sekumpulan pengguna secara tidak sengaja, yang akan menjejaskan kelancaran perniagaan.

Pada masa yang sama,

permulaan sejuk platform juga merupakan masalah yang perlu diselesaikan. Sebagai contoh, mengapa peniaga kecil baru meningkatkan jualan mereka Ini kerana pada zaman awal, peniaga kecil sememangnya lebih rendah daripada peniaga besar dari segi logistik, kualiti produk dan kawalan harga. Walaupun pengguna secara tidak sengaja mencari produk daripada pedagang baharu, volum jualan ialah 0, dan pembeli tidak mempercayainya, dan akhirnya dia masih kehilangan peluang untuk membuat transaksi. Ini juga merupakan permintaan untuk jumlah berus daripada perniagaan kecil.

2.3 Penyatuan Adalah Sukar

Sebarang operasi yang selamat akhirnya akan jatuh ke dalam masalah nisbah input-output. Dalam senario di mana kandungan disiram, kerana tiada pengiraan hasil langsung, adalah sukar untuk mengukur ROI pelaburan kawalan risiko.

Kesukaran kedua ialah mengukur keberkesanan pencegahan dan kawalan. Kami bercakap tentang CTR lebih awal, tetapi adakah nilai CTR cukup untuk menilai kesan kawalan risiko? Jawapannya tidak. Hasil pencegahan dan kawalan akan melibatkan pelbagai dimensi. Antara kes memberus gigi yang kami uruskan, banyak penipuan memberus datang daripada sumber ramai orang sebenar Adakah keberkesanan pencegahan dan kawalan dinilai berdasarkan dimensi pengguna atau bilangan tingkah laku yang tidak normal? Pengurusan volum berus adalah konfrontasi antara orang Selepas satu kaedah kawalan risiko dan tadbir urus, pihak lawan akan menggunakan cara dan teknologi baharu untuk melancarkan pusingan serangan seterusnya, kesan pencegahan dan kawalan sentiasa berubah-ubah diperlukan.

3. Amalan Tadbir Urus Xiaohongshu

Xiaohongshu ialah platform untuk perkongsian ikhlas dan interaksi mesra. Bagi kami, apa yang lebih penting daripada keupayaan teknikal adalah sikap platform. Ini juga bermakna bahawa sikap kita terhadap tingkah laku membasuh isipadu adalah untuk membanteras toleransi sifar.

Dalam Jabatan Teknologi Keselamatan, kami telah mencadangkan tiga hala tuju penyelesaian, iaitu: kejuruteraan infrastruktur kawalan risiko, langkah balas kawalan risiko berasaskan proses dan pengenalpastian kawalan risiko pintar.

3.1 Kejuruteraan infrastruktur kawalan risiko

Menurut statistik domestik, terdapat 1.5 juta pengamal industri kulit hitam, yang jauh lebih banyak daripada pasukan teknikal kawalan risiko kami berjuang secara kecil-kecilan Bagaimana dengan keseluruhan rantaian industri? Penyelesaian yang kami cadangkan adalah cepat untuk berulang dan mudah untuk percubaan dan kesilapan, dan infrastruktur kawalan risiko adalah berasaskan enjin, menghubungkan enjin kejuruteraan dengan keseluruhan pautan hulu dan hiliran hadapan dan belakang untuk meningkatkan kecekapan kawalan risiko keseluruhan. Enjin kawalan risiko di sini bukan sahaja merujuk kepada penggunaan strategi pada nod bebas, tetapi juga termasuk akses maklumat merentasi keseluruhan pautan, dan menggunakan maklumat huluan dan hiliran untuk mengenal pasti risiko .

Mengambil platform garisan dekat sebagai contoh, kami telah mengabstraksikan tugas separa masa nyata sedia ada, membolehkan pengguna pergi ke dalam talian dengan cepat dengan memasang tugas dalam masa yang singkat, sekali gus meningkatkan kecekapan. Keupayaan enjin platform ini boleh menggabungkan berbilang sumber data dan data sejarah di latar belakang untuk memberikan hasil pengenalpastian kawalan risiko dalam cara yang agak masa nyata Ia juga menggabungkan analisis jujukan tingkah laku, analisis graf dan model algoritma untuk meningkatkan keberkesanan kawalan risiko keupayaan.

Platform garis dekat menebus pengehadan pengenalpastian peraturan tunggal, disepadukan dengan sistem kawalan risiko masa nyata asal, dan merupakan tambahan yang berkesan kepada kaedah pencegahan dan kawalan yang lain. Platform garisan hampir menyokong keupayaan untuk memproses data dan peristiwa secara menyeluruh, dan juga menyokong akses data berbilang sumber Ia mempunyai keupayaan pemprosesan data yang fleksibel Lebih penting lagi, ia menyediakan fungsi yang boleh menyokong algoritma dan strategi dan logik pemprosesan data tersuai pelajar . Kosongkan tenaga kerja dan tingkatkan ketepatan semasa proses kejuruteraan.

Rajah berikut menunjukkan keseluruhan sistem dan seni bina sistem garisan hampir:

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini


Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

Aktifkan daripada peranti->Pendaftaran akaun dan log masuk->Nota/pelayaran pusat beli->Interaksi->Penerbitan kandungan/pembelian barangan, dsb. Pada masa ini, kami telah merangkumi tingkah laku pengguna dalam semua senario data perniagaan, kami akan membuat permintaan masa nyata dan aliran masa nyata Data formal dan luar talian disambungkan kepada enjin kawalan risiko untuk merealisasikan pencegahan dan kawalan bersama pelbagai senario Ciri-ciri identiti yang diperolehi, persekitaran rangkaian , ciri masa, faktor kumulatif, dsb. diproses dan dilombong, dan kemudian dimasukkan ke lapisan analisis membuat keputusan. Di samping itu, keupayaan pengenalpastian dipindahkan, dan titik risiko yang baru dikenal pasti dicetuskan dan digunakan semula dalam senario risiko lain.

Selain enjin kawalan risiko, bahagian gerbang perniagaan am (edith2.0) juga telah disatukan untuk meningkatkan kecekapan akses keseluruhan dan kestabilan perkhidmatan baharu serta mencapai tahap minit akses kepada perkhidmatan.

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

3.2 Memperkemas kawalan risiko dan konfrontasi

Kesukaran terbesar dalam kawalan risiko perniagaan ialah konfrontasi, tidak kira apa pun penipuan menjadi Dalam semua bentuk, satu-satunya perkara yang kekal tidak berubah dan sentiasa wujud ialah konfrontasi. Proses piawai mungkin tidak menjamin bahawa kami akan mendapat penyelesaian yang optimum dengan segera, tetapi ia boleh membantu kami menganalisis dan mendedahkan masalah, mewujudkan pautan lelaran ke hadapan dengan maklum balas dan meningkatkan kecekapan kami.

Keupayaan pengumpulan operasi yang didorong oleh teknologi perisikan telah membentuk sistem proses yang boleh dilaksanakan secara beransur-ansur dalam pasukan kawalan risiko Xiaohongshu dan beroperasi secara berterusan. Keseluruhan proses boleh dibahagikan kepada lima langkah: Persepsi risiko, pembinaan kapasiti, pengenalpastian risiko, rawatan risiko dan penilaian kesan.

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

Persepsi risiko: Bergantung pada sistem penunjuk untuk menemui risiko dengan lebih pantas, menukar pemadaman api pasif kepada pertahanan aktif, dan memacu proses pembinaan kapasiti dan susulan.

Pembinaan kapasiti: Tetapkan keupayaan tindak balas pantas untuk konfrontasi dan akses cepat sistem kawalan risiko yang boleh dikonfigurasikan secara fleksibel.

Pengenalpastian risiko: Tingkatkan ketepatan pengenalan, wujudkan sistem ciri, lombong ciri penipuan dan berikan maklum balas permintaan tentang keupayaan yang hilang.

Rawatan risiko: Pilih cara yang lebih berkesan untuk mengurangkan kos konfrontasi, tingkah laku memintas, mengehadkan aliran nota dan berurusan dengan pengguna, dan membentuk maklum balas yang berkesan tentang lelaran strategi.

Penilaian kesan: Juga bergantung pada sistem penunjuk untuk menilai perubahan dalam tahap risiko, seperti penipuan dan kebocoran, harga perkhidmatan produk hitam, harga akaun, dll., dan juga boleh memberikan maklum balas mengenai pembunuhan dan kebocoran.

Selepas menemui perisikan baharu atau merasakan serangan penipuan baharu, kendalikan mengikut proses ini dan analisis serta tentukan perkara yang salah daripada proses itu: Adakah perisikan yang tidak mencukupi ditemui, atau Penukaran kecerdasan untuk mengenal pasti tidak cukup pantas, atau pengenalpastian, pemprosesan dan penarikan balik tidak mencukupi .

Ambil analisis volum pembelian dalam operasi risikan sebagai contoh Selepas menemui perkhidmatan yang menyalahi undang-undang melalui risikan atau turun naik harga, ujian pembelian dijalankan, dan kemudian teknik dianalisis dan strategi atau model yang sesuai dipilih untuk pengenalpastian dan pelupusan. Bagi kesan Penilaian memerlukan pembelian sekunder atau pemantauan berterusan harga produk hitam Proses semasa tidak akan berakhir sehingga maklum balas mengenai pengenalan dan pelupusan telah dilaksanakan dan penilaian kesan mencapai standard.

3.3 Pengenalpastian kawalan risiko pintar

Dari segi tahap konfrontasi dan intensiti pencegahan dan kawalan, pengenalpastian pintar kawalan risiko boleh dibahagikan secara kasar kepada tiga peringkat: peringkat pertama, Menyasarkan teknik mesin kos rendah untuk pengeluaran hitam, analisis dan pertimbangan berdasarkan ciri-ciri subjek tingkah laku pada peringkat kedua, dalam konfrontasi frekuensi tinggi dengan pengeluaran hitam, berdasarkan ciri-ciri; daripada kumpulan perlombongan geng; pada peringkat ketiga, dalam mengenal pasti memberus orang sebenar, berdasarkan persatuan komuniti memberus, algoritma berasaskan graf digunakan untuk menemui hubungan subjek. Pada masa ini, ketiga-tiga peringkat ini telah dilaksanakan dan diamalkan di Xiaohongshu.

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

3.3.1 Analisis ciri subjek tingkah laku

Sebagai satu bentuk ungkapan, data trafik pada asasnya terdiri daripada setiap tingkah laku interaktif daripada pengguna, kawalan risiko juga dianalisis dan dikenal pasti berdasarkan ciri-ciri tingkah laku. Dalam proses pengenalpastian, kualiti ciri tingkah laku berkait secara langsung dengan pengenalpastian dan penarikan balik produk hitam, jadi pembinaan ciri data amat penting. "Pisau yang diasah tidak akan membuang masa memotong kayu api." Pada peringkat ini, kami menubuhkan satu set sistem ciri berdasarkan pengguna, peranti, dsb. subjek tingkah laku, meletakkan asas untuk pengenalan pintar kawalan risiko .

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

Tujuan pengeluaran hitam adalah untuk menyelesaikan tugas memberus volum pada kos yang paling rendah Pada peringkat ini, pengeluaran hitam sering menggunakan cara mesin untuk menjalankan automatik atau separa automatik memberus kelompok, bukan sahaja Kos rendah dan kecekapan tinggi. Andaian asas kami ialah apabila melakukan memberus mesin, mesti ada ciri abnormal yang jelas dan boleh dijelaskan pada akaun atau peranti mesin. Oleh itu, cara menganalisis dan mengenal pasti ciri-ciri abnormal adalah satu cadangan yang perlu diselesaikan pada peringkat pertama kawalan risiko. Dari segi pengenalpastian dan pembahagian kerja, kami melaksanakan model pencegahan dan kawalan awan+akhir reka bentuk pelaporan dan kaedah pengesanan peranti yang munasabah untuk menyelesaikan pencegahan dan kawalan awal peranti adalah berdasarkan pengguna ciri, ciri peranti dan kelakuan Ciri melakukan analisis yang tidak normal dan mengenal pasti tingkah laku.

Mengambil permintaan antara muka protokol sebagai contoh, produk hitam secara langsung meminta antara muka bahagian belakang dengan memecahkan algoritma tandatangan platform, dan boleh melengkapkan memberus tanpa memerlukan peralatan sebenar dan memberus paling cekap yang biasa digunakan oleh produk hitam. Ketiadaan peranti sebenar juga menyebabkan tiada pengurusan bahagian hadapan dan pelaporan peranti yang sebenar Walaupun maklumat peranti dipalsukan, medan dan persekitaran peranti maklumat pelaporan peranti tidak boleh dipalsukan dengan berkesan untuk menjadi sama seperti peranti biasa.

Selain mengenal pasti dan mencegah anomali alam sekitar melalui pengesahan parameter ciri yang berkaitan, kami juga mewujudkan pengenalpastian terkawal bergantung pada sistem ciri komprehensif dan sampel pengeluaran hitam tercetus. Dalam keseluruhan model, kejuruteraan ciri ialah pautan penting untuk memastikan penarikan semula model, dan pemprosesan hasil model adalah jaminan ketepatan .

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

Kejuruteraan ciri: Dalam kejuruteraan ciri, kami membahagikannya kepada dua bahagian dan meneruskan secara berurutan.

  • Pemilihan ciri: Selepas "konfrontasi buatan" berterusan pada peringkat awal, kami telah mengumpul pengalaman yang kaya dalam konfrontasi ciri, dan memilih ciri dan label komprehensif daripada perspektif teknik memberus pengeluaran hitam, seperti peranti versi kernel , tag ladang, tukar medan mesin, tempoh pendaftaran, tag pendaftaran kelompok, dsb.
  • Pemprosesan ciri: Semasa pemprosesan ciri, ciri diskret dan ciri berterusan diseragamkan secara berasingan dan kemudian LabelEncoder dilakukan, dan kaedah penyambungan berbeza dicuba pada hasil pencirian untuk menukar data ciri bertaburan kepada input model berbilang dimensi.

Pemprosesan hasil: Dari segi reka bentuk, kami melatih model regresi sebagai infer, iaitu nilai input adalah skor berterusan Berbanding dengan model klasifikasi, the pemprosesan hasil lebih cekap.

  • Pengedaran sampel: Dengan menganalisis pengedaran hasil model bagi sampel berus sebenar, ambang "sesuai" dikira secara separa automatik sebagai standard untuk membezakan pengeluaran hitam daripada gelagat sebenar.
  • Penilaian operasi: Sebelum model masuk dalam talian, operasi kawalan risiko akan menilai ketepatan keputusan hujung-ke-hujung Hanya apabila ketepatan penilaian mencapai standard, model itu boleh dikenal pasti.

3.3.2 Perlombongan Ciri Kumpulan

Seperti yang dinyatakan sebelum ini, konfrontasi sentiasa wujud. Apabila pengeluar kulit hitam mendapati bahawa teknik mesin kos rendah tidak boleh memintas pengesahan kawalan risiko, mereka akan sentiasa cuba menggunakan mesin sebenar, parameter peranti palsu, menggunakan alat menipu dan langkah balas lain, dan meningkatkan teknik untuk menghapuskan teknik kos rendah. Dalam konfrontasi yang berterusan, analisis ciri subjek pada peringkat pertama kelihatan agak pasif dan tidak dapat menjalankan pencegahan dan kawalan aktif.

Dari perspektif kawalan risiko, andaian asas kami pada peringkat ini ialah tidak kira bagaimana produk hitam dipalsukan atau dipintas, sifat geng tidak boleh diubah Mesti ada persamaan dan perbezaan ciri data. Oleh itu, pada peringkat ini, menggunakan kumpulan samseng sebagai sasaran pengenalan untuk melombong ciri kumpulan dan menggunakan sistem ciri data berstruktur adalah barisan pertahanan kedua yang perlu diwujudkan.

Ambil kaedah memberus mesin yang sentiasa berubah sebagai contoh Kaedah pengeluar hitam telah berubah secara beransur-ansur daripada antara muka protokol kepada kawalan kumpulan mesin yang diubah suai, dan berkembang menjadi alat klik automatik. Untuk mencegah dan mengawal secara proaktif, kami menggunakan model pengelompokan peralatan

untuk mengenal pasti dan mengingat kembali , dan telah mengandungi teknik mesin di atas dengan berkesan.

Model pengelompokan peranti dicirikan oleh maklumat peranti asas (seperti model peranti, versi apl, kernel sistem, dll.), dan melaksanakan kejuruteraan ciri dan pengiraan persamaan pada maklumat peranti asas pengguna yang berinteraksi dengan nota yang sama atau blogger yang sama , gunakan algoritma pengelompokan

untuk menggambarkan kumpulan peranti dengan persamaan yang tinggi. Selepas pengecaman, di satu pihak, peranti hitam direkodkan dan pemintasan tingkah laku seterusnya dilakukan, sebaliknya, tag peranti kumpulan peranti hitam dikeluarkan untuk mengembangkan pangkalan data hitam peranti. Model ini adalah model tanpa pengawasan dan boleh menyesuaikan diri dengan ciri-ciri produk hitam yang kerap menukar kaedah penipuan. Ia juga boleh menambah strategi dalam talian dan mengembangkan ingatan semula.

Berikut ialah carta aliran model dan kes pengenalan kelompok:

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini

Dalam keseluruhan model, kami bergantung pada

Kejuruteraan Ciri dan Penapisan KlusterPenghimpunan peranti hitam dengan ingatan tinggi dan ketepatan tinggi:

  • Kejuruteraan Ciri:Pada peringkat pertama, kami membina satu set Sistem ciri yang Komprehensif dan boleh diguna semula Pada peringkat ini, kami menganalisis ciri peralatan kumpulan dan memilih ciri peralatan 20 hingga 30 dimensi yang sesuai sebagai input untuk memastikan penarikan semula model daripada sumber data.
  • Penyaringan kluster: Dalam konfrontasi kawalan risiko berterusan, kami telah mengumpulkan tag peranti dan perpustakaan hitam peranti yang mencukupi Apabila menapis hasil keluaran model pengelompokan, peranti hitam ini digunakan sebagai Benih digunakan untuk mengira kepekatan pengeluaran hitam dalam kelompok untuk menyaring kelompok peranti yang tepat dan ingatan tinggi.

3.3.3 Penemuan subjek berasaskan graf

Seperti yang dinyatakan di atas, cabaran kelantangan memberus akan berubah secara beransur-ansur menjadi orang sebenar berbanding orang sebenar apabila hitam pengeluar mendapati bahawa kaedah mesin tidak boleh memintas kawalan risiko, mereka akan memilih untuk merekrut sumber ramai atau menganjurkan saling memberus, dan cuba menggunakan tingkah laku orang sebenar untuk meningkatkan kelantangan. Walaupun mereka semua adalah tindakan orang sebenar, intipati mereka adalah bahawa mereka tidak mempunyai kehendak sebenar dan "syiling palsu." Bukan sahaja analisis ciri utama tingkah laku orang sebenar gagal untuk mengesan keabnormalan, tetapi juga ciri kumpulan tidak boleh ditemui pada peralatan.

Disebabkan kekhususan tingkah laku cucian volum, andaian munasabah kami ialah tidak kira bagaimana cara kami menukar kaedah, arah utama tingkah laku cucian volum adalah badan utama volum belian selagi ada ialah

korelasi subjek, Tingkah laku boleh dikenal pasti dan diingat melalui ciri data. Pada peringkat ini, Xiaohongshu bergantung pada komuniti unik, graf gelagat e-dagang dan graf penyisihan kelantangan dan pesanan untuk secara aktif menemui dan melombong sekumpulan subjek tingkah laku Ia menggunakan perkaitan entiti dan algoritma graf untuk mengenal pasti pengguna menipu sebenar atau mereka yang mengekalkan Pengimbasan semula pengguna boleh mencari "ikan yang tergelincir melalui jaring".

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini


*Rajah 1: Graf persatuan nota yang disukai oleh pengguna biasa

(merah Titik adalah nota, titik biru adalah pengguna)

Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini


* Rajah 2: Persatuan nota seperti pengguna yang menipu Gambar

(titik merah ialah nota, titik biru ialah pengguna)


Gambar 1 : Antara not yang disukai oleh 7 pengguna biasa, hanya satu not yang bertindih iaitu not yang bertitik merah di tengah.

Rajah 2: Nota yang disukai oleh 9 pengguna yang menipu adalah kumpulan nota yang sama dan ketinggiannya daripada nota yang disukai Bertindih dan tidak menyukai nota lain selain daripada kumpulan nota ini.

Gambar di atas ialah rajah korelasi tingkah laku antara pengguna dan nota (merah ialah nota, biru ialah pengguna Rajah 1 menunjukkan korelasi tingkah laku antara pengguna biasa yang menyukai nota biasa boleh mencari tingkah laku Perkaitan kumpulan pengguna adalah rendah dan mereka tidak akan bersetuju dengan kumpulan nota dalam jumlah yang besar Walau bagaimanapun, terdapat pertindihan sekali-sekala disebabkan oleh sistem mengesyorkan nota jenis yang sama kerana "hobi" mereka. Dalam Rajah 2, pengguna gelagat menyukai sekumpulan nota menipu, yang mempunyai perkaitan komuniti yang kukuh dan merupakan rajah korelasi tingkah laku tipikal pengguna menipu yang menyukai nota menipu.

Ambil "memandu" saling memberus sebagai contoh, iaitu selepas menerima tugas memberus kelantangan, industri hitam bertindak sebagai penganjur dan orang tengah, mengeluarkan tugas kepada orang yang sering mengambil bahagian dalam memberus bersama (seperti sebagai suka bersama), dan memberikan tugas kepada yang ditetapkan Sasaran disegarkan semula. Produk hitam bukan sahaja akan menerbitkan satu tugasan, begitu juga pengguna tingkah laku hanya melakukan satu tugasan Terdapat "bulatan" yang agak tetap di antara keduanya. Untuk jenis penipuan ini, kami menggunakan model penyebaran label untuk memanggil semula pengguna komuniti secara berkelompok.

Model penyebaran label adalah berdasarkan peta kawalan risiko untuk menyebarkan pengguna benih pengguna benih berasal daripada pengguna berus yang telah dikenal pasti dan dicetuskan oleh entiti yang berkaitan membeli nota dan membeli blog Terutamanya, dsb., disebarkan melalui hubungan korelasi titik-tepi dalam graf kawalan risiko. Orang sebenar digunakan untuk memberus kelantangan, dan peralatan serta akaun adalah terhad Untuk mencapai tujuan memberus kelantangan, pengguna gelagat akan membolehkan akaun kecil berulang kali menerima pelbagai tugas. Tujuan penyebaran tag adalah untuk menyebarkan tag memberus kepada pengguna memberus lain dalam komuniti melalui laluan yang betul untuk melengkapkan pengenalan dan ingat semula memberus.

  • Laluan penyebaran: Teg pengguna akan disebarkan melalui laluan yang kukuh seperti peranti dan akaun pihak ketiga, serta melalui laluan yang berkaitan dengan pembeli seperti nota, pengarang, dsb. .
  • Teg pengguna: Memandangkan pengguna yang menyikat kelantangan adalah orang sebenar, label yang diberikan kepada pengguna melalui penyebaran label selalunya tidak boleh dipintas secara langsung, berdasarkan andaian asas sebenar orang memberus kelantangan, kami Teg di bawah entiti pembelian dikelompokkan dan dianalisis untuk mengenal pasti entiti yang membeli dan mencuci pengguna.

4 Berfikir di luar teknologi untuk menyelesaikan masalah

Di atas terutamanya berdasarkan teknologi untuk menyelesaikan masalah, tetapi dalam kerja sebenar, kita juga perlu berfikir di luar teknologi dan dari. perspektif yang lebih makro Dari perspektif membantu perniagaan dan meningkatkan keselamatan. Berdasarkan tujuan ini, sambil mendalami teknologi, kami telah membangunkan satu set metodologi yang praktikal dan berkesan: Mulakan dengan menghapuskan kesan masalah, kemudian menyelesaikan pengacau, dan akhirnya menghapuskan motivasi yang menyebabkan masalah.


Untuk mencegah dan mengawal penanaman rumput palsu, pasukan teknikal Xiaohongshu telah melakukan perkara utama ini


Tiga Perkara untuk Menyelesaikan Masalah

Menghapuskan Kesan Masalah

Selepas mengenal pasti objek dan data penipuan melalui cara teknikal, pengurusan dan tindakan pelupusan sebenar akan dijalankan untuk menyekat trafik palsu dari platform.

Selesaikan mereka yang menimbulkan masalah

Hancurkan orang dalam rantaian industri ini dan setiap pautan, termasuk transaksi akaun, transaksi data platform, orang transaksi, dll. . Di sini kami menggunakan operasi bersama antara kawalan risiko dan jabatan undang-undang untuk menangani pengacau. Dari Jun hingga Ogos tahun ini, enam MCN dan beberapa pengarang yang terlibat dalam volume memberus telah dihukum berat dan tindakan undang-undang telah dilancarkan terhadap mereka.

Dalam senario e-dagang, peniaga yang melakukan pesanan terutamanya untuk menarik trafik dan mencapai GMV yang lebih tinggi. Akaun saudagar yang dikenal pasti akan diserahkan kepada pelajar operasi untuk pertimbangan profesional, dan akan diserahkan kepada pihak peraturan untuk hukuman mengikut tahap keterukan tingkah laku buruk pengguna akan diletakkan dalam senarai hitam, dan pesanan mereka; tingkah laku akan dihadkan oleh kawalan risiko.

Atasi motivasi untuk menimbulkan masalah

Tujuan pembeli volum dalam senario komuniti adalah untuk merealisasikan nilai komersialnya melalui penipuan, dan apa yang perlu kita lakukan ialah mengurangkan nilai komersial pengguna atau institusi ini. Kawalan risiko menyatukan jabatan ekologi dan operasi , untuk menghukum trafik yang menipu mengikut peraturan platform, undang-undang dan peraturan, dsb. Selepas tindakan keras berterusan, kos akaun haram menjadi lebih tinggi, harga perkhidmatan memberus terus meningkat, harga unit suka dan koleksi meningkat lebih daripada 300%, dan kesanggupan pengguna untuk menipu secara beransur-ansur menurun .

Dari tahun 2022 hingga sekarang, Xiaohongshu telah membersihkan 3.1 bilion suka menipu secara keseluruhan. Dapat dilihat bahawa sikap platform terhadap perkara mempertingkatkan kelantangan sentiasa sangat tegas.

(Pengarang artikel ini: Jabatan Teknologi Keselamatan Xiaohongshu Lu Xun Shiying Wang Ma Ye Feng Shi Hao Lao Pi)

Atas ialah kandungan terperinci Untuk mencegah dan mengawal 'penanaman rumput palsu', pasukan teknikal Xiaohongshu telah melakukan perkara utama ini. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam