>기술 주변기기 >일체 포함 >'가짜 잔디 심기'를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

'가짜 잔디 심기'를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

PHPz
PHPz앞으로
2023-04-11 12:55:031455검색

이 글은 주로 Xiaohongshu의 커뮤니티 및 전자상거래 위험 관리 모범 사례 영역인 브러시 볼륨 관리에 중점을 둡니다.

콘텐츠 커뮤니티로서 Xiaohongshu의 월간 활성 사용자 수는 2021년 10월 2억 명을 돌파한 이후 꾸준히 증가하고 있습니다. UGC 콘텐츠 자산의 지속적인 축적을 바탕으로 Xiaohongshu는 점점 더 많은 사용자를 위한 다양한 라이프스타일 모임 장소가 되고 있습니다. 이 모든 것이 Xiaohongshu를 불법 생산의 대상으로 만들었습니다.

사용자 관점에서 보안은 콘텐츠 플랫폼의 두 가지 문제를 해결해야 합니다. 사용자 정보가 인터넷에서 안전한지 확인하고 사용자가 인터넷에서 얻는 정보가 진짜인지 확인.

커뮤니티 및 거래에서 흔한 부정 행위 방법인 볼륨 브러싱은 사용자가 얻은 정보가 허위가 되는 원인이 됩니다. 브러싱을 통해 얻은 메모 읽기, 좋아요, 댓글 등의 커뮤니티 트래픽이든, 제품 보기 및 판매와 같은 전자상거래 데이터든, 이는 우리의 콘텐츠 보안을 약화시키고 플랫폼에 대한 사용자의 신뢰에 영향을 미칠 것입니다.

1. 블랙산업에 입문하여 브러쉬볼륨의 실현

1.1 브러쉬볼륨이란?

기본적으로 볼륨 브러싱은 더 높은 상업적 가치를 얻기 위해 부정 행위 방법을 사용하여 거짓 좋아요, 컬렉션 및 기타 데이터를 얻는 등의 데이터 사기로 이해될 수 있습니다. 전자상거래 시나리오에서는 브러싱 사용자를 고용하고 가짜 물류를 사용하여 거래를 구조화하고 높은 GMV를 조작하는 등 브러싱이 판매자 수준에 더욱 집중됩니다.

볼륨 브러싱의 본질을 깊이 이해하기 위해 볼륨 브러싱 업계 체인을 전문으로 하는 기업 그룹을 방문했습니다. 다음은 그 중 세 곳과 그 구현 방법을 소개합니다.

1.1.1 그룹 제어 브러싱 회사

이 회사는 주로 탈옥된 기계와 일반 아이폰을 포함한 기계의 그룹 제어 장치를 기반으로 브러싱 서비스를 제공하는 회사입니다. 그들은 Apple 휴대폰의 이미지 패키징과 같은 Apple의 보안 메커니즘을 활용했습니다. 휴대폰 전체에 사용자 로그인 상태가 포함된 클라이언트를 패키징하여 파일로 저장한 다음 이러한 파일을 샌드박스 환경에 저장합니다. 이 방법을 기반으로 단일 휴대폰을 사용하여 일괄 샌드박스 환경과 계정을 복원하여 우수한 그룹 제어 효과를 얻습니다.

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

1.1.2 계좌관리 및 배수업체

트래픽을 통해 모조도 높은 의류를 판매하는 전자상거래 업체입니다. 주된 방법은 가상홀카드를 통해 계좌를 등록한 후 계좌를 유지하는 것이다. 사용된 계정이 블랙리스트에 등록되면 가까운 오프라인 중고 휴대폰 매장을 열어 블랙리스트에 있는 휴대폰을 저렴한 가격(5~10위안)으로 교체해야 합니다. 새 장비를 구한 후 실제 사람들을 고용하고 계정을 등록하고 계속해서 콘텐츠를 게시하고 운영하십시오. 마지막으로 브랜드 홍보를 하고 돈을 받으세요. 하나의 계정으로 수십만 명의 GMV를 유치할 수 있는 것으로 이해됩니다. 계정 수를 고려하면 회사의 수입은 상당합니다.


가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.


1.1.3 크라우드소싱 블랙 제품은 일반적으로 주요 플랫폼에서 작업을 찾고 아르바이트를 할 사람들을 모집하는 전문 조직이 있습니다. 자신의 계정은 작업을 완료한 후 보상을 받을 수 있습니다.

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.1.2 브러시 볼륨의 재정의

브러싱 좋아요는 브러시 볼륨과 같은가요? 예, 하지만 완전히는 아닙니다. 더 높은 관점에서 브러시 볼륨을 이해해야 합니다.

Xiaohongshu의 커뮤니티 환경에서는 사용자를 콘텐츠 게시자와 콘텐츠 소비자라는 두 가지 범주로 나눕니다. 콘텐츠 게시자는 고품질 콘텐츠를 생산하고 소비자에게 제공할 책임이 있습니다. 이에 반해 콘텐츠 소비자는 지불 시간 비용, 기회 비용, 정보 비용, 정서적 비용, 그리고 자신이 보는 콘텐츠에 포함된 정보의 가치를 말합니다. 즉, 출판사와 소비자가 실제로 일종의 거래를 하고 있는 것이며, 콘텐츠 플랫폼은 시장경제 플랫폼이다. 시장이 있으면 유통되는 화폐가 있어야 합니다. 콘텐츠 커뮤니티에서 화폐는 읽기, 좋아요, 모음, 댓글 등을 측정할 수 있는 단위입니다.


가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

이런 비유에서
페이딩은 위조 화폐를 만드는 행위

와 같습니다. 허위 콘텐츠의 출시는 전체 시장의 인플레이션을 초래하게 됩니다. 이러한 토큰은 2차 시장(커뮤니티)에 존재하지만 결국 1차 시장(전자상거래, 광고)과 거래되어 트래픽 수익화를 실현하게 됩니다. 샤오홍슈의 경우

세탁은 위조화폐와 동일하므로 노력을 아끼지 않고 관리해야 합니다.

2. 위험관리가 직면한 과제

위조화폐로 분류됐는데 왜 아직도 세탁량이 오랫동안 존재하는 걸까요? 여기서는 부정행위 방지가 직면한 몇 가지 과제를 언급해야 합니다. 식별의 어려움, 거버넌스의 어려움, 통합의 어려움.

2.1 식별의 어려움

식별의 어려움은 세 가지로 요약할 수 있습니다. 단말기는 통제 불가능, AI 대 AI, 실제 사람 대 실제 사람입니다.

2.1.1 단말기가 통제불능

커뮤니티 양치 현장에서 단말기는 사실상 통제불가이며, 클라이언트가 일반 사용자인지 블랙제품인지를 상대방이 판단하기 어렵습니다. 이론적으로 말하면, 의사소통 방법이 신뢰할 수 없다면 그것을 신뢰할 수 있게 만들 방법이 없습니다.

저희는 인터페이스 프로토콜 공격 도구를 역설계하여 내부 코드를 분해한 후 서명 알고리즘을 크래킹하여 클라이언트로 위장한 서버에 요청을 보낸 적이 있습니다. 이것이 가장 쉬운 방법이고 다른 방법은 제어하기가 더 어렵습니다.

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

(*프로토콜 공격)

2.1.2 AI vs. AI

위험 통제가 지속적으로 개선되고 AI 컴퓨팅이 대규모로 사용되어 싸우지만, 적들도 끊임없이 무너지고 있습니다. 통해 업그레이드하고 있습니다.

Black Gray Production의 그룹 제어 방법을 예로 들어 보겠습니다. 제3자 인증의 취약성을 활용하여 공개 플랫폼에서 제3자 계정 배치를 생성하고, 제3자 계정을 사용하여 Xiaohongshu 계정 등록을 완료합니다. 그런 다음 UI의 자동 스크립트 클릭 도구를 사용하여 클릭과 키 입력을 제어하고 휴대폰에서 작동하여 좋아요와 팔로어를 일괄적으로 얻을 수 있습니다. 현재 널리 사용되는 방법은 블랙 IP 식별을 피하기 위해 4G 휴대폰/EC20 칩을 사용하여 하이브리드 공격을 수행하는 것입니다.

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

위험 관리 분야에서 AI 지능의 홍보가 느립니다. 그 이유는 AI 알고리즘이 사진에 결제 QR 코드가 포함되어 있는지 여부와 같은 1차 문제를 해결하는 데 능숙하기 때문입니다. 하지만 실제 시나리오에서는 채팅 내용이 위험한지 여부를 판단해야 합니다. 인간의 관점에서 볼 때, 자주 연락하는 친구 사이에 결제 QR 코드를 보내는 것은 위험이 없지만, 방금 채팅을 한 낯선 사람 사이에 결제 QR 코드를 보내는 것은 위험도가 높은 행동입니다. 여기서 위험은 두 가지 수준의 정보결제 QR코드 + 낯선 채팅의 집합에 달려 있습니다. 인간에 비해 AI는 이 두 차원의 총체적인 인식을 자동으로 판단하기 어렵기 때문에 인간의 개입이 많이 필요하다.

2.1.3 실제 사람 대 실제 사람

온라인 그룹 채팅, 오프라인 소규모 작업, 공식 채용 채널을 통해 사람들을 모집합니다. 이 사람들은 실제 사용자에 속하며 실제로 정상적인 행동을 합니다. 특정 시점이 되면 돈을 모아서 양을 늘리게 되므로 전체 식별이 매우 복잡해집니다.

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

2.2 거버넌스의 어려움

샤오홍슈 플랫폼에서는 콘텐츠 커뮤니티가 K(블로거), B(브랜드/가맹점), MCN 조직(중개자), C-side(일반 사용자)로 구분됩니다. 오랫동안 우리를 괴롭혔던 질문은 누가 이익을 위해 이러한 행위를 하고 있는가 하는 것입니다. K측인가요, B측인가요, MCN측인가요, C측인가요? 그리고 이 사람의 현재 행동은 좋은 것인가, 나쁜 것인가? 관리하면서 사고로 인한 부상을 방지하는 방법은 무엇입니까?

실제 상황은

모든 단말기가 볼륨 브러싱에 참여할 수 있다는 것입니다. 브랜드가 마케팅 요구 사항을 발표한 후 MCN은 작업을 수락하고 이를 주요 플랫폼의 K에 배포하여 K가 관련 노트를 게시하여 사용자를 유치하고 최종적으로 마케팅 프로모션의 목적을 달성할 수 있도록 합니다. 이 과정에서 MCN은 브랜드 측면의 노출 요건을 완성하고 수익을 얻기 위해 볼륨을 늘리려는 동기를 갖게 됩니다. 마찬가지로 K 역시 MCN이 내놓은 과제를 완수하고 자신의 부족한 트래픽을 보충하기 위해 트래픽을 늘리려는 동기를 갖게 된다. 운영 측면과 같은 브랜드 측면의 다양한 역할도 회사의 업무를 완료하기 위해 볼륨을 높일 수 있습니다. 일부 경쟁업체는 동료를 모함하기 위해 C-end 사용자를 모아 노트북을 닦게 하여 블로거와 노트북에 대한 위험 통제 처벌을 받게 됩니다.

더 문제는 그룹 전체에 실제 사람들이 다수 섞여 있어 양치 행동을 정확하게 구별하기 어렵다는 점입니다. 알 수 있다고 하더라도 그 사람의 현재 행동이 정상적인지 어떻게 알 수 있습니까? 리콜 및 우발적 피해 문제가 발생할 수 있으며, 이는 실수로 사용자에게 피해를 주지 않고 완전한 리콜을 보장해야 하며, 이는 원활한 비즈니스 운영에 영향을 미칩니다.

동시에 플랫폼의 콜드 스타트

도 해결해야 할 문제입니다. 예를 들어, 신규 소규모 가맹점이 매출을 늘리는 이유는 초기에는 물류, 제품 품질, 가격 통제 측면에서 소규모 가맹점이 본질적으로 대형 가맹점에 비해 열세였기 때문입니다. 사용자가 실수로 새로운 가맹점의 상품을 검색하더라도 판매량은 0이고, 구매자는 이를 신뢰하지 않아 결국 거래 기회를 잃게 된다. 이는 중소기업의 브러쉬 볼륨에 대한 수요이기도 합니다. 2.3 통합은 어렵습니다

모든 안전한 작업은 결국 입출력 비율의 문제에 빠지게 됩니다. 콘텐츠가 플러시되는 시나리오에서는 직접적인 수익 계산이 없기 때문에 위험 관리 투자의 ROI를 측정하기가 어렵습니다.

두 번째 어려움은 예방과 통제의 효과를 측정하는 것입니다. 앞서 CTR에 대해 이야기했는데, CTR 값만으로 리스크 관리 효과를 판단할 수 있을까요? 대답은 부정적이다. 예방과 통제의 결과는 다양한 차원을 포함합니다. 우리가 관리하는 양치 사례 중 사기적인 양치질은 실제 크라우드소싱에서 많이 발생합니다. 예방 및 통제의 효율성을 사용자 차원으로 판단해야 할까요, 아니면 비정상적인 행동의 수를 기준으로 판단해야 할까요? 브러시 볼륨 관리는 사람들 간의 대결입니다. 한 가지 위험 제어 및 거버넌스 방법 이후 상대방은 다음 공격 라운드를 시작하기 위해 새로운 수단과 기술을 사용할 것입니다. 따라서 우리는 지속적으로 대결합니다. 필요합니다.

3. Xiaohongshu의 거버넌스 관행

Xiaohongshu는 진심 어린 공유와 우호적인 상호 작용을 위한 플랫폼입니다. 우리에게 있어서 기술적인 역량보다 더 중요한 것은 플랫폼의 태도입니다. 이는 대량 세탁 행위에 대한 우리의 태도가 무관용 원칙을 엄격하게 단속한다는 의미이기도 합니다.

보안 기술 부서에서는 위험 통제 인프라 엔지니어링, 위험 통제 대결 간소화, 위험 통제 식별 지능화라는 세 가지 솔루션 방향을 제안했습니다.

3.1 엔진 기반 위험 관리 인프라

국내 통계에 따르면 우리 위험 관리 기술팀보다 훨씬 많은 150만 명의 흑인 산업 종사자가 소규모로 어떻게 전체 산업 체인에 맞서 싸울 수 있습니까? 우리가 제안한 솔루션은 반복이 빠르고 시행착오가 용이하며, 위험 제어 인프라는 엔진 기반으로 엔지니어링 엔진을 전체 전면 및 후면 업스트림 및 다운스트림 링크와 연결하여 전반적인 위험 제어 효율성을 향상시킵니다. 여기서 위험 제어 엔진은 독립 노드에 전략을 배포하는 것을 의미할 뿐만 아니라 전체 링크의 정보 액세스와 위험 식별을 위한 업스트림 및 다운스트림 정보 사용도 포함합니다.

니어라인 플랫폼을 예로 들면서 기존 준 실시간 작업을 고도로 추상화하여 사용자가 짧은 시간에 작업을 조립하여 빠르게 온라인에 접속할 수 있게 하여 효율성을 향상시켰습니다. 이 플랫폼의 엔진 기능은 백그라운드에서 여러 데이터 소스와 과거 데이터를 결합하여 상대적으로 실시간 방식으로 위험 제어 식별 결과를 제공할 수 있습니다. 또한 행동 순서 분석, 그래프 분석 및 알고리즘 모델을 결합하여 위험 제어의 효율성을 향상시킵니다. 능력.

니어라인 플랫폼은 단일 규칙 식별의 한계를 보완하고 원래의 실시간 위험 제어 시스템과 통합되며 다른 예방 및 제어 방법을 효과적으로 보완합니다. 니어라인 플랫폼은 데이터와 이벤트를 종합적으로 처리하는 기능을 지원하며, 멀티 소스 데이터 액세스도 지원합니다. 더욱 중요한 것은 알고리즘과 전략, 학생 맞춤형 데이터 처리 로직을 지원할 수 있는 기능을 제공한다는 것입니다. . 엔지니어링 프로세스 동안 인력을 확보하고 정확성을 향상시킵니다.

아래 그림은 니어라인 시스템의 전체 시스템 및 아키텍처를 보여줍니다.

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.


가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

기기에서 활성화 -> 계정 등록 및 로그인 -> 메모/몰 탐색 -> 상호작용 -> 콘텐츠 게시/상품 구매 등 현재 모든 시나리오에서 사용자 행동을 다루었습니다. 비즈니스 데이터를 얻은 후 실시간 요청, 준실시간 스트리밍 및 오프라인 데이터를 위험 제어 엔진에 연결하여 달성합니다. 획득된 신원 특성에 대한 다중 시나리오 수준의 공동 방지 및 제어, 네트워크 환경, 시계열 특성, 누적 요인 등을 처리 및 마이닝하여 의사 결정 분석 계층에 입력합니다. 또한 식별 기능이 마이그레이션되고 새로 식별된 위험 지점이 침전되어 다른 위험 시나리오에서 재사용됩니다.

리스크 제어 엔진 외에도 일반 비즈니스 게이트웨이 측(edith2.0)도 통합하여 새로운 서비스의 전반적인 액세스 효율성과 안정성을 향상하고 서비스에 대한 분 단위 액세스를 달성했습니다.

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

3.2 위험 관리 및 대결의 합리화

비즈니스 위험 관리의 가장 큰 어려움은 부정 행위가 어떤 형태를 취하더라도 변함없이 항상 존재하는 유일한 것은 대결입니다. 표준화된 프로세스는 최적의 솔루션을 즉시 얻을 수 있다고 보장하지 않을 수 있지만 문제를 분석 및 노출하고 피드백을 통해 순방향 반복 링크를 설정하며 효율성을 향상시키는 데 도움이 될 수 있습니다.

지능 기술을 기반으로 한 운영 축적 능력은 Xiaohongshu 위험 관리 팀에서 점차 실행 가능한 프로세스 시스템을 형성했으며 지속적으로 운영되고 있습니다. 전체 프로세스는 위험 인식, 역량 강화, 위험 식별, 위험 처리, 효과 평가의 다섯 단계로 나눌 수 있습니다.

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

위험 인식: 지표 시스템을 활용하여 위험을 더 빠르게 발견하고, 수동적 소방 활동을 적극적 방어로 변경하고, 역량 강화 및 후속 프로세스를 추진합니다.

역량 구축: 대결에 대한 신속한 대응 능력을 구축하고 유연하게 구성 가능한 위험 제어 시스템에 빠르게 액세스하세요.

위험 식별: 식별 정확도 향상, 기능 시스템 구축, 부정 행위 기능 마이닝, 누락된 기능에 대한 수요 피드백 제공.

위험 처리: 대결 비용을 줄이고, 행동을 가로채고, 메모 흐름을 제한하고, 사용자를 처리하고, 전략 반복에 대한 효과적인 피드백을 형성하는 보다 효과적인 방법을 선택합니다.

효과 평가: 또한 지표 시스템을 사용하여 부정행위 및 유출, 불법 제품 서비스 가격, 계정 가격 등 위험 수준의 변화를 평가하고 과실치사 및 유출에 대한 피드백도 제공할 수 있습니다.

새로운 지능을 발견하거나 새로운 부정 행위를 감지한 후 이 프로세스에 따라 작동하고 그 과정에서 무엇이 잘못되었는지 분석하고 판단합니다. 지능이 충분히 발견되지 않은 것인지, 지능이 지능으로 변환되지 않은 것인지 인식이 충분히 빠르나요? 아니면 식별, 폐기, 회수가 부족합니다.

정보작전에서의 구매량 분석을 예로 들면, 정보나 가격 변동을 통해 불법 서비스를 발견한 후 구매 테스트를 수행한 후 기술을 분석하고 식별 및 폐기를 위해 적절한 전략이나 모델을 선택합니다. 효과를 얻으려면 두 번의 재구매 또는 블랙 제품 가격의 지속적인 모니터링이 필요합니다. 현재 프로세스는 식별 및 폐기에 대한 피드백이 구현되고 효과 평가가 표준을 충족한 경우에만 종료됩니다.

3.3 지능형 위험 관리 식별

대립 수준과 예방 및 통제의 강도 측면에서 위험 제어의 지능형 식별은 크게 세 단계로 나눌 수 있습니다. 1단계, 블랙 제품에 대한 저비용 기계 기술 , 행동 주체의 특성을 바탕으로 분석 및 판단, 2단계에서 블랙 제품과의 고주파 대결, 그룹의 특성을 기반으로 3단계, 식별에서; 실제 사람들의 브러시 볼륨, 브러시 커뮤니티 간의 관계를 기반으로 그래프 기반 알고리즘을 사용하여 주제 관계를 발견합니다. 현재 소홍서에서는 이 세 단계가 구현되고 실행되고 있습니다.

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

3.3.1 행동주체 특성 분석

트래픽 데이터는 표현형식으로, 그 기본 구성요소는 사용자의 각 상호작용 행동이며, 위험 통제도 그 특성을 기반으로 분석 및 식별됩니다. 행동. 식별 과정에서 행동 특성의 품질은 블랙 제품의 식별 및 회상과 직접적인 관련이 있으므로 데이터 특성 구축이 특히 중요합니다. "날카로운 칼은 장작을 자르는 데 시간을 낭비하지 않습니다." 이 단계에서는 행동 주체의 사용자, 장치 등을 기반으로 한 기능 시스템을 구축하여 지능적인 위험 관리 기반을 마련했습니다.

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.블랙 생산의 목적은 최저 비용으로 볼륨 브러싱 작업을 완료하는 것입니다. 이 단계에서 블랙 생산은 기계 수단을 사용하여 자동 또는 반자동 배치 브러싱을 수행하는 경우가 많습니다. 또한 고효율. 우리의 기본 가정은 머신 브러싱을 수행할 때 머신 계정이나 장치에 명확하고 설명 가능한 비정상적인 특성이 있어야 한다는 것입니다. 따라서 이상특성을 어떻게 분석하고 식별하는가는 위험통제의 첫 번째 단계에서 해결해야 할 과제이다. 식별 및 업무 분담 측면에서

end+cloud 방지 및 제어 모델

을 구현합니다. End Defense는 장치의 사전 예방 및 제어를 완료하기 위해 합리적인 장치 보고 및 탐지 방법을 설계합니다. 사용자 특성, 장치 특성 및 행동 특성에 대한 분석 및 식별. 프로토콜 인터페이스 요청을 예로 들어보겠습니다. 블랙 제품은 플랫폼의 서명 알고리즘을 크래킹하여 백엔드 인터페이스를 직접 요청하며 실제 장비 없이도 브러싱을 완료할 수 있습니다. 이는 가장 저렴하고 효율적인 수단입니다. 블랙 제품에서 흔히 사용하는 브러싱 방법입니다. 실제 장치가 없으면 실제 프런트 엔드 관리 및 장치 보고도 불가능합니다. 장치 정보가 위조되더라도 장치 보고 정보의 필드 및 장치 환경을 일반 장치와 동일하게 효과적으로 위조할 수 없습니다.

관련 특성 매개변수 검증을 통해 환경 이상을 식별하고 예방하는 것 외에도 포괄적인 특성 시스템과 침전된 블랙 생산 샘플을 기반으로 감독 식별 모델을 구축했습니다. 전체 모델에서

특성 엔지니어링은 모델 리콜을 보장하는 중요한 링크이며, 모델 결과 처리는 정확성

을 보장합니다.

Feature Engineering: Feature Engineering에서는 두 부분으로 나누어 순차적으로 진행합니다.

  • 기능 선택 : 초기 단계에서 지속적인 "수동 대결"을 거쳐 기능 대결에서 풍부한 경험을 축적했으며, 디바이스 커널 버전, 팜 라벨 등 블랙 프로덕션 브러싱 기술 관점에서 포괄적인 기능과 라벨을 선택했습니다. 수정된 기계 분야, 등록 기간, 일괄 등록 라벨 등
  • 특성 처리: 특성 처리 중에 이산 특성과 연속 특성을 별도로 표준화한 다음 특성화 결과에 대해 서로 다른 접합 방법을 시도하여 분산된 특성 데이터를 다차원 모델 입력으로 변환합니다.

결과 처리: 설계 측면에서 회귀 모델을 추론으로 학습했습니다. 즉, 입력 값은 연속 점수이므로 분류 모델보다 결과 처리가 더 유연합니다.

  • 샘플 분포: 실제 브러쉬 샘플의 모델 결과 분포를 분석하여 블랙 제품과 실제 동작을 구별하는 기준으로 "적절한" 임계값이 반자동으로 계산됩니다.
  • 작업 평가: 모델이 온라인 상태가 되기 전에 위험 제어 작업에서는 평가 정확도가 표준에 도달한 경우에만 모델을 온라인에 올려 식별할 수 있습니다.

3.3.2 그룹 피처 마이닝

앞서 언급했듯이 대결은 항상 존재합니다. 블랙 제조업체는 저비용 기계 기술이 위험 제어 검증을 우회할 수 없다는 사실을 발견하면 실제 기계, 위조된 장치 매개변수, 부정 행위 도구 등의 대책을 사용하고 기술을 업그레이드하여 저비용 기술을 제거하기 위해 지속적으로 노력할 것입니다. 끊임없는 대립 속에서 1단계의 주체 특성 분석은 상대적으로 소극적인 모습을 보여 적극적인 예방과 통제가 이루어지지 못한다.

리스크 관리의 관점에서 이 단계의 기본 가정은 다음과 같습니다. 블랙 제품이 아무리 위조되거나 우회되더라도 갱단의 성격은 바뀔 수 없습니다. 데이터 특성에는 유사성과 집계가 있어야 합니다. 따라서 현 단계에서는 갱단을 식별 대상으로 삼아 집단 특성을 마이닝하고, 구조화된 데이터 특징 시스템을 활용하는 것이 두 번째 방어선 구축이 필요하다.

끊임없이 변화하는 머신 브러싱 방식을 예로 들어보겠습니다. 블랙 생산 방식은 프로토콜 인터페이스에서 수정된 머신 그룹 제어로 점차 변화하고 자동화된 클릭 도구로 진화했습니다. 선제적인 예방 및 제어를 위해 장치 클러스터링 모델을 사용하여 식별 및 리콜을 수행하고, 위의 기계 기술을 효과적으로 억제했습니다.

디바이스 클러스터링 모델은 기본 디바이스 정보(예: 디바이스 모델, 앱 버전, 시스템 커널 등)를 특징으로 하며, 동일한 노트 또는 클러스터링 클래스 알고리즘을 통해 유사성이 높은 장치 그룹을 묘사합니다. 식별 후 블랙 장치를 기록하고 후속 행위 차단을 수행하며, 블랙 장치 그룹의 장치 태그를 출력하여 장치 블랙 데이터베이스를 확장합니다. 이 모델은 비지도 모델로서 부정 행위 방법을 자주 바꾸는 블랙 제품의 특성에 잘 적응할 수 있으며 온라인 전략을 보완하고 리콜을 확대할 수도 있습니다.

다음은 모델 흐름도 및 클러스터 식별 사례입니다.

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

전체 모델에서 기능 엔지니어링 및 클러스터 스크리닝을 활용하여 블랙 장비에 대한 높은 리콜 및 정확도 높은 클러스터링을 수행합니다. :

  • 기능 엔지니어링: 첫 번째 단계에서는 포괄적이고 재사용성이 높은 기능 시스템을 구축했습니다. 이 단계에서는 갱 장비의 특성을 분석하고 적절한 20~30차원 장비 기능을 입력으로 선택했습니다. 데이터 소스로부터 모델의 재현이 보장됩니다.
  • 클러스터 스크리닝: 지속적인 위험 통제 대결에서 우리는 클러스터링 모델의 출력 결과를 필터링할 때 충분한 장치 태그와 장치 블랙 라이브러리를 축적했습니다. 이러한 블랙 장치는 클러스터 생성 농도를 계산하는 시드로 사용됩니다. 이를 통해 정확하고 리콜률이 높은 장치 클러스터를 선별합니다.

3.3.3 그래프 기반 주제 발견

위에서 언급한 것처럼 브러싱 볼륨 방식은 기계 방식이 위험 통제를 우회할 수 없다는 사실을 알게 되면 점차 실인 대 실인으로 진화하게 됩니다. 그들은 크라우드소싱을 모집하거나 상호 브러싱 방법을 조직하고 실제 사람들의 행동을 사용하여 볼륨을 브러싱하려고 노력할 것입니다. 모두 실존인물의 행동임에도 불구하고 그 본질은 진정한 의지가 결여된 '위조화폐'라는 점이다. 실제 사람들의 행동의 주요 특징을 분석하면 이상 징후를 발견하지 못할 뿐만 아니라, 장비에서는 집단 특성을 찾을 수 없습니다.

볼륨 브러싱 행동의 특수성으로 인해, 방법을 어떻게 바꾸더라도 볼륨 브러싱 행동의 궁극적인 방향은 주제 상관관계가 있는 한 구매 볼륨의 주체가 된다는 것이 우리의 합리적인 가정입니다. , 데이터 특성을 통해 행동을 분석할 수 있습니다. 회상을 식별합니다. 이 단계에서 Xiaohongshu는 고유한 커뮤니티, 전자상거래 행동 그래프, 거래량 및 주문 브러싱 그래프를 사용하여 행동 주제 그룹을 사전에 발견하고 채굴합니다. 개체 연관 및 그래프 알고리즘을 사용하여 실제 부정 행위 사용자 또는 사람들을 식별합니다. 사용자의 회상은 "그물을 빠져나간 물고기"를 효과적으로 찾을 수 있습니다.

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.


* 그림 1: 일반 사용자가 좋아하는 메모의 연관 다이어그램

(빨간 점은 메모, 파란색 점은 사용자)

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.


* 그림 2: 부정행위 사용자가 좋아하는 노트의 상관관계도

(빨간색 점은 노트, 파란색 점은 사용자)


그림 1: 일반 사용자 7명이 좋아요를 누른 노트 중 딱 1개의 노트가 겹칩니다. 가운데 빨간 점을 참고하세요. ㅋㅋㅋ 위 그림은 사용자와 노트 사이의 행동 상관 관계를 보여줍니다(빨간색은 노트, 파란색은 사용자). 그림 1은 일반 노트를 좋아하는 일반 사용자 간의 행동 상관 관계를 확인할 수 있습니다. 행동 사용자의 상관 관계가 낮고 노트 그룹에 많은 수의 사람들이 동의하지만 시스템이 "취미"로 인해 동일한 유형의 노트를 추천하기 때문에 가끔 중복이 발생합니다. 그림 2에서 행동 사용자는 커뮤니티 관련성이 높고 부정 행위 메모를 좋아하는 부정 행위 사용자의 일반적인 행동 상관 다이어그램인 일련의 부정 행위 메모를 좋아합니다. '운전' 상호 브러싱을 예로 들면, 즉 볼륨 브러싱 작업을 받은 후 블랙산업이 조직자이자 중개자 역할을 하여 상호 브러싱에 자주 참여하는 사람들(상호 좋아요 등)에게 작업을 발행하고, 지정된 대상을 브러싱합니다. 블랙 제품은 하나의 작업만 게시하지 않으며 행동 사용자도 하나의 작업만 수행하지 않습니다. 둘 사이에는 상대적으로 고정된 "원"이 있습니다. 이러한 유형의 부정 행위에 대해 우리는 라벨 전파 모델을 사용하여 커뮤니티 사용자를 일괄적으로 회수했습니다.

라벨 전파 모델은 시드 사용자를 확산시키기 위한 위험 관리 맵을 기반으로 합니다. 시드 사용자는 위험 관리에 의해 식별되고 침전된 브러시 사용자로부터 나옵니다. 등, 위험 관리 맵을 기반으로 포인트-에지 관계의 전파. 볼륨 브러싱에는 실제 사람이 사용되며, 볼륨 브러싱 목적을 달성하기 위해 장비와 계정이 제한되어 있습니다. 행동 사용자는 소규모 계정에서 여러 작업을 반복적으로 수락할 수 있습니다. 태그 전파의 목적은 브러싱 태그를 올바른 경로를 통해 커뮤니티의 다른 브러싱 사용자에게 전파하여 브러싱 식별 및 회상을 완료하는 것입니다.

전파 경로:

사용자 태그는 기기 및 타사 계정과 같은 강력한 경로는 물론 메모, 작성자 등 구매자와 관련된 경로를 통해 전파됩니다.

사용자 태그: 브러시 사용자는 실제 사람이기 때문에 라벨 전파를 통해 사용자에게 부여된 태그를 직접 가로챌 수 없는 경우가 많습니다. 따라서 실제 사람이 볼륨을 브러싱한다는 기본 가정을 바탕으로 태그를 수행했습니다. 구매 주체와 세탁량 사용자를 식별하기 위한 집계 분석.

    4. 문제 해결을 위해 기술 밖에서 생각하세요
  • 위 내용은 주로 문제 해결을 위한 기술에 기반을 두고 있지만, 실제 업무에서도 기술적인 관점에서 벗어나 좀 더 거시적인 관점에서 비즈니스를 돕고 보안을 강화해야 합니다. 관점. 이러한 목적을 바탕으로 기술을 깊이 파고들면서 우리는 구현 가능하고 효과적인 일련의 방법론을 개발했습니다. 문제의 영향을 제거하는 것부터 시작하여 문제를 일으키는 사람을 해결하고 마지막으로 문제를 일으키는 동기를 제거합니다
  • .

문제 해결을 위한 3가지 포인트


문제의 영향을 제거합니다

가짜 잔디 심기를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.

기술적 수단을 통해 부정 행위 개체 및 데이터를 식별한 후 실제 관리 및 폐기 조치를 취하고, 허위로 처리합니다. 플랫폼에서 트래픽이 차단됩니다.


말썽꾼을 해결하세요

계좌 거래, 플랫폼 데이터 거래, 거래자 등을 포함한 이 산업 체인의 사람들과 모든 링크를 단속하세요. 여기서 우리는 위험 통제 부서와 법무 부서 간의 합동 작업을 통해 문제를 일으키는 사람을 처리합니다. 올해 6월부터 8월까지 MCN 6곳과 볼륨 브러싱에 관여한 일부 작가들이 엄중처벌을 받고 소송이 제기됐다. 전자상거래 시나리오에서 가짜 주문을 하는 판매자는 주로 트래픽을 유도하고 더 높은 GMV를 달성하기 위해 그렇게 합니다. 식별된 판매자 계정은 전문적인 판단을 위해 운영 학생에게 넘겨지며, 나쁜 행동의 심각도에 따라 처벌을 위해 규칙 측에 넘겨집니다. 나쁜 행동을 하는 사용자는 블랙리스트에 올라 명령을 받습니다. 행동은 위험 통제에 의해 제한됩니다.

문제를 일으키는 동기를 파악하세요

커뮤니티 시나리오에서 대량 구매자의 목적은 부정 행위를 통해 자신의 상업적 가치를 실현하는 것이며, 우리가 해야 할 일은 이러한 사용자나 기관의 상업적 가치를 줄이는 것입니다. 위험 통제는 환경 및 운영 부서와 통합, 플랫폼 규칙, 법률 및 규정 등에 따라 부정 행위 트래픽을 처벌합니다. 지속적인 단속을 통해 불법 계정 비용이 높아지고, 브러싱 서비스 가격이 계속 오르고, 좋아요와 컬렉션 단가가 300% 이상 올랐으며, 이용자들의 부정 행위 의지가 점차 줄어들고 있습니다.

2022년부터 Xiaohongshu는 총 31억 개의 부정 행위 좋아요를 정리했습니다. 볼륨을 높이는 문제에 대한 플랫폼의 태도는 항상 매우 단호한 것으로 볼 수 있습니다.

(이 기사의 작성자: Xiaohongshu 보안 기술 부서 Lu Xun Shiying Wang Ma Ye Feng Shi Hao Lao Pi)

위 내용은 '가짜 잔디 심기'를 방지하고 통제하기 위해 Xiaohongshu의 기술 팀은 다음과 같은 주요 작업을 수행했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제