>  기사  >  백엔드 개발  >  한자 ratio_php 스킬을 통해 스팸댓글을 판별하는 PHP 방식

한자 ratio_php 스킬을 통해 스팸댓글을 판별하는 PHP 방식

WBOY
WBOY원래의
2016-05-16 20:34:33848검색

이 기사의 예에서는 PHP가 한자 비율을 통해 스팸 댓글을 판단하는 방법을 구현하는 방법을 설명합니다. 참고할 수 있도록 모든 사람과 공유하세요. 구체적인 구현 방법은 다음과 같습니다.

1. 수요:

이런 종류의 스팸댓글은 최근 자주 등장하는데, 큰 문단에 한자를 포함한 희귀 한자 1~2개가 섞여 있고, 한자민감 단어가 전혀 포함되어 있지 않아 댓글 필터를 통과한 것입니다. 공공연히. 이러한 댓글의 처리는 한자의 비율을 판단하여 확인할 수 있지만, 오판도 있을 수 있습니다.

2. 해결책:

PHP의 strlen과 mb_strlen 두 함수를 사용해야 합니다. strlen은 한자의 길이를 3으로 식별하고, mb_strlen은 한자의 길이를 1로 식별합니다. 두 함수로 구한 동일한 문자 세그먼트 길이의 차이는 실제 한자 수의 2배가 되며, 이를 2로 나누어 mb_strlen으로 구한 길이로 비율을 계산하여 한자 비율을 구합니다. 문자를 총 문자 수로 늘립니다.

3. 구현 코드:

코드 복사 코드는 다음과 같습니다.
$len_all = strlen($comment['text'] ); $len_st = mb_strlen($comment['text'], 'UTF-8');
if(($len_all-$len_st)/(2*$len_st) < 0.5){
​​​​$error = "한자 50% 미만"
}
댓글에 코드를 올리시면 한자의 비율이 낮아질 수 있으니, 코드 항목을 필터링 하신 후 판단하셔야 합니다.

이 기사가 모든 사람의 PHP 프로그래밍 설계에 도움이 되기를 바랍니다.

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.