>백엔드 개발 >PHP 튜토리얼 >【对比】PHP检测提交的段落是否有重复行,哪一种更好?解决办法

【对比】PHP检测提交的段落是否有重复行,哪一种更好?解决办法

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB원래의
2016-06-13 11:12:18887검색

【对比】PHP检测提交的段落是否有重复行,哪一种更好?
写的两个函数,对比提交的文本段落里面重复的有无,发现一些问题:
(1)in_array()检测中文有的时候会有问题,明明存在却提示不存在,长文本的时候概率更高
(2)有时候短段落重复3~4次是允许的,但是如果用similar_text作对比就导致只要有一次重复就拒绝用户提交了。如何改进才更好
(3)还有没有更好的方法,求~


<br><br><br>function hasSimilarText($string)<br>{<br>    $lineArr = explode("\n",$string);<br>    $arrStr = $arrLen = array();<br>    foreach($lineArr as $k => $v)<br>    {<br>        $arrLen[] = strlen($v);<br>        $arrStr[] = $v;<br>    }<br><br>    foreach($arrStr as $k1 => $v1)<br>    {<br>        foreach($arrStr as $k2 => $v2)<br>        {<br>            if($k1 == $k2) continue;<br>            if($arrLen[$k2]  100) continue;<br>            similar_text($v1, $v2, $pct);<br>            if($pct > 90) return true;<br>        }<br>    }<br>    return false;<br>}<br><br><br>/* 重复段落检测 */<br>function hasRepeatLine($string)<br>{<br>    $string = str_replace(array("\t"," ","@","#","。",",",".",","),'',$string);<br>    //$string = str_replace("\r","\n",$string);<br>    $lineArr = explode("\n",$string);<br>    $countShort = $countMiddle = $countLong = 0;<br>    $arr = array();<br><br>    foreach($lineArr as $lineString)<br>    {<br>        $length = strlen( $lineString );<br>        if($length         if(in_array($lineString,$arr))<br>        {<br>            if($length             {<br>                $countShort++;<br>                if($countShort > 4) return true;//5次<br>            } elseif($length>12 && $length                 $countMiddle++;<br>                if($countMiddle > 3) return true; //4次<br>            } elseif($length>50 && $length                 $countLong++;<br>                if($countLong > 2) return true; //3次<div class="clear">
                 
              
              
        
            </div>
성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.