Heim  >  Artikel  >  Backend-Entwicklung  >  除去字串中的重复词,生成索引字符串,字符串参数为已经分词处理的串_PHP教程

除去字串中的重复词,生成索引字符串,字符串参数为已经分词处理的串_PHP教程

WBOY
WBOYOriginal
2016-07-20 11:08:00861Durchsuche

/除去字串中的重复词,生成索引字符串,字符串参数为已经分词处理的串
  //--------------------------------------------------
  function getindextext($okstr,$ilen=-1)
  {
    if($okstr=="") return "";
    $ws = explode(" ",$okstr);
    $okstr = "";
    $wks = "";
    foreach($ws as $w)
    {
      $w = trim($w);
      //排除小于2的字符
      if(strlen($w)      //排除数字或日期
      if(!ereg("[^0-9:-]",$w)) continue;
      if(strlen($w)==2&&ord($w[0])>0x80) continue;
      if(isset($wks[$w])) $wks[$w]++;
      else $wks[$w] = 1;
    }
    if(is_array($wks))
    {
      arsort($wks);
      if($ilen==-1)
      { foreach($wks as $w=>$v) $okstr .= $w." "; }
      else
      {
        foreach($wks as $w=>$v){
          if((strlen($okstr)+strlen($w)+1)          else break;
        }
      }
    }
    return trim($okstr);
  }?>


www.bkjia.comtruehttp://www.bkjia.com/PHPjc/444908.htmlTechArticle/除去字串中的重复词,生成索引字符串,字符串参数为已经分词处理的串 //-------------------------------------------------- function getindextext($okstr,...
Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn