首页  >  文章  >  php教程  >  中文分词处理方法

中文分词处理方法

WBOY
WBOY原创
2016-06-13 10:56:551206浏览

[php]
 
/**
 * 中文分词处理方法
 * ---------------------------------
 * @param stirng  $string 要处理的字符串
 * @param boolers $sort=false 根据value进行倒序
 * @param Numbers $top=0 返回指定数量,默认返回全部
 * ---------------------------------
 * @return void
 */ 
函数 scws($text, $top = 5, $return_array = false, $sep = ',') { 
    include('./pscws4/pscws4.php');//去下面给的网址把pscws4下载下来  
    $cws = new pscws4('utf-8'); 
    $cws-> set_charset('utf-8'); 
    $cws-> set_dict('./pscws4/etc/dict.utf8.xdb'); 
    $cws-> set_rule('./pscws4/etc/rules.utf8.ini'); 
    //$cws->set_multi(3);  
    $cws->设置_忽略(真); 
    //$cws->set_debug(true);  
    //$cws->set_duality(true);  
    $cws->发送文本($文本); 
    $ret = $cws ->; get_tops($top, 'r,v,p'); 
    $结果=空; 
    foreach($ret 作为 $value){ 
        if (false === $return_array) { 
            $ 结果 .= $sep 。 $值['单词']; 
        }其他{ 
            $结果[] = $值['单词']; 
        } 
    } 
    返回 false === $return_array ? substr($结果, 1) : $结果; 

print_r(scws('青花夔龙纹香炉')); 

/**
 * 中文分词处理方法
 * ---------------------------------
 * @param stirng  $string 要处理的字符串
 * @param boolers $sort=false 根据value进行倒序
 * @param Numbers $top=0 返回指定数量,默认返回全部
 * ---------------------------------
 * @return void
 */
函数 scws($text, $top = 5, $return_array = false, $sep = ',') {
    include('./pscws4/pscws4.php');//去下面给的网址把pscws4下载下来
    $cws = new pscws4('utf-8');
    $cws-> set_charset('utf-8');
    $cws-> set_dict('./pscws4/etc/dict.utf8.xdb');
    $cws-> set_rule('./pscws4/etc/rules.utf8.ini');
    //$cws->set_multi(3);
    $cws-> set_ignore(true);
    //$cws->set_debug(true);
    //$cws->set_duality(true);
    $cws-> send_text($text);
    $ret = $cws ->; get_tops($top, 'r,v,p');
    $结果 = null;
    foreach ($ret 作为 $value) {
        if (false === $return_array) {
            $ 结果 .= $sep 。 $value['word'];
        } 其他 {
            $result[] = $value['word'];
        }
    }
    返回 false === $return_array ? substr($结果, 1) : $结果;
}
print_r(scws('青花夔龙纹香炉'));


 

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn