ホームページ  >  記事  >  バックエンド開発  >  中国語単語分割処理方法_PHPチュートリアル

中国語単語分割処理方法_PHPチュートリアル

WBOY
WBOYオリジナル
2016-07-14 10:10:54778ブラウズ

[php]
 
/**
* 中国語単語分割処理方法
*+--------------------------------
* @param stirng $string 処理対象の文字列
* @param boolers $sort=false 値に応じて逆順
* @param Numbers $top=0 は指定された数値を返し、デフォルトではすべてを返します
*+--------------------------------
* @return void
​*/
function scws($text, $top = 5, $return_array = false, $sep = ',') {
    include('./pscws4/pscws4.php');//去下面给的网址ハンドルpscws4下ダウンロード下来
    $cws = 新しい pscws4('utf-8'); 
    $CWS -> set_charset('utf-8'); 
    $CWS -> set_dict('./pscws4/etc/dict.utf8.xdb'); 
    $CWS -> set_rule('./pscws4/etc/rules.utf8.ini'); 
    //$cws->set_multi(3);  
    $CWS -> set_ignore(true); 
    //$cws->set_debug(true);  
    //$cws->set_duality(true);  
    $CWS -> send_text($text); 
    $ret = $cws -> get_tops($top, 'r,v,p'); 
    $結果 = null; 
    foreach ($ret を $value として) {
        if (false === $return_array) {
            $result .= $sep 。 $value['単語']; 
        } その他 {
            $result[] = $value['単語']; 
        }
    }
    return false === $return_array ? substr($result, 1) : $result; 
}
print_r(scws('青花夔龙纹香炉')); 

/**
* 中国語単語分割処理方法
*+--------------------------------
* @param stirng $string 処理対象の文字列
* @param boolers $sort=false 値に応じて逆順
* @param Numbers $top=0 は指定された数値を返し、デフォルトではすべてを返します
*+--------------------------------
* @return void
​*/
function scws($text, $top = 5, $return_array = false, $sep = ',') {
    include('./pscws4/pscws4.php');//去下面给的网址ハンドルpscws4下ダウンロード来ます
    $cws = new pscws4('utf-8');
    $CWS -> set_charset('utf-8');
    $CWS -> set_dict('./pscws4/etc/dict.utf8.xdb');
    $CWS -> set_rule('./pscws4/etc/rules.utf8.ini');
    //$cws->set_multi(3);
    $CWS -> set_ignore(true);
    //$cws->set_debug(true);
    //$cws->set_duality(true);
    $CWS -> send_text($text);
    $ret = $cws -> get_tops($top, 'r,v,p');
    $result = null;
    foreach ($ret を $value) {
        if (false === $return_array) {
            $result .= $sep 。 $value['単語'];
        } その他 {
            $result[] = $value['単語'];
        }
    }
    return false === $return_array ? substr($result, 1) : $result;
}
print_r(scws('青花夔龙纹香炉'));


 

www.bkjia.com本当http://www.bkjia.com/PHPjc/477442.html技術記事 [php] ?php /** * 中文分词处処理方法 *+-------------------------------- * @ param string $string 要处処理的文字列 * @param boolers $sort=false 根定値进行倒順 * @...
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。