ホームページ >バックエンド開発 >PHPチュートリアル >Thinkphp32 は、scws 中国語単語セグメンテーションを使用してキーワードを抽出します
SCWS は、Simple Chinese Word Segmentation (つまり、Simple Chinese Word Segmentation System) の頭字語です。
1. scws が公式に提供するクラスをダウンロードします (ここでは pscws の第 4 バージョンを使用します)
http://www.xunsearch.com/scws/down/pscws4-20081221.tar.bz2
XDB 辞書ファイルをダウンロードします (使用されています)これは utf8 簡体字中国語辞書パッケージです)
http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2
2. scws クラス Pscws.class.php を解凍します (ここではput pscws4 .class.php ファイル名は pscws.class.php に変更されました) と XDB_R.class.php (ここでは xdb_r.class.php ファイル名を大文字の XDB_R.class.php に変更しました) を以下に配置しますThinkPHPLibraryOrgUtil ディレクトリ。
3. 次に、Pscws.class.phpを変更します
名前空間を追加します
1 namespace Org\Util;
クラスの名前をPscwsに変更します
把require_once (dirname(__FILE__) . '/XBD_R.class.php');这段代码删除掉。
XDB_R.class.phpを変更します
名前空間を追加します
4. XDB 辞書ファイルを解凍します
Publicadmin ディレクトリに新しい dict フォルダーを作成し、XDB 辞書ファイルの dict.utf8.xdb を word ディレクトリに解凍し、etc の下に rules.utf8.ini を解凍します。 scws クラス このディレクトリの下に置きます。
5. 定数定義コードの行をエントリ ファイル (実際には辞書ファイルと設定ファイルを定義するパス) に追加します。
namespace Org\Util;
6. その他の IndexController.class.php コントローラーにプライベート メソッドを作成します。
define("CONF_PATH", dirname(__FILE__)."/Public/admin/dict/");
を呼び出すメソッド 表示される結果は次のとおりです:
/** * 中文分词 * @params string $title 需要分词的语句 * @params int $num 分词个数,默认不用填写 **/ private function get_tags($title,$num=null){ $pscws = new \Org\Util\Pscws('utf8'); $pscws->set_dict(CONF_PATH . 'dict.utf8.xdb'); $pscws->set_rule(CONF_PATH . 'rules.utf8.ini'); $pscws->set_ignore(true); $pscws->send_text($title); $words = $pscws->get_tops($num); $pscws->close(); $tags = array(); foreach ($words as $val) { $tags[] = $val['word']; } return implode(',', $tags); } /** * 商品搜索结果页 **/ public function search(){ $rzt=$this->get_tags("新款 牛漆皮小尖头直跟高跟单鞋910033 灰羊猄(7.31发货) 39"); print_r($rzt); }
上記では、必要なコンテンツを含むキーワードを抽出するために Thinkphp32 を紹介しています。興味のある友人の役に立てば幸いです。 PHP チュートリアルで。