トライ ツリーの概念 (Baidu の説明): 単語検索ツリー、トライ ツリーとも呼ばれる辞書ツリーは、ツリー構造であり、ハッシュ ツリーの変形です。一般的なアプリケーションは、多数の文字列 (文字列に限定されません) をカウント、並べ替え、保存するためのものであるため、検索エンジン システムによってテキスト ワードの頻度統計に使用されることがよくあります。その利点は、文字列の共通プレフィックスを使用してクエリ時間を短縮し、不必要な文字列比較を最小限に抑え、クエリ効率がハッシュ ツリーよりも高いことです。
私の理解では、これは文字列検索に使用されます。たとえば、「world」という単語が入力された場合、ツリーの構造は次のようになります。単語「worab」が入力されると、ツリーの構造は次のようになります:
したがって、各ノードには、それが終了単語であるかどうかを識別するフィールド is_end も必要です。例えば、wor と入力して、wor で始まる単語をすべて検索すると、「w」から検索が開始され、「r」が検索されたと判断する必要があります。 「r」ノードの is_end が true であり、wor が追加されます。結果リストに移動して、以下の検索を続けます。
PHP 実装コード:
<?php class Node{ public $value; // 节点值 public $is_end = false; // 是否为结束--是否为某个单词的结束节点 public $childNode = array(); // 子节点 /* 添加孩子节点--注意:可以不为引用函数,因为PHP对象赋值本身就是引用赋值 */ public function &addChildNode($value, $is_end = false){ $node = $this->searchChildNode($value); if(empty($node)){ // 不存在节点,添加为子节点 $node = new Node(); $node->value = $value; $this->childNode[] = $node; } $node->is_end = $is_end; return $node; } /* 查询子节点 */ public function searchChildNode($value){ foreach ($this->childNode as $k => $v) { if($v->value == $value){ // 存在节点,返回该节点 return $this->childNode[$k]; } } return false; } } /* 添加字符串 */ function addString(&$head, $str){ $node = null; for ($i=0; $i < strlen($str); $i++) { if($str[$i] != ' '){ $is_end = $i != (strlen($str) - 1) ? false : true; if($i == 0){ $node = $head->addChildNode($str[$i], $is_end); }else{ $node = $node->addChildNode($str[$i], $is_end); } } } } /* 获取所有字符串--递归 */ function getChildString($node, $str_array = array(), $str = ''){ if($node->is_end == true){ $str_array[] = $str; } if(empty($node->childNode)){ return $str_array; }else{ foreach ($node->childNode as $k => $v) { $str_array = getChildString($v, $str_array, $str . $v->value); } return $str_array; } } /* 搜索 */ function searchString($node, $str){ for ($i=0; $i < strlen($str); $i++) { if($str[$i] != ' '){ $node = $node->searchChildNode($str[$i]); // print_r($node); if(empty($node)){ // 不存在返回空 return false; } } } return getChildString($node); } /* 调用测试开始 */ $head = new Node; // 树的head // 添加单词 addString($head, 'hewol'); addString($head, 'hemy'); addString($head, 'heml'); addString($head, 'you'); addString($head, 'yo'); // 获取所有单词 $str_array = getChildString($head); // 搜索 $search_array = searchString($head, 'hem'); // 循环打印所有搜索结果 foreach ($search_array as $key => $value) { echo 'hem' . $value . '<br>'; // 输出带上搜索前缀 }
上記では、PHP でのトライ ツリー (辞書ツリー) の実装について、単語の内容も含めて紹介しています。PHP チュートリアルに興味のある友人の参考になれば幸いです。