ホームページ  >  記事  >  バックエンド開発  >  Word PHP はトライ ツリー (辞書ツリー) を実装します。

Word PHP はトライ ツリー (辞書ツリー) を実装します。

WBOY
WBOYオリジナル
2016-07-29 08:33:111046ブラウズ

トライ ツリーの概念 (Baidu の説明): 単語検索ツリー、トライ ツリーとも呼ばれる辞書ツリーは、ツリー構造であり、ハッシュ ツリーの変形です。一般的なアプリケーションは、多数の文字列 (文字列に限定されません) をカウント、並べ替え、保存するためのものであるため、検索エンジン システムによってテキスト ワードの頻度統計に使用されることがよくあります。その利点は、文字列の共通プレフィックスを使用してクエリ時間を短縮し、不必要な文字列比較を最小限に抑え、クエリ効率がハッシュ ツリーよりも高いことです。

私の理解では、これは文字列検索に使用されます。たとえば、「world」という単語が入力された場合、ツリーの構造は次のようになります。単語「worab」が入力されると、ツリーの構造は次のようになります:

 PHP实现Trie树(字典树)

したがって、各ノードには、それが終了単語であるかどうかを識別するフィールド is_end も必要です。例えば、wor と入力して、wor で始まる単語をすべて検索すると、「w」から検索が開始され、「r」が検索されたと判断する必要があります。 「r」ノードの is_end が true であり、wor が追加されます。結果リストに移動して、以下の検索を続けます。

PHP 実装コード:  PHP实现Trie树(字典树)

<?php

class Node{

	public $value;                 // 节点值
	public $is_end = false;        // 是否为结束--是否为某个单词的结束节点
	public $childNode = array();   // 子节点
	
	/* 添加孩子节点--注意:可以不为引用函数,因为PHP对象赋值本身就是引用赋值 */
	public function &addChildNode($value, $is_end = false){
		$node = $this->searchChildNode($value);
		if(empty($node)){
			// 不存在节点,添加为子节点
			$node = new Node();
			$node->value = $value;
			$this->childNode[] = $node;
		}
		$node->is_end = $is_end;
		return $node;
	}

	/* 查询子节点 */
	public function searchChildNode($value){
		foreach ($this->childNode as $k => $v) {
			if($v->value == $value){
				// 存在节点,返回该节点
				return $this->childNode[$k];
			}
		}
		return false;
	}
}



/* 添加字符串 */
function addString(&$head, $str){
	$node = null;
	for ($i=0; $i < strlen($str); $i++) {
		if($str[$i] != &#39; &#39;){
			$is_end = $i != (strlen($str) - 1) ? false : true;
			if($i == 0){
				$node = $head->addChildNode($str[$i], $is_end);
			}else{
				$node = $node->addChildNode($str[$i], $is_end);
			}
		}
	}
}

/* 获取所有字符串--递归 */
function getChildString($node, $str_array = array(), $str = ''){
	if($node->is_end == true){
		$str_array[] = $str;
	}
	if(empty($node->childNode)){
		return $str_array;
	}else{
		foreach ($node->childNode as $k => $v) {
			$str_array = getChildString($v, $str_array, $str . $v->value);
		}
		return $str_array;
	}
}

/* 搜索 */
function searchString($node, $str){
	for ($i=0; $i < strlen($str); $i++) {
		if($str[$i] != &#39; &#39;){
			$node = $node->searchChildNode($str[$i]);
			// print_r($node);
			if(empty($node)){
				// 不存在返回空
				return false;
			}
		}
	}
	return getChildString($node);
}


/* 调用测试开始 */
$head = new Node;   // 树的head

// 添加单词
addString($head, 'hewol');
addString($head, 'hemy');
addString($head, 'heml');
addString($head, 'you');
addString($head, 'yo');

// 获取所有单词
$str_array = getChildString($head);

// 搜索
$search_array = searchString($head, 'hem');
// 循环打印所有搜索结果
foreach ($search_array as $key => $value) {
	echo 'hem' . $value . '<br>';  // 输出带上搜索前缀
}

上記では、PHP でのトライ ツリー (辞書ツリー) の実装について、単語の内容も含めて紹介しています。PHP チュートリアルに興味のある友人の参考になれば幸いです。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。