ホームページ >バックエンド開発 >PHPチュートリアル >PHP キーワード置換クラス (繰り返しの置換を避け、元のリンクを保持して復元します)、PHP キーワード_PHP チュートリアル
転載: http://www.169it.com/blog_article/601549531.html
このセクションの主な内容:
キーワード置換クラス
主にキーワードのフィルタリングまたはキーワードの検索と置換に使用できます。
実装プロセスの分析:
キーワードの置換は、実際には str_replace() プロセスです。単純な str_replace が 10W のキーワードに直面した場合、1W の単語の記事を書くのにかかる時間はわずか 2 秒です。
問題:
キーワードは複数回置換されています。たとえば、a は a に置換される必要がありますが、結果は a になる可能性があります。 a>このまま待ちます。
そのため、置換されたタグを保護し、記事を処理する前に[_tnum_]などのタグを置換し、記事の処理後に元に戻す方法が必要です。
もう一つの質問は、キーワードまたは記事に [_tnum_] 自体がある場合はどうなるかということですが、ここでは str_replace を使用できませんが、正規表現で除外するには preg_replace を使用する必要があります。
3 番目の質問は、2 つのキーワード a と ab がある場合はどうなるでしょうか? 最初に長いものを照合し、次に短いものを照合したいので、照合する前にそれらを並べ替える必要があります。
最後の質問ですが、str_replace を preg_replace に変更すると、同じ段落に 100,000 回一致するのに 5 秒かかります。その場合、strpos を使用して最初にキーワードを見つけます。クエリには 1 秒もかかりません。 100万でも8秒以上かかります。
キーワードの一致と置換のためのクラス、コード:
/*
* キーワードマッチングクラス
* @author ylx
* @packet mipang
* 使用例
* $str = "緑の貝を産む鶏、ファンデルサール来年、翌年 1 がルームに開かれます。'http://baidu.com',"来年"=>'google.com'));
* echo $key->getResultText() ;
* echo $key->getRuntime();
*/
class KeyReplace
{
private $keys = array();
private $text = "";
private $runtime = 0;
private $url = true;
private $stopkeys = array();
private $all = false;
/**
* @access public
* @param string $text は処理する記事を指定します
* @param array $keys は辞書フレーズを指定します array(key=>url,...) url は配列でも構いませんランダムに置き換えられる配列 そのうちの 1 つ
* @param array $stopkeys はストップワードを指定します array(key,...) この中の単語は処理されません
* @param boolean $url true は、リンク、そうでない場合のみ置換されます
* @param boolean $all true は、見つかったすべての単語を置換することを意味し、それ以外の場合は最初のみ置換します
*/
public function __construct($text='',$keys=array(),$url=true, $stopkeys=array(),$all=false) {
$this->keys = $keys;
$this->text = $text;
$this->url = $url;
$this- >ストップキー = $stopkeys;
$this-> すべて = $all;
}
* 加工された記事を取得します
* @access public
* @return string text
*/
public function getResultText() {
$start = microtime(true);
$keys = $this->hits_keys();
function cmp($a, $b){
if (mb_strlen($a) == mb_strlen($b)) {
return 0;
}
return (mb_strlen($a) < mb_strlen($b)) ? 1 : -1;
}
foreach($keys_tmp as $key){
if(is_array($keys[$key])){
$url = $keys[$key][rand(0,count($keys[$key])-1)];
}else
$url = $keys[$key];
}
$this->runtime = microtime(true)-$start;
}
/**
* 処理時間を取得します
* @access public
* @return float
*/
public function getRuntime() {
return $this->runtime;
}
/**
* キーワードを設定します
* @access public
* @param array $keys array(key=>url,...)
*/
public function setKeys($keys) {
$this->keys = $keys;
}
/**
* ストップワードを設定します
* @access public
* @param array $keys array(key,...)
*/
public function setStopKeys($keys) {
$this->stopkeys = $keys;
}
/**
* 記事を設定します
* @access public
* @param string $text
*/
public function setText($text) {
$this->text = $text;
}
/**
* 文字列内のヒットキーワードを検索するために使用されます
* @access public
* @return array $keys 一致した単語配列(key=>url,...)を返します
*/
public function Hist_keys(){
$ar = $this->keys;
$ar = $ar?$ar:array();
$result=array();
$str = $this->text;
foreach($ar as $k=>$url){
$k = トリム($k);
if(!$k)
Continue;
if(strpos( $str,$k)!==false && !in_array($k,$this->stopkeys)){
$result[$k] = $url;
}
}
return $result?$result:array ();
}
/**
* 文字列内のヒット ストップ ワードを検索するために使用されます
* @access public
* @return array $keys 一致した単語の array(key,...) を返します
*/
public function Hist_stop_keys(){
$ar = $this->stopkeys;
$ar = $ar?$ar:array();
$result=array();
$str = $this->text;
foreach($ar as $k){
$k = trim($k);
if(!$k)
continue;
if(strpos($str,$k) )!==false && in_array($k,$this->stopkeys)){
$result[] = $k;
}
}
return $result?$result:array();
}
/**
* 置換処理中
* @access private
* @param string $text 置換対象者
* @param string $key Keyword
* @param string $url リンク
* @return string $text 加工記事
*/
プライベート関数 r_s($text,$key,$url){
$tmp = $text;
$stop_keys = $this->hits_stop_keys();
$stopkeys = $tags = $a = array();
if(preg_match_all("#]+>[^<]*]*> #su",$tmp,$m)){
$a=$m[0];
foreach($m[0] as $k=>$z){
$z = preg_replace("###s","#",$z);
$tmp = preg_replace('#'.$z.'#s',"[_a".$k."_]",$tmp,1);
}
};
if(preg_match_all("#<[^>]+>#s",$tmp,$m)){
$tags = $m[0];
foreach($m[0] as $k =>$z){
$z = preg_replace("###s","#",$z);
$tmp = preg_replace('#'.$z.'#s',"[_tag" .$k."_]",$tmp,1);
}
}
if(!empty($stop_keys)){
if(preg_match_all("#".implode("|",$stop_keys)." #s",$tmp,$m)){
$stopkeys = $m[0];
foreach($m[0] as $k=>$z){
$z = preg_replace("### s","#",$z);
$tmp = preg_replace('#'.$z.'#s',"[_s".$k."_]",$tmp,1);
}
}
}
$key1 = preg_replace("#([#()[]*])#s","\\$1",$key);
if($this->url)
$tmp = preg_replace("#(?![_s|[_a|[_|[_t|[_ta|[_tag)".$key1."(?!agd+ _]|gd+_]|d+_]|sd+_]|_])#us",''.$key.' a>',$tmp,$this->all?-1:1);
else
$tmp = preg_replace("#(?![_s|[_a|[_|[_t|[_ta|[_tag )".$key1."(?!agd+_]|gd+_]|d+_]|sd+_]|_])#us",$url,$tmp,$this->all? -1:1);
if(!empty($a)){
foreach($a as $n=>$at){
$tmp = str_replace("[_a".$n."_]",$at,$tmp);
}
}
if(!empty($tags)){
foreach($tags as $n=>$at){
$tmp = str_replace("[_tag".$n."_]",$at,$tmp);
}
}
if(!empty($stopkeys)){
foreach($stopkeys as $n=>$at){
$tmp = str_replace("[_s".$n."_]",$at,$tmp);
}
}
return $tmp;
}
}