ホームページ >php教程 >php手册 >PHP プログラムを使用して Web サイトの検索エンジンを構築します

PHP プログラムを使用して Web サイトの検索エンジンを構築します

WBOY
WBOYオリジナル
2016-06-21 09:01:30873ブラウズ

一,设计搜索表单

在网站的根目录下建个search.htm,内容如下



搜索表单


















二,搜索程序

再在根目录下建个search.php 的文件,用来处理search.htm表单传过来的数据.内容如下

//获取搜索关键字
$keyword=trim($_POST[“keyword”]);
//检查是否为空
if($keyword==””){
echo”您要搜索的关键字不能为空”;
exit;//结束程序
}
?>

这样如果访问者输入的关键字为空时,可以做出提示。下面是遍历所有文件。

我们可以用递归的方法遍历所有的文件,可以用函数opendir,readdir,也可以用PHP Directory的类。我们现在用前者.

//遍历所有文件的函数
function listFiles($dir){
$handle=opendir($dir);
while(false!==($file=readdir($handle))){
if($file!="."&&$file!=".."){
//如果是目录就继续搜索
if(is_dir("$dir/$file")){
listFiles("$dir/$file");
}
else{
//在这里进行处理
}
}
}
}
?>

在红字的地方我们可以对搜索到的文件进行读取,处理.下面就是读取文件内容,并检查内容中是否含有关键字$keyword,如果含有就把文件地址赋给一个数组。

//$dir是搜索的目录,$keyword是搜索的关键字 ,$array是存放的数组
function listFiles($dir,$keyword,&$array){
$handle=opendir($dir);
while(false!==($file=readdir($handle))){
if($file!="."&&$file!=".."){
if(is_dir("$dir/$file")){
listFiles("$dir/$file",$keyword,$array);
}
else{
//读取文件内容
$data=fread(fopen("$dir/$file","r"),filesize("$dir/$file"));
//不搜索自身
if($file!=”search.php”){
//是否匹配
if(eregi("$keyword",$data)){
$array[]="$dir/$file";
}
}
}
}
}
}
//定义数组$array
$array=array();
//执行函数
listFiles(".","php",$array);
//打印搜索结果
foreach($array as $value){
echo "$value"."
";
}
?>

现在把这个结果和开头的一段程序结合起来,输入一个关键字,然后就会发现你的网站中的相关结果都被搜索出来了。我们现在在把它完善一下。

1,列出内容的标题

if(eregi("$keyword",$data)){
$array[]="$dir/$file";
}

改成

if(eregi("$keyword",$data)){
if(eregi("(.+)",$data,$m)){
$title=$m["1"];
}
else{
$title="没有标题";
}
$array[]="$dir/$file $title";
}

原理就是,如果在文件内容中找到xxx,那么就把xxx取出来作为标题,如果找不到那么就把标题命名未”没有标题”.

2,只搜索网页的内容的主题部分。

做网页时一定会有很多html代码在里面,而这些都不是我们想要搜索的,所以要去除它们。我现在用正则表达式和strip_tags的配合,并不能把所有的都去掉。

$data=fread(fopen("$dir/$file","r"),filesize("$dir/$file"));
//不搜索自身
if($file!=”search.php”){
//是否匹配
if(eregi("$keyword",$data)){

改为

$data=fread(fopen("$dir/$file","r"),filesize("$dir/$file"));
if(eregi("]+)>(.+)",$data,$b)){
$body=strip_tags($b["2"]);
}
else{
$body=strip_tags($data);
}
if($file!="search.php"){
if(eregi("$keyword",$body)){

3,标题上加链接

foreach($array as $value){
echo "$value"."
";
}

改成

foreach($array as $value){
//拆开
list($filedir,$title)=split(“[ ]”,$value,”2”);
//输出
echo "$value"."
";
}

4防止超时

如果文件比较多,那么防止PHP执行时间超时是必要的。可以在文件头加上

set_time_limit(“600”);

以秒为单位,所以上面是设10分钟为限。

所以完整的程序就是

set_time_limit("600");
//検索キーワードを取得
$keyword=trim($_POST["keyword"]); empty
if($keyword==""){
echo "検索したいキーワードを空にすることはできません";
exit;//プログラムを終了します
}
function listFiles( $dir,$keyword,&$array){
$handle=opendir($dir);
while(false!==($file=readdir($handle))){
if($ file!="."&&$file!=".."){
if(is_dir("$dir/$file")){
listFiles("$dir/$file",$keyword, $array);
}
else{
$data=fread(fopen("$dir/$file","r"),filesize("$dir/$file")); >if(eregi("]+)>(.+)",$data,$b)){
$body=strip_tags($b[" 2"]);
}
else{
$body=strip_tags($data);
}
if($file!="search.php"){
if (eregi("$keyword",$body)){
if(eregi("(.+)",$data,$m)){
$title= $m["1"];
}
else{
$title="タイトルなし";
$array[]="$dir/$file $title";
}
}
}
}
}
}
$array=array()
listFiles(".","$keyword",$array );
foreach($array as $value){
//Split
list($filedir,$title)=split("[ ]",$value,"2"); //出力
echo "$title "."
";
}
?> >これまでは独自の検索エンジンを構築してきましたが、コンテンツ処理部分を変更することで、タイトル検索やコンテンツ検索の機能を実現することもできます。ページネーションも考慮してください。これは内緒にしておいてください。

ここでは、eregi の代わりに preg_match を使用する方法を説明します。これにより、はるかに高速になります。分かりやすいように一般的に使われているエレギを使用します。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。