ホームページ  >  記事  >  php教程  >  特定のサイトのリンクを読み取るPHP関数

特定のサイトのリンクを読み取るPHP関数

WBOY
WBOYオリジナル
2016-06-21 09:09:48802ブラウズ

機能|リンク|サイト

原則: サイトのソース ファイルを読み取り、正規表現を使用してソース コードを分析し、すべてのリンクを取得します
/**********秋水編(2002-5-20)***********/
if(empty($url))$url = "http://www.csdn.net/expert/";//url を設定
$site=substr($url,0,strpos($url,"/",8));//サイト
$base= substr($url ,0,strrpos($url,"/")+1);//ファイルがあるディレクトリ

$fp = fopen($url, "r" );//URLを開きます
while(!feof($fp)) $contents.=fread($fp,1024);//

$pattern="|href=['"]?([^ '"]+)['" ]| U";
preg_match_all($pattern, $contents, $regArr, PREG_SET_ORDER);//すべて一致 href=
for($i=0;$iif(!eregi(":/ /",$regArr[$i][1]))//相対パスかどうか、つまり://
があるかどうか if(substr($regArr[$ i][1],0,1)==" /")//サイトのルート ディレクトリですか? echo "link".($i+1).":".$site.$regArr[$ i][1]."
"; //ルートディレクトリ
else
echo "link".($i+1).":".$base.$regArr[$i][1] ."
";//現在のディレクトリ
else
echo "link".($i+1).":".$regArr[$i][1]."
";//相対パス
}
fclose($fp);
?>



声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。