ホームページ  >  記事  >  バックエンド開発  >  特定のサイトのリンクを読み取るPHP関数_PHPチュートリアル

特定のサイトのリンクを読み取るPHP関数_PHPチュートリアル

WBOY
WBOYオリジナル
2016-07-20 10:59:24765ブラウズ

​ 原則: サイトのソース ファイルを読み取り、正規表現を使用してソース コードを分析し、すべてのリンクを取得します
/**********秋水烏編(2002-5-20)***********/
if(empty($url))$url = "http://www.csdn.net/expert/";//URLを設定します
$site=substr($url,0,strpos($url,"/",8));//サイト
$base=substr($url,0,strrpos($url,"/")+1);//ファイルがあるディレクトリ
$fp = fopen($url, "r" );//URLを開く
while(!feof($fp))$contents.=fread($fp,1024);//
$pattern="|href=['"]?([^ '"]+)['" ]|U";
preg_match_all($pattern,$contents, $regArr, PREG_SET_ORDER);//すべて一致 href=
for($i=0;$iif(!eregi("://",$regArr[$i][1]))//相対パスであるかどうか、つまり :/ /
if(substr($regArr[$i][1],0,1)=="/")//サイトのルートディレクトリですか
echo "リンク".($i+1).":".$site.$regArr[$i][1]."
";//ルートディレクトリ
それ以外
echo "リンク".($i+1).":".$base.$regArr[$i][1]."
";//現在のディレクトリ
それ以外
echo "リンク".($i+1).":".$regArr[$i][1]."
";//相対パス
}
fclose($fp);
?>
($regarr);$i++){>

www.bkjia.comtru​​ehttp://www.bkjia.com/PHPjc/445603.html技術記事原則: サイトのソース ファイルを読み取り、正規表現を使用してソース コードを分析し、すべてのリンクを取得します。 /**********秋水烏編(2002-5-20)*************/ if(empty($url))$url = http://www.csdn .ne.
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。