最近 Web サイトを整理する必要があり、Web サイト内のどのページが Baidu 検索エンジンによってインデックス付けされていないかを検出し、関連する調整を行う必要があります。いちいちsiteコマンドでやってもよく見えなかったので、PHPプログラムを使ってバッチ処理することを考えましたが、実際は非常に簡単であることがわかりました。ページが Baidu 共有機能に含まれているかどうかを検出します。
以下は具体的なコードです:
<?php /* * 检测网页是否被百度收录,返回1则表示收录 返回0表示没有收录 * @ param string $url 待检测的网址 */ function checkBaiduInclude($url){ $url='http://www.baidu.com/s?wd='.$url; $curl=curl_init(); curl_setopt($curl,CURLOPT_URL,$url); curl_setopt($curl,CURLOPT_RETURNTRANSFER,1); $rs=curl_exec($curl); curl_close($curl); if(!strpos($rs,'抱歉,没有找到')){ return 1; }else{ return 0; } }
意味は非常に簡単です。たとえば、http://www.Alixixi.com/javascript-function/833.html が含まれているかどうかを確認する必要がある場合、必要なのは次のとおりです。
checkBaiduInclude('http://www.Alixixi.com/javascript-function/833.html');
行って自分の目で見てください。