$domain = "www.hzhuti.com"; /*クエリ対象のドメイン名*/
$site_url = 'http://www.baidu.com/s?wd=site%3A';
$all = $site_url.$domain /*ドメイン名に含まれるすべての URL*/
$today = $all.'&lm=1' /*今日含まれるドメイン名の URL*/
$utf_pattern = "/見つかった関連結果の数 (.*)/";
$gb2312_pattern = iconv("UTF-8","GB2312",$utf_pattern); /*Baidu は GB2312 をエンコードしているため*/
$kz_pattern = "/(.*)/" /*スナップショットの日付と一致するために使用される文字列*/
$times = "/d{4}-d{1,2}-d{1,2}/"; /*スナップショットの日付に一致する正規表現 (例: 2011-8-4*/ )
$s0 = @file_get_contents($all); /*site:www.hzhuti.com の Web ページを $s0 文字列に配置します*/
$s1 = @file_get_contents($today);
Preg_match($gb2312_pattern,$s0,$all_num); /*一致 "*見つかった関連結果の数"*/
Preg_match($gb2312_pattern,$s1,$today_num);
Preg_match($kz_pattern,$s0,$temp);
Preg_match($times,$temp[0],$screenshot);
If($all_num[1] == "")
$all_num[1] = 0;
If($today_num[1] == "")
$today_num[1] = 0;
If($screenshot[0] == "")
$screenshot[0] = "スナップショットはまだありません";
?>
テスト
Baidu には以下が含まれます:> ;
Baidu には今日含まれています: a>
Baidu スナップショットの日付: p>
|