ホームページ  >  記事  >  バックエンド開発  >  file_get_contents を使用して Baidu 入札コンテンツを取得できないのはなぜですか?

file_get_contents を使用して Baidu 入札コンテンツを取得できないのはなぜですか?

WBOY
WBOYオリジナル
2016-06-23 13:40:071104ブラウズ

$url = 'http://www.baidu.com/s?wd=%E4%BF%9D%E5%81%A5%E5%93%81&rsv_spt=1&issp=1&f=8&rsv_bp=0&rsv_idx =2&ie=utf-8&tn=baiduhome_pg&rsv_enter=0&inputT=2625&rsv_pq=f8ac4a3700000dd9&rsv_t=54ffCzY5xNXYlNcEjuJTNfBzIrJob0iUn2whzhsN7JtTaA6R0Z7yxIGlNFSR5t0vyOID&rsv_s ug3=5&rsv_sug1=4&rsv_sug2=0&rsv_sug4=4274';
$info=file_get_contents($url);


; Baidu の入札ランキングの上位 3 サイトを取得し、file_get_contents を使用して Baidu の検索結果ページのコンテンツを出力します。しかし、なぜ入札コンテンツが表示されないのでしょうか。

これには入札ポジションがあることがわかりました

しかし、エクスポートすると入札内容がありません。理由を教えてください。






ディスカッションへの返信 (解決策)

<?php	$url = 'http://www.baidu.com/s?rsv_bp=0&rsv_spt=3&ie=utf-8&rsv_sug3=23&rsv_sug4=267&rsv_sug1=22&rsv_sug2=0&inputT=18&wd=%E4%BF%9D%E5%81%A5%E5%93%81&tn=89040009_1_pg';    $ch = curl_init();    curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36');    curl_setopt($ch, CURLOPT_URL, $url);    curl_setopt($ch, CURLOPT_HEADER, 0);    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);    $content = curl_exec($ch);    curl_close($ch);	echo $content;

大まかなチェックの後、Baidu はユーザーエージェントを検証しました。それが空の場合、入札部分はありません

ユーザーモジュール。 -agent?? は必須です。

header('Content-type: text/html;charset=utf-8');$url = 'http://www.baidu.com/s?wd=%E4%BF%9D%E5%81%A5%E5%93%81&rsv_spt=1&issp=1&f=8&rsv_bp=0&rsv_idx=2&ie=utf-8&tn=baiduhome_pg&rsv_enter=0&inputT=2625&rsv_pq=f8ac4a3700000dd9&rsv_t=54ffCzY5xNXYlNcEjuJTNfBzIrJob0iUn2whzhsN7JtTaA6R0Z7yxIGlNFSR5t0vyOID&rsv_sug3=5&rsv_sug1=4&rsv_sug2=0&rsv_sug4=4274';  $opts = array(   'http'=>array(     'user_agent' => $_SERVER['HTTP_USER_AGENT']  ) ); $context = stream_context_create($opts);$info=file_get_contents($url, false, $context);echo $info;

header('Content-type: text/html;charset=utf-8');$url = 'http://www.baidu.com/s?wd=%E4%BF%9D%E5%81%A5%E5%93%81&rsv_spt=1&issp=1&f=8&rsv_bp=0&rsv_idx=2&ie=utf-8&tn=baiduhome_pg&rsv_enter=0&inputT=2625&rsv_pq=f8ac4a3700000dd9&rsv_t=54ffCzY5xNXYlNcEjuJTNfBzIrJob0iUn2whzhsN7JtTaA6R0Z7yxIGlNFSR5t0vyOID&rsv_sug3=5&rsv_sug1=4&rsv_sug2=0&rsv_sug4=4274';  $opts = array(   'http'=>array(     'user_agent' => $_SERVER['HTTP_USER_AGENT']  ) ); $context = stream_context_create($opts);$info=file_get_contents($url, false, $context);echo $info;

入札ウェブサイトを何度更新しても同じ状態になるのはなぜですか?百度も同じ?
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。