ユーザーエージェントとは
ユーザーエージェントは中国語でユーザーエージェント、または略してUAと呼ばれ、サーバーがオペレーティングシステムとバージョン、CPUの種類、ブラウザとバージョンを識別できるようにする特別な文字列ヘッダーです。顧客が使用するブラウジング サーバー レンダリング エンジン、ブラウザ言語、ブラウザ プラグインなど。
例えば、携帯電話からのアクセスとPCからのアクセスでは異なるページを表示するなど、異なるUAを判断して異なるWebサイトを表示することができます。
PHP が file_get_contents 関数を使用して Web サイトを収集すると、ブラウザーで表示できるものの、コンテンツが収集できない場合があります。
これは、デフォルトでは PHP の file_get_contents 関数が ua を送信しないため、User_agent に基づいて通常のブラウザー リクエストであるかどうかを判断する設定がサーバー上で行われたことが原因であると考えられます。
そのような Web サイトを収集したい場合は、PHP にブラウザをシミュレートさせて UA を送信させ、Web サイトを騙して通常のコンテンツを返させる必要があります。
実装は次のとおりです:
ini_set('user_agent','Mozilla/4.0 (互換性; MSIE 8.0; Windows NT 5.1; Trident/4.0; 4399Box.560; .NET4.0C; .NET4.0E)' );
これは IE8 環境をシミュレートする UA です。もちろん、別の環境に変更することもできます。たとえば、Firefox
は次のように読み取ることもできます:
http://www.bkjia.com/PHPjc/327875.html