Google 検索からデータの一部を抽出するために、Google はソフトウェアによってキャプチャされたデータから非常に保護されていることがわかりました。以前は USER-AGENT を偽造することでデータをキャプチャできましたが、現在は機能しません。パケット キャプチャ データを使用すると、Google が Cookie を特定していることがわかりました。Cookie がない場合、302 ジャンプが直接返され、数十の 302 ジャンプが連続してデータがまったくキャプチャされません。
したがって、検索コマンドを送信するときは、まず Cookie を抽出して保存し、保存した Cookie を使用して再度検索コマンドを送信し、データを正常にキャプチャする必要があります。これは実際には、フォーラムの模擬ログインと同じです。まず POST してログインし、Cookie を取得して保存し、その後 Cookie を使用してアクセスする必要があります。
1. Cookie の保存パスを定義します
絶対パスを使用する必要があります
リーリー
2. Cookieを取得します
Cookie をファイルに保存します
リーリー
3. ブラウザをシミュレートして確認コードを取得します
このサーバー認証コードには抜け穴があるため、自分で指定できます
Cookieを取り出して一緒にサーバーに送信すると、サーバーはそれがログインページを開いているブラウザであると認識します
リーリー
4. 投稿を投稿します
リーリー
5.指定されたページにアクセスしてデータを取得します
リーリー
http://www.bkjia.com/PHPjc/444553.htmlwww.bkjia.comtruehttp://www.bkjia.com/PHPjc/444553.html技術記事 Google 検索からデータを抽出するために、以前は USER-AGENT を偽造するとデータを取得できましたが、現在は機能しません。ぜひご利用ください...