PHP の cURL ライブラリを使用して、Web ページを簡単かつ効果的にクロールします。スクリプトを実行して、クロールした Web ページを分析するだけで、必要なデータをプログラムで取得できます
リンクから部分データを取得する場合でも、XML ファイルを取得してデータベースにインポートする場合でも、単に Web ページのコンテンツを取得する場合でも、cURL は強力な PHP ライブラリです。 PHPのCURL関数ライブラリ(クライアントURLライブラリ関数) curl_close — CURL セッションを閉じる curl_copy_handle — Curl 接続リソースのすべての内容とパラメータをコピーする curl_errno — 現在のセッションのエラー情報を含む数値を返します。 curl_error — 現在のセッションのエラー情報を含む文字列を返します。 curl_exec — Curl セッションを実行する curl_getinfo — CURL 接続リソース ハンドルに関する情報を取得する curl_init — Curl セッションを初期化する curl_multi_add_handle — 個々の CURL ハンドル リソースを CURL バッチ セッションに追加する curl_multi_close — バッチ ハンドル リソースを閉じる curl_multi_exec — Curl バッチ ハンドルを解析する curl_multi_getcontent — フェッチされた出力のテキスト ストリームを返す curl_multi_info_read — 現在解析されているcurlの関連する送信情報を取得します。 curl_multi_init — Curl バッチ ハンドル リソースを初期化する curl_multi_remove_handle — Curl バッチ ハンドル リソース内のハンドル リソースを削除する curl_multi_select — cURL 拡張子に関連付けられたすべてのソケットを取得し、「選択」できます。 curl_setopt_array —curl のセッションパラメータを配列として設定する curl_setopt —curl のセッションパラメータを設定する curl_version — CURL 関連のバージョン情報を取得する curl_init() 関数の関数は、curl セッションを初期化します。curl_init() 関数の唯一のパラメータは、URL アドレスを表します。 curl_exec() 関数は、curl セッションを実行するために使用されます。唯一のパラメータは、curl_init() 関数によって返されるハンドルです。 curl_close() 関数は、curl セッションを閉じるために使用されます。唯一のパラメータは、curl_init() 関数によって返されるハンドルです。 例 1: 基本的な例 基本的な例 コードは以下のように表示されます: 例 2: POST データ sendSMS.php。2 つのフォーム フィールドを受け入れることができます。1 つは電話番号、もう 1 つはテキスト メッセージの内容です。POSTデータ 代価以下: 例子三:代理サーバーを使用する 代理サーバーを使用する 代価以下: 例子四: 模拟登录 Curl 模倣登録は、プログラム、適合 DZ7.0、ユーザー名をユーザー名に変更し、ユーザーパスをユーザーのパスワードに変更することができます。 Curl 模拟登录 discuz 程序 复制代码次のように: /i', $contents, $matches); if(!empty($matches)) { $formhash = $matches[1]; } それ以外 { die('フォーラムハッシュが見つかりません。'); } //POSTデータ、获取COOKIE $cookie_file = ディレクトリ名(__FILE__) 。 '/cookie.txt'; //$cookie_file = tempnam('/tmp'); $ch =curl_init($login_url); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_POST, 1); curl_setopt($ch, CURLOPT_POSTFIELDS, $post_fields); curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file); カール_exec($ch); カール_クローズ($ch); // 上で取得した Cookie を取得するには、登録後に閲覧できないコンテンツを取得する必要があります $ch =curl_init($get_url); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 0); curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file); $contents =curl_exec($ch); カール_クローズ($ch); var_dump($contents);