Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimanakah Saya Boleh Mendapatkan Kandungan Halaman Secara Berkesan dengan cURL?

Bagaimanakah Saya Boleh Mendapatkan Kandungan Halaman Secara Berkesan dengan cURL?

DDD
DDDasal
2024-10-22 20:54:29417semak imbas

How Can I Retrieve Page Content Effectively with cURL?

Cara Mendapatkan Kandungan Halaman dengan cURL

Apabila cuba mengikis kandungan halaman menggunakan cURL, anda mungkin menghadapi masalah dengan ubah hala atau ralat "halaman dialihkan", terutamanya jika rentetan pertanyaan mengandungi aksara khas.

Untuk menyelesaikan isu ini, anda perlu memastikan bahawa rentetan pertanyaan yang dikodkan dikendalikan dengan betul. Berikut ialah coretan kod yang dipertingkatkan yang menangani masalah ini:

<code class="php">/**
 * Function to retrieve a web page using cURL.
 */
function get_web_page(string $url): array
{
    $user_agent = 'Mozilla/5.0 (Windows NT 6.1; rv:8.0) Gecko/20100101 Firefox/8.0';

    $options = [
        CURLOPT_CUSTOMREQUEST  => "GET",        // Set request type as GET
        CURLOPT_POST           => false,        // Set to GET
        CURLOPT_USERAGENT      => $user_agent, // Set user agent
        CURLOPT_COOKIEFILE     => "cookie.txt", // Set cookie file
        CURLOPT_COOKIEJAR      => "cookie.txt", // Set cookie jar
        CURLOPT_RETURNTRANSFER => true,     // Return web page
        CURLOPT_HEADER         => false,    // Don't return headers
        CURLOPT_FOLLOWLOCATION => true,     // Follow redirects
        CURLOPT_ENCODING       => "",       // Handle all encodings
        CURLOPT_AUTOREFERER    => true,     // Set referer on redirect
        CURLOPT_CONNECTTIMEOUT => 120,      // Timeout on connect
        CURLOPT_TIMEOUT        => 120,      // Timeout on response
        CURLOPT_MAXREDIRS      => 10,       // Stop after 10 redirects
    ];

    $ch = curl_init($url);
    curl_setopt_array($ch, $options);
    $content = curl_exec($ch);
    $err = curl_errno($ch);
    $errmsg = curl_error($ch);
    $header = curl_getinfo($ch);
    curl_close($ch);

    $header['errno'] = $err;
    $header['errmsg'] = $errmsg;
    $header['content'] = $content;
    return $header;
}

// Example of using the function to get a web page:
$result = get_web_page('https://www.example.com/page');

if ($result['errno'] != 0) {
    // Handle error: bad url, timeout, redirect loop
}

if ($result['http_code'] != 200) {
    // Handle error: no page, no permissions, no service
}

$page = $result['content'];</code>

Dengan memasukkan pilihan tambahan ini, seperti menetapkan jenis permintaan kepada GET, menyediakan ejen pengguna dan mengendalikan semua pengekodan, anda sepatutnya berjaya dapatkan semula kandungan halaman web yang diingini.

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mendapatkan Kandungan Halaman Secara Berkesan dengan cURL?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn