この記事でわかるのは、PHP で Web コンテンツを取得する方法は何なのかということです。 Webページのコンテンツを取得するphpのコード例は参考になると思いますので、困っている方は参考にしていただければ幸いです。
php を使用して Web ページのソース コードを取得し、Web コンテンツをクロールする 3 つの方法は、実際のニーズに応じて選択できます。
1. file_get_contents を使用して Web ページのソース コードを取得します
この方法は最も一般的に使用され、必要なコードは 2 行だけで、非常にシンプルで便利です。
参考コード:
<?php $fh= file_get_contents('http://www.webkaka.com/'); echo $fh; ?>
2. fopenを使ってWebページのソースコードを取得する
この方法を使っている人は多いですが、たくさんのコード。
参照コード:
<?php $fh = fopen('http://www.webkaka.com/', 'r'); if($fh){ while(!feof($fh)) { echo fgets($fh); } } ?>
3.curl を使用して Web ページのソース コードを取得する
curl を使用して Web ページのソース コードを取得する実践Web ページは、より高い要件を持つ人々によって必要とされることがよくあります。たとえば、Web コンテンツのクロール中に Web ページのヘッダー情報を取得する必要がある場合や、ENCODING エンコードの使用、USERAGENT の使用などを使用します。
参照コード 1:
<?php // 创建一个新cURL资源 $ch = curl_init(); // 设置URL和相应的选项 curl_setopt($ch, CURLOPT_URL, "http://www.webkaka.com/"); curl_setopt($ch, CURLOPT_HEADER, false); // 抓取URL并把它传递给浏览器 $data = curl_exec($ch); echo $data; //关闭cURL资源,并且释放系统资源 curl_close($ch); ?>
参照コード 2:
<?php $szUrl = "http://www.webkaka.com/"; $UserAgent = 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; .NET CLR 3.0.04506; .NET CLR 3.5.21022; .NET CLR 1.0.3705; .NET CLR 1.1.4322)'; $curl = curl_init(); curl_setopt($curl, CURLOPT_URL, $szUrl); curl_setopt($curl, CURLOPT_HEADER, 0); //0表示不输出Header,1表示输出 curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false); curl_setopt($curl, CURLOPT_ENCODING, ''); curl_setopt($curl, CURLOPT_USERAGENT, $UserAgent); curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1); $data = curl_exec($curl); echo $data; //echo curl_errno($curl); //返回0时表示程序执行成功 exit(); ?>
以上がPHPでWebコンテンツを取得するにはどのような方法がありますか? Web ページのコンテンツを取得するための PHP のコード例の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。