検索
ホームページバックエンド開発PHPの問題phpでWebコンテンツを取得するときに注意すべきことは何ですか?

phpでWebコンテンツを取得するときに注意すべきことは何ですか?

PHP で Web ページのコンテンツを取得する場合の注意事項

1. ネットワーク エラーが発生する可能性があり、あらゆるエラーが発生する可能性があります。たとえば、マシンがダウンしている、ネットワーク ケーブルが壊れている、ドメイン名が間違っている、ネットワークがタイムアウトする、ページが消える、Web サイトがジャンプする、サービスが禁止されている、ホストの負荷が十分でないなどです...

2. サーバーに制限が追加されました。一般的なブラウザのみにアクセスを許可します。

3. サーバーにホットリンク防止制限が追加されました。

4. 一部の Web サイトでは、ホットリンク防止の制限が追加されました。 HTTP リクエストの Accept-Encoding ヘッダー、またはヘッダーの有無。その部分の具体的なコンテンツは何ですか? とにかく、gzip 圧縮されたコンテンツを常に送信します

#5。URL リンクはあらゆる種類の奇妙なものには、漢字が含まれているものや、キャリッジ リターンやライン フィードが含まれているものもあります。

6. 一部の Web サイトには HTTP ヘッダーに Content-Type があり、Web ページにはいくつかの Content-Type があります。さらにとんでもないことは、それぞれの Content-Type が異なることです。最もとんでもないことは、これらの Content-Type がテキスト内で使用できないことです。Content-Type により文字化けが発生します。

7. ネットワーク リンクは次のとおりです。非常に遅いです。数千ページの分析にかかる時間を掛け合わせると、おいしい食事をとることをお勧めします

Get PHP Web page content メソッド

Method 1. file_get_contents メソッドを使用して、

$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml";
    $html = file_get_contents($url);
    //如果出现中文乱码使用下面代码
    //$getcontent = iconv("gb2312", "utf-8",$html);
    echo "<textarea style=&#39;width:800px;height:600px;&#39;>".$html."</textarea>";

#メソッドを実装します。 2.curl を使用して、

$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml";
    
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
$html = curl_exec($ch);
curl_close($ch);

echo "<textarea style=&#39;width:800px;height:600px;&#39;>".$html."</textarea>";
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);

を実装します。このコードを追加すると、リクエストがリダイレクトされると、最終リクエスト ページにアクセスできます。それ以外の場合、リクエスト結果には次の内容が表示されます:

<head><title>Object moved</title></head>
<body><h1 id="Object-nbsp-Moved">Object Moved</h1>This object may be found <a href="some link." rel="external nofoll
推奨チュートリアル:

PHP ビデオ チュートリアル

以上がphpでWebコンテンツを取得するときに注意すべきことは何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい