リモート Web サイトのデータをクロールするための PHP コード
さて、多くのプログラム愛好家が同じ疑問に遭遇するかもしれません。それは、検索エンジンのように他の人の Web サイトの HTML コードをクロールし、データを収集して整理する方法です。コードを入力してください。 今日は簡単な例をいくつか紹介します。
Ⅰ. リモート Web ページのタイトルを取得する例:
以下は、リモートの HTML コードを取得する例です。 webpage:
<?php /* +------------------------------------------------------------- +抓取网页标题的代码,直接拷贝本代码片段,另存为.php文件执行即可. +------------------------------------------------------------- */ error_reporting (7); $file = fopen ("http://www.php.cn/", "r"); if (!$file) { echo "<font color=red>Unable to open remote file.</font>\n"; exit; } while (!feof ($file)) { $line = fgets ($file, 1024); if (eregi ("<title>(.*)</title>", $line, $out)) { $title = $out[1]; echo "".$title.""; break; } } fclose($file); //End ?>
fopen( ) file で指定された名前リソースをストリームにバインドします。
filesize
ファイルサイズのバイト数を返し、エラーが発生した場合は FALSE を返します。 PHP の整数型 は署名されており、ほとんどのプラットフォームでは 32 ビット整数を使用すると、2GB から 4GB を超えるファイルに遭遇した場合、filesize() 関数は予期しない結果を返す可能性があります。 file)) は通常、ファイル ポインター ハンドルから最大 length バイトを読み取ります。または、EOF に達したとき、または (ネットワーク ストリームの場合) パケットを読み取ります。最初にどの状況が発生したかに応じて、
ファイルの読み取りを停止します。注: PHP5 では、
file_get_contents を使用することをお勧めします。 string
string file_get_contents ( string filename [, int use_include_path [, resource context]]) file_get_contents() がファイルを文字列として返すことを除いて、 file() と同じ
以上がPHP がリモート コード インスタンスを読み取るまたは取得する方法の詳細な説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。