ホームページ  >  記事  >  バックエンド開発  >  PHP がリモート コード インスタンスを読み取るまたは取得する方法の詳細な説明

PHP がリモート コード インスタンスを読み取るまたは取得する方法の詳細な説明

伊谢尔伦
伊谢尔伦オリジナル
2017-07-17 10:23:002221ブラウズ

リモート Web サイトのデータをクロールするための PHP コード

さて、多くのプログラム愛好家が同じ疑問に遭遇するかもしれません。それは、検索エンジンのように他の人の Web サイトの HTML コードをクロールし、データを収集して整理する方法です。コードを入力してください。 今日は簡単な例をいくつか紹介します。
Ⅰ. リモート Web ページのタイトルを取得する例:
以下は、リモートの HTML コードを取得する例です。 webpage:

以下はコード スニペットです:

<?php
/*
+-------------------------------------------------------------
+抓取网页标题的代码,直接拷贝本代码片段,另存为.php文件执行即可.
+-------------------------------------------------------------
*/
error_reporting
(7);
$file = fopen ("http://www.php.cn/", "r");
if (!$file) {
echo "<font color=red>Unable to open remote file.</font>\n";
exit;
}
while (!feof ($file)) {
$line = fgets ($file, 1024);
if (eregi ("<title>(.*)</title>", $line, $out)) {
$title = $out[1];
echo "".$title."";
break;
}
}
fclose($file);
//End
?>

上記の 2 つのコード スニペットを直接コピーし、再度実行して効果を確認します。上記の例は、Web ページ データをより適切なものにするための単なるプロトタイプです。


fopen( ) file で指定された名前リソースをストリームにバインドします。

filesize
ファイルサイズのバイト数を返し、エラーが発生した場合は FALSE を返します。 PHP の整数型 は署名されており、ほとんどのプラットフォームでは 32 ビット整数を使用すると、2GB から 4GB を超えるファイルに遭遇した場合、filesize() 関数は予期しない結果を返す可能性があります。 file)) は通常、ファイル ポインター ハンドルから最大 length バイトを読み取ります。または、EOF に達したとき、または (ネットワーク ストリームの場合) パケットを読み取ります。最初にどの状況が発生したかに応じて、
ファイルの読み取りを停止します。注: PHP5 では、
file_get_contents を使用することをお勧めします。 string
string file_get_contents ( string filename [, int use_include_path [, resource context]]) file_get_contents() がファイルを文字列として返すことを除いて、 file() と同じ

file_get_contents() 関数は、コンテンツを読み取るために使用されます。ファイルを文字列に変換する方法。オペレーティング システムでサポートされている場合は、パフォーマンスを向上させるためにメモリ マッピング テクノロジも使用されます。

以上がPHP がリモート コード インスタンスを読み取るまたは取得する方法の詳細な説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。