ホームページ >バックエンド開発 >PHPチュートリアル >PHP_PHP チュートリアルでファイルの内容を読み取るいくつかの方法の詳細な説明

PHP_PHP チュートリアルでファイルの内容を読み取るいくつかの方法の詳細な説明

WBOY
WBOYオリジナル
2016-07-21 15:02:29989ブラウズ

サンプルコード 1: file_get_contents を使用して、取得モードでコンテンツを取得します

コードをコピーします コードは次のとおりです:

$url='http://www.baidu.com /';
$html =file_get_contents($url);
//print_r($http_response_header);
ec($html);
printhr();
printarr($http_response_header);
printhr();
?>

サンプルコード 2 : fopen を使用して URL を開き、取得モードでコンテンツを取得します
コードをコピーします コードは次のとおりです:

$fp=fopen($url, 'r');
printarr(stream_get_meta_data($fp) );
printhr();
while(!feof($fp)){
$result.=fgets($fp,1024);
}
echo "url body:$result";
printhr();
fclose ($fp);
?>

サンプルコード 3: file_get_contents 関数を使用して投稿モードで URL を取得します
コードをコピーしますコードは次のとおりです:

$data=array(' foo'=>'bar');
$data=http_build_query($data);
$opts=array(
'http'= >array(
'method'=>'POST',
'header' =>"Content-type: application/x-www-form-urlencodedrn".
"Content-Length: ".strlen($data )."rn",
'content'=>$data
),
);
$context=stream_context_create($opts);
$html=file_get_contents('http://localhost/e/admin/test. html',false,$context);
echo$html;
?>

サンプルコード 4: fsockopen 関数を使用して URL を開き、ヘッダーと本文を含む完全なデータを取得モードで取得します
コードをコピーします コードは次のとおりです:

functionget_url($url,$cookie= false){
$url=parse_url($url);
$query=$url[path]。" ?".$url[クエリ];
ec("クエリ:".$クエリ);
$fp=fsockopen ($url[ホスト],$url[ポート]?$url[ポート]:80,$errno, $errstr,30);
if(!$fp){
returnfalse;
}else{
$request=" GET$queryHTTP/1.1rn";
$request.="ホスト:$url[ホスト]rn";
$request.="接続: 閉じる";
if($cookie)$request.="Cookie:$cookien ";
$request.="rn";
fwrite($fp,$request);
while( !@feof($fp)){
$result.=@fgets($fp,1024);
}
fclose($fp);
return$result;
}
}
// URL、ヘッダーを削除します
functionGetUrlHTML($url,$cookie=false){
$rowdata=get_url($url,$cookie) ;
if($rowdata)
{
$body=stristr($rowdata,"rnrn") );
$body=substr($body,4,strlen($body));
return$body;
}
returnfalse ;
}
?>

サンプルコード 5: fsockopen 関数を使用して、 URL を取得し、POST モードでヘッダーと本文を含む完全なデータを取得します
コードをコピーします コードは次のとおりです:

functionHTTP_Post($URL,$data,$cookie,$referrer= ""){
// 指定された URL を解析します
$URL_Info=parse_url($URL);
// リファラーを構築します
if($referrer=="") // 指定されていない場合は、このスクリプトをリファラーとして使用します
$referrer。 ="111";
// $data から文字列を作成します
foreach($dataas$key=>$value)
$values[]="$key= ".urlencode($value);
$data_string=implode( "&",$values);
// 必要なポートを調べます - 指定されていない場合は、standard (=80) を使用します
if(!isset($URL_Info[ "port"]))
$URL_Info["port"] =80;
// POST-request:
$request.="POST ".$URL_Info["path"]." HTTP/1.1n";
$request.="ホスト: ".$URL_Info["host] を構築しています"]."n";
$request.="リファラー:$referern";
$request.="コンテンツ タイプ: application/x-www-form -urlencodedn";
$request.="コンテンツの長さ: ".strlen($data_string)."n";
$request.="接続: 閉じる";
$request.="Cookie:$cookien";
$request.="n";
$request.=$ data_string."n";
$fp=fsockopen($URL_Info["host"],$URL_Info["port"]);
fputs($fp,$ request);
while(!feof($fp)){
$result.=fgets($fp,1024);
}
fclose($fp);
return$result;
}
printhr();
? >

サンプルコード 6:curl ライブラリを使用します。 curl ライブラリを使用する前に、php.ini をチェックして、curl 拡張機能がオンになっているかどうかを確認する必要がある場合があります
コードをコピーします コードは次のとおりです:

< ();
$timeout = 5;
curl_setopt ($ch, CURLOPT_URL, 'http://www.baidu.com/');
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$file_contents =curl_exec($ch);
curl_close($ch);
echo $file_contents;
?>


curl ライブラリについて:
curl 公式 Web サイト http://curl.haxx.se/
curl は、FTP、FTPS、HTTP HTPPS SCP SFTP TFTP TELNET DICT FILE および LDAP をサポートする、URL 構文を使用したファイル転送ツールです。 curl は、SSL 証明書、HTTP POST、HTTP PUT、FTP アップロード、Kerberos、HTTP ベースのアップロード、プロキシ、Cookie、ユーザー + パスワードの証明、ファイル転送の回復、http プロキシ チャネル、その他多くの便利なトリックをサポートしています
コードをコピー コードは次のとおりです:

functionprintarr(array$arr)
{
echo"
行フィールド数: ".count($arr)."
";
foreach($ arras$key=>$value)
{
echo"$key=$value
";
}
}
?>

=========== ===== ========================================
クロール用の PHP コードリモート Web サイトのデータ
多くのプログラミング愛好家が同じ疑問に遭遇するかもしれません。それは、他の人の Web サイトの HTML コードを検索エンジンのようにクロールし、そのコードを収集して自分にとって有用なデータにまとめる方法です。今日は簡単な例をいくつか紹介します。
Ⅰ. リモート Web ページのタイトルを取得する例:
以下はコード スニペットです:
コードをコピーします コードは次のとおりです:

< ?php
/*
+---------- ----------------------------------- --------------- ---
+Web ページのタイトルのコードをキャッチし、このコード スニペットを直接コピーし、.php ファイルとして保存して実行します。
+--- ------------------ -------------------------------- --------
*/
error_reporting(7);
$file = fopen ("http://www.dnsing.com/", "r");
if (!$file) {
echo "リモート ファイルを開けません。n";
exit;
}
while (!feof ($file)) {
$line = fgets ($file, 1024) ;
if (eregi ("(.*)</ title>", $line, $out)) {<br>$title = $out[1];<br>echo "".$title."" ;<br>break;<br>}<br>}<br>fclose($file);<br>// 終了? ----------------<br>+DNSing Spider<br>+-------- --------</div>*/<br>$fp = fsockopen("www.dnsing.com", 80, $errno, $errstr, 30);<br>if (!$fp) {<br>echo "$errstr ( $errno)<br/>n";<div class="codetitle">} else {<span style="CURSOR: pointer" onclick="doCopy('code87589')">$out = "GET / HTTP/1.1rn";<u>$out .= "ホスト:www.dnsing.comrn";</u>$out .= "接続: 閉じる rnrn";</span>fputs($fp, $out);</div>while (!feof( $fp)) {<div class="codebody" id="code87589">echo fgets($fp, 128);<br>}<br>fclose($fp);<br>}<br>/ /End<br>?><br><br><br>上記の 2 つのコード スニペットを直接コピーし、再度実行して効果を確認します。上記の例は、Web ページ データを取得するプロトタイプにすぎません。したがって、すべてのプログラム愛好家は慎重に検討する必要があります <br>======== ========================さらに意味のある関数は、get_content_by_socket()、get_url()、get_content_url()、get_content_object です。 <br><br><br><br>コードをコピーします<br><br> コードは次のとおりです:<br><div class="codebody" id="code86925"> <br><?php<BR>//すべてのコンテンツurlを文書に保存<BR>function get_index($save_file, $prefix="index_"){<BR>$count = 68;<BR>$i = 1;<BR>if (file_exists($save_file) )) @unlink($save_file);<BR>$fp = fopen($save_file, "a+") または die("Open ". $save_file ." 失敗しました");<BR>while($i<$count){<BR>$url = $prefix . $i .".htm";<BR>echo "Get "。 $url ."...";<BR>$url_str = get_content_url(get_url($url));<BR>echo " OKn";<BR>fwrite($fp, $url_str);<BR>++$i;<BR>}<BR>fclose($ fp);<BR>}<BR>//获取目标多メディア对象<BR>function get_object($url_file, $save_file, $split="|--:**:--|"){<BR>if (!file_exists($url_file)) die ($url_file ." 存在しません");<BR>$file_arr = file($url_file);<BR>if (!is_array($file_arr) || empty($file_arr)) die($url_file ." コンテンツがありません");<BR>$ url_arr = array_unique($file_arr);<BR>if (file_exists($save_file)) @unlink($save_file);<BR>$fp = fopen($save_file, "a+") または die("保存ファイルを開く ". $save_file ."失敗しました");<BR>foreach($url_arr as $url){<BR>if (empty($url)) continue;<BR>echo "Get ". $url ."...";<BR>$html_str = get_url($url);<BR>echo $html_str;<BR>echo $url;<BR>exit;<BR>$obj_str = get_content_object($html_str);<BR>echo " OKn";<BR>fwrite ($fp, $obj_str);<BR>}<BR>fclose($fp);<BR>}<BR>//遍历目录获取文件内容<BR>function get_dir($save_file, $dir){<BR>$dp = opendir($dir);<BR>if (file_exists($save_file)) @unlink($save_file);<BR>$fp = fopen($save_file, "a+") または die("保存ファイルを開く ". $save_file ." 失敗しました");<BR>while(($file = readdir($dp)) != false){<BR>if ($file!="." && $file!=".."){<BR> echo "ファイルの読み取り ". $file ."...";<BR> $file_content = file_get_contents($dir . $file);<BR> $obj_str = get_content_object($file_content);<BR> echo " OKn";<BR> fwrite($fp, $obj_str);<BR>} <BR>}<BR>fclose($fp);<BR>}<BR>//获取指定urlコンテンツ<BR>function get_url($url){<BR>$reg = '/^http://[^/].+$/';<BR>if ( !preg_match($reg, $url)) die($url ." 無効です");<BR>$fp = fopen($url, "r") または die("URL を開く: ". $url ." 失敗しました。") ;<BR>while($fc = fread($fp, 8192)){<BR>$content .= $fc;<BR>}<BR>fclose($fp);<BR>if (empty($content)){<BR>die("URL を取得: ". $url ." コンテンツが失敗しました。");<BR>}<BR>return $content;<BR>}<BR>//ソケット获取指定ネット页<BR>function get_content_by_socket($url, $host){<BR>$fp = fsockopen($host, 80 ) または die("Open ". $url ." failed");<BR>$header = "GET /".$url ." HTTP/1.1rn";<BR>$header .= "Accept: */*rn";<BR> $header .= "Accept-Language: zh-cnrn";<BR>$header .= "Accept-Encoding: gzip、deflatern";<BR>$header .= "User-Agent: Mozilla/4.0 (互換性、MSIE 6.0、Windows NT) 5.1; SV1; InfoPath.1; .NET CLR 2.0.50727)rn";<BR>$header .= "ホスト: $host ."rn";<BR>$header .= "接続: Keep-Alivern";<BR>//$header .= "Cookie: cnzz02=2; rtime=1; ltime=1148456424859; cnzz_eid=56601755-rnrn";<BR> $header .= "接続: Closernrn";<BR>fwrite($fp, $header);<BR>while (!feof($fp)) {<BR>$contents .= fgets($fp, 8192);<BR>}<BR>fclose($ fp);<BR>return $contents;<BR>}<BR>//获取指定コンテンツ里のurl<BR>function get_content_url($host_url, $file_contents){<BR>//$reg = '/^(#|javascript.*?|ftp:/ /.+|http://.+|.*?href.*?|play.*?|index.*?|.*?asp)+$/i';<BR>//$reg = '/^( down.*?.html|d+_d+.htm.*?)$/i';<BR>$rex = "/([hH][rR][eE][Ff])s*=s*['"] *([^>'"s]+)["'>]*s*/i";<BR>$reg = '/^(down.*?.html)$/i';<BR>preg_match_all ($rex , $file_contents, $r);<BR>$result = ""; //array();<BR>foreach($r as $c){<BR>if (is_array($c)){<BR> foreach($c as $d) {<BR>if (preg_match($reg, $d)){ $result .= $host_url . $d."n" }<BR> }<BR>}<BR>}<BR>return $result;<BR>}🎷//获取指定内容マルチメディア文件<BR>function get_content_object($str, $split="|--:**:--|"){ <BR>$regx = "/hrefs*=s*['"]*([^>'"s ]+)["'>]*s*(<b>.*?</b>)/i";<br>preg_match_all($regx, $str, $result);<br>if (count($result) ) == 3){<br>$result[2] = str_replace("<b>マルチメディア: ", "", $result[2]);<br>$result[2] = str_replace("</b>" , "", $result[2]);<br>$result = $result[1][0] 。 $split .$result[2][0] 。 "n";<br>}<br>return $result;<br>}<br>?><br><br><br>================================================ === =====<br>同じドメイン名が複数の IP に対応する場合、リモート Web ページのコンテンツを取得する PHP の関数<br>fgc は単にそれを読み取り、すべての操作をカプセル化します<br>fopen もいくつかのカプセル化を実行しますが、これには次の操作が必要ですループで読み取ります すべてのデータ。 <br>fsockopen これは直線のソケット操作です。 <br>HTMLページを読むだけならfgcの方が良いです。 <br>会社がファイアウォールを介してインターネットにアクセスする場合、一般的な file_get_content 関数は機能しません。もちろん、いくつかのソケット操作を通じて http リクエストをプロキシに直接書き込むこともできますが、それはより面倒です。 <br>ファイルが小さいことが確認できたら、上記の 2 つのメソッド fopen,join('',file($file)); のいずれかを選択できます。たとえば、1k 未満のファイルのみを操作する場合は、file_get_contents を使用するのが最適です。 <br> ファイルが大きいことが確実な場合、またはファイルのサイズを判断できない場合は、ファイル ストリーミングを使用するのが最善です。 1K ファイルを開くことと 1G ファイルを開くことの間に明らかな違いはありません。コンテンツが長ければ長いほど、スクリプトを読み終えるのではなく、読むのに時間がかかります。 <br>------------------------------------------------- ---<br>http://www.phpcake.cn/archives/tag/fsockopen<br>PHP には、file_get_contents や fopen などの独自の関数を使用するなど、リモート Web コンテンツを取得するさまざまな方法があります。 <br><div class="codetitle"> <span style="CURSOR: pointer" onclick="doCopy('code62358')"><u>コードをコピーします</u></span> コードは次のとおりです:</div> <div class="codebody" id="code62358"> <br><?php <BR>echo file_get_contents("http://blog.s135.com/abc.php");<BR>?><br> </div> <br>ただし、DNS ではポーリングなどの負荷分散において、同じドメイン名が複数のサーバーや複数の IP に対応する場合があります。 blog.s135.com が DNS によって 3 つの IP アドレス 72.249.146.213、72.249.146.214、および 72.249.146.215 に解決されるとします。ユーザーが blog.s135.com にアクセスするたびに、システムは次のいずれかのサーバーにアクセスします。負荷分散アルゴリズム。 <br>先週ビデオプロジェクトに取り組んでいたとき、このような要件に遭遇しました。このサーバーの送信ステータスをクエリするために、各サーバー上の PHP インターフェイスプログラム (abc.php と仮定します) にアクセスする必要がありました。 <br>現時点では、特定のサーバーに繰り返しアクセスし続ける可能性があるため、file_get_contents を使用して http://blog.s135.com/abc.php に直接アクセスすることはできません。 <br>これら 3 つのサーバーで http://72.249.146.213/abc.php、http://72.249.146.214/abc.php、http://72.249.146.215/abc.php に順番にアクセスすることによってもこれは不可能ですWebサーバーに複数の仮想ホストが搭載されている場合。 <br>ホストは同じドメイン名に対応する複数のIPを設定できないため、ローカルホストを設定しても機能しません。 <br>その場合、これは PHP および HTTP プロトコルを通じてのみ実現できます。abc.php にアクセスするときは、blog.s135.com ドメイン名をヘッダーに追加します。そこで、次の PHP 関数を作成しました: <br><div class="codetitle"> <span style="CURSOR: pointer" onclick="doCopy('code36059')"><u>コードをコピーします</u></span> コードは次のとおりです:</div> <div class="codebody" id="code36059"> <br><?php<br> /***************************<br> * 機能目的: 同一ドメイン名が複数のIPに対応する場合、指定したサーバーのリモートWebコンテンツを取得します<br> *パラメータの説明: <br> * $ IP サーバーの IP アドレス<br> * $host サーバーのホスト名<br> * $url サーバーの URL アドレス (ドメイン名を除く)<br> * 戻り値: <br> * リモートのコンテンツWeb ページを取得しました<br> * false リモート Web ページにアクセスできませんでした<br>*** **********************/<br> function HttpVisit($ip, $host, $url) <br> { <br>$errstr = ''; <br>$fp = fsockopen ($ip, 80, $errno, $errstr, 90) <br>if (!$fp); false; <br> } <br>else<br>{ <br>$out = "GET {$url} HTTP/1.1rn"; <br>$out .= "ホスト:{$host}rn"; <br>fputs ( $fp, $out);<br> <br>while($line = fread($fp, 4096)){ <br>$response .= $line <br>} fclose( $fp );<p> <br>//ヘッダー情報を削除します<br>$pos = strpos($response, "rnrn"); <br>$response = substr($response, $pos + 4);</p> <p> $response を返す <br>} <br>}</p> <p> //呼び出しメソッド: <br> $server_info1 = HttpVisit("72.249.146.213", "blog.s135.com", "/abc.php"); <br> $server_info2 = HttpVisit("72.249.146.214", "blog.s135") " .com", "/abc.php"); </p> $server_info3 = HttpVisit("72.249.146.215", "/abc.php"); <p><br><br> <br> <br><br></p> </div>http://www.bkjia.com/PHPjc/327908.htmlwww.bkjia.com<p align="left"></p> <div style="display:none;">tru​​e<span id="url" itemprop="url"></span>http://www.bkjia.com/PHPjc/327908.html<span id="indexUrl" itemprop="indexUrl"></span>技術記事<span id="isOriginal" itemprop="isOriginal"></span>サンプル コード 1: file_get_contents を使用して、取得モードでコンテンツを取得します。 ?php $url='http://www.baidu.com/' $html=file_get_contents($url); ($http_response_h. ..<span id="isBasedOnUrl" itemprop="isBasedOnUrl"></span><span id="genre" itemprop="genre"></span> <span id="description" itemprop="description"></span> </div> </div> </div> </div></div><div class="nphpQianMsg"><div class="clear"></div></div><div class="nphpQianSheng"><span>声明:</span><div>この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。</div></div></div><div class="nphpSytBox"><span>前の記事:<a class="dBlack" title="PHP_PHP チュートリアルでの空の is_null と isset のテストの解析" href="https://m.php.cn/ja/faq/307292.html">PHP_PHP チュートリアルでの空の is_null と isset のテストの解析</a></span><span>次の記事:<a class="dBlack" title="PHP_PHP チュートリアルでの空の is_null と isset のテストの解析" href="https://m.php.cn/ja/faq/307294.html">PHP_PHP チュートリアルでの空の is_null と isset のテストの解析</a></span></div><div class="nphpSytBox2"><div class="nphpZbktTitle"><h2>関連記事</h2><em><a href="https://m.php.cn/ja/article.html" class="bBlack"><i>続きを見る</i><b></b></a></em><div class="clear"></div></div><ins class="adsbygoogle" style="display:block" data-ad-format="fluid" data-ad-layout-key="-6t+ed+2i-1n-4w" data-ad-client="ca-pub-5902227090019525" data-ad-slot="8966999616"></ins><script> (adsbygoogle = window.adsbygoogle || []).push({}); </script><ul class="nphpXgwzList"><li><b></b><a href="https://m.php.cn/ja/faq/1.html" title="cURL を使用して PHP で Get リクエストと Post リクエストを実装する方法" class="aBlack">cURL を使用して PHP で Get リクエストと Post リクエストを実装する方法</a><div class="clear"></div></li><li><b></b><a href="https://m.php.cn/ja/faq/1.html" title="cURL を使用して PHP で Get リクエストと Post リクエストを実装する方法" class="aBlack">cURL を使用して PHP で Get リクエストと Post リクエストを実装する方法</a><div class="clear"></div></li><li><b></b><a href="https://m.php.cn/ja/faq/1.html" title="cURL を使用して PHP で Get リクエストと Post リクエストを実装する方法" class="aBlack">cURL を使用して PHP で Get リクエストと Post リクエストを実装する方法</a><div class="clear"></div></li><li><b></b><a href="https://m.php.cn/ja/faq/1.html" title="cURL を使用して PHP で Get リクエストと Post リクエストを実装する方法" class="aBlack">cURL を使用して PHP で Get リクエストと Post リクエストを実装する方法</a><div class="clear"></div></li><li><b></b><a href="https://m.php.cn/ja/faq/2.html" title="正規表現内のすべての式記号 (概要)" class="aBlack">正規表現内のすべての式記号 (概要)</a><div class="clear"></div></li></ul></div></div><ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-5902227090019525" data-ad-slot="5027754603"></ins><script> (adsbygoogle = window.adsbygoogle || []).push({}); </script><footer><div class="footer"><div class="footertop"><img src="/static/imghwm/logo.png" alt=""><p>福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!</p></div><div class="footermid"><a href="https://m.php.cn/ja/about/us.html">私たちについて</a><a href="https://m.php.cn/ja/about/disclaimer.html">免責事項</a><a href="https://m.php.cn/ja/update/article_0_1.html">Sitemap</a></div><div class="footerbottom"><p> © php.cn All rights reserved </p></div></div></footer><script>isLogin = 0;</script><script type="text/javascript" src="/static/layui/layui.js"></script><script type="text/javascript" src="/static/js/global.js?4.9.47"></script></div><script src="https://vdse.bdstatic.com//search-video.v1.min.js"></script><link rel='stylesheet' id='_main-css' href='/static/css/viewer.min.css' type='text/css' media='all'/><script type='text/javascript' src='/static/js/viewer.min.js?1'></script><script type='text/javascript' src='/static/js/jquery-viewer.min.js'></script><script>jQuery.fn.wait = function (func, times, interval) { var _times = times || -1, //100次 _interval = interval || 20, //20毫秒每次 _self = this, _selector = this.selector, //选择器 _iIntervalID; //定时器id if( this.length ){ //如果已经获取到了,就直接执行函数 func && func.call(this); } else { _iIntervalID = setInterval(function() { if(!_times) { //是0就退出 clearInterval(_iIntervalID); } _times <= 0 || _times--; //如果是正数就 -- _self = $(_selector); //再次选择 if( _self.length ) { //判断是否取到 func && func.call(_self); clearInterval(_iIntervalID); } }, _interval); } return this; } $("table.syntaxhighlighter").wait(function() { $('table.syntaxhighlighter').append("<p class='cnblogs_code_footer'><span class='cnblogs_code_footer_icon'></span></p>"); }); $(document).on("click", ".cnblogs_code_footer",function(){ $(this).parents('table.syntaxhighlighter').css('display','inline-table');$(this).hide(); }); $('.nphpQianCont').viewer({navbar:true,title:false,toolbar:false,movable:false,viewed:function(){$('img').click(function(){$('.viewer-close').trigger('click');});}}); </script></body><!-- Matomo --><script> var _paq = window._paq = window._paq || []; /* tracker methods like "setCustomDimension" should be called before "trackPageView" */ _paq.push(['trackPageView']); _paq.push(['enableLinkTracking']); (function() { var u="https://tongji.php.cn/"; _paq.push(['setTrackerUrl', u+'matomo.php']); _paq.push(['setSiteId', '9']); var d=document, g=d.createElement('script'), s=d.getElementsByTagName('script')[0]; g.async=true; g.src=u+'matomo.js'; s.parentNode.insertBefore(g,s); })(); </script><!-- End Matomo Code --></html>