>  기사  >  백엔드 개발  >  PHP가 원격 코드 인스턴스를 읽거나 가져오는 방법에 대한 자세한 설명

PHP가 원격 코드 인스턴스를 읽거나 가져오는 방법에 대한 자세한 설명

伊谢尔伦
伊谢尔伦원래의
2017-07-17 10:23:002233검색

원격 웹사이트 데이터 크롤링을 위한 PHP 코드

이제 동일한 질문, 즉 검색 엔진처럼 다른 사람 웹사이트의 HTML 코드를 크롤링한 다음 이를 수집하고 정리하는 방법에 대해 많은 프로그램 매니아들이 있을 것입니다. 오늘은 간단한 예제를 소개하겠습니다.
Ⅰ.원격 웹페이지 제목 가져오기:
다음은 코드 조각입니다.

<?php
/*
+-------------------------------------------------------------
+抓取网页标题的代码,直接拷贝本代码片段,另存为.php文件执行即可.
+-------------------------------------------------------------
*/
error_reporting
(7);
$file = fopen ("http://www.php.cn/", "r");
if (!$file) {
echo "<font color=red>Unable to open remote file.</font>\n";
exit;
}
while (!feof ($file)) {
$line = fgets ($file, 1024);
if (eregi ("<title>(.*)</title>", $line, $out)) {
$title = $out[1];
echo "".$title."";
break;
}
}
fclose($file);
//End
?>

Ⅱ. webpage:
다음은 코드 조각입니다:

<? php
/*
+----------------
+DNSing Sprider
+----------------
*/
$fp = fsockopen("www.php.cn", 80, $errno, $errstr, 30);
if (!$fp) {
echo "$errstr ($errno)<br/>\n";
} else {
$out = "GET / HTTP/1.1\r\n";
$out .= "Host:www.php.cn\r\n";
$out .= "Connection: Close \r\n\r\n";
fputs($fp, $out);
while (!feof($fp)) {
echo fgets($fp, 128);
}
fclose($fp);
}
//End
?>

위의 두 코드 조각을 직접 복사하고 다시 실행하여 효과를 확인하세요. 위의 예는 웹 페이지 데이터를 자신에게 더 적합하게 만드는 프로토타입일 뿐입니다. 사용하면 상황이 달라질 수 있습니다.

fopen( ) 파일로 지정된 이름 리소스를 스트림에 바인딩합니다.
filesize 파일 크기의 바이트 수를 반환하고 오류가 발생하면 FALSE를 반환합니다. PHP의
정수 유형은 부호가 있으며 대부분의 플랫폼에서는 32비트 정수를 사용하여 2GB에서 4GB 사이의 파일이 있는 경우 filesize() 함수가 예기치 않은 결과를 반환할 수 있습니다. fread()는 파일 포인터 핸들에서 최대 길이 바이트까지 읽거나 EOF에 도달하거나 (네트워크 스트림의 경우) 패킷을 읽습니다.
파일 읽기를 중지합니다. 참고: 낮은 버전 사용은 PHP5
file_get_contents의 경우 file_get_contents를 사용하는 것이 좋습니다. string

string file_get_contents ( string filename [, int use_include_path [, 리소스 컨텍스트]]) file()과 동일하지만 file_get_contents()는 파일을 문자열로 반환합니다. file_get_contents() 함수는 파일의 내용을 읽는 데 사용됩니다. 파일을 문자열로 변환하는 것이 선호되는 방법입니다. 운영 체제에서 지원하는 경우 성능 향상을 위해 메모리 매핑 기술도 사용됩니다.

위 내용은 PHP가 원격 코드 인스턴스를 읽거나 가져오는 방법에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.