찾다
백엔드 개발PHP 튜토리얼웹사이트 이미지를 원격으로 가져와 저장하는 PHP 코드

예: 웹사이트 데이터를 캡처하는 PHP 코드.

  1. /**
  2. * 이미지 캡처 클래스
  3. *
  4. * @package default
  5. * @author WuJunwei
  6. */
  7. class download_image
  8. {
  9. public $save_path / /이미지 저장 주소 캡처
  10. //이미지 크기 제한 캡처(단위:바이트) 이 제한보다 큰 이미지만 캡처
  11. public $img_size=0; 🎜> //반복적인 크롤링을 피하기 위해 이전에 크롤링한 하이퍼링크 주소를 기록하는 정적 배열을 정의합니다.
  12. public static $a_url_arr=array()
  13. /**
  14. * @param String $save_path 캡쳐된 이미지의 저장 주소
  15. * @param Int $img_size 캡쳐된 이미지의 저장 주소
  16. */
  17. public function __construct; ($save_path,$img_size)
  18. {
  19. $this->save_path=$save_path;
  20. $this->img_size=$img_size;
  21. }
  22. /**
  23. * 홈페이지 및 서브페이지의 이미지를 재귀적으로 다운로드하여 캡처하는 방법(재귀적 재귀)
  24. *
  25. * @param String $capture_url 이미지 캡처에 사용되는 URL
  26. *
  27. */
  28. 공용 함수 recursive_download_images($capture_url)
  29. {
  30. if (!in_array($capture_url,self::$a_url_arr)) //캡처 없음 통과
  31. {
  32. self ::$a_url_arr[]=$capture_url; // 정적 배열로 계산됨
  33. } else // 캡처됨, 함수를 직접 종료
  34. {
  35. return; this->download_current_page_images($capture_url); //현재 페이지의 모든 이미지를 다운로드합니다
  36. //읽을 수 없는 캡처 주소로 인한 경고 오류를 차단하려면 @를 사용하세요
  37. $content=@file_get_contents($capture_url );
  38. // 태그의 href 속성에서 ? 앞의 정규 부분을 일치시킵니다.
  39. $a_pattern = "|] href= ['" ]?([^ ' "?] )['" >]|U";
  40. preg_match_all($a_pattern, $content, $a_out, PREG_SET_ORDER);
  41. $tmp_arr=array (); //배열을 정의하여 현재 루프에서 캡처된 이미지의 하이퍼링크 주소를 저장합니다.
  42. foreach ($a_out as $k => $v)
  43. {
  44. /**
  45. * 하이퍼링크에서 빈 '', '#', '/' 및 중복 값 제거
  46. * 1: 하이퍼링크 주소 값은 현재 크롤링된 페이지의 URL과 같을 수 없습니다. 그렇지 않으면 무한 루프에 빠지다
  47. * 2: 하이퍼링크가 '' 또는 '#'이면 '/'도 이 페이지이고, 이것도 무한 루프에 빠진다.
  48. * 3: 가끔 하이퍼링크 주소가 웹페이지에 여러 번 표시됩니다. 삭제하지 않으면 하위 페이지가 반복적으로 다운로드됩니다.
  49. */
  50. if ( $v[ 1] && !in_array($v[1],self::$a_url_arr) &&!in_array($v[1],array('#','/',$ Capture_url) ) )
  51. {
  52. $tmp_arr[]=$v[1]
  53. }
  54. }
  55. foreach ($tmp_arr as $k => $v)
  56. {
  57. //하이퍼링크 경로 주소
  58. if ( strpos($v, 'http://')!==false ) //url에 http://가 포함되어 있으면 직접 액세스할 수 있습니다.
  59. {
  60. $a_url = $v;
  61. }else //그렇지 않으면 상대 주소인 것으로 판명되며, 하이퍼링크의 액세스 주소를 재구성해야 합니다.
  62. {
  63. $domain_url = substr($capture_url, 0,strpos( $capture_url, ' /',8) 1)
  64. $a_url=$domain_url.$v
  65. }
  66. $this->recursive_download_images($a_url)
  67. }
  68. }
  69. /**
  70. * 현재 웹페이지 아래의 모든 이미지 다운로드
  71. *
  72. * @param String $capture_url 이미지 캡처에 사용되는 웹페이지 주소
  73. * @return Array 웹페이지의 모든 이미지에 대한 img 태그의 URL 주소 중 하나 현재 웹페이지 배열
  74. */
  75. 공개 함수 download_current_page_images($capture_url)
  76. {
  77. $content=@file_get_contents($capture_url) //Shield 경고 오류
  78. // img 태그의 src 속성에서 ? 앞의 일반 부분과 일치
  79. $img_pattern = "|웹사이트 이미지를 원격으로 가져와 저장하는 PHP 코드] src=['" ]?([^ '"?] )[ ' " >]|U";
  80. preg_match_all($img_pattern, $content, $img_out, PREG_SET_ORDER)
  81. $photo_num = count($img_out)
  82. // 일치하는 사진 수량
  83. echo '

    '.$capture_url . "총 발견" . " 사진

    "
  84. foreach ($img_out as $k => $v) > $this->save_one_img($capture_url,$v[1])
  85. }
  86. }
  87. /**
  88. * 단일 이미지 저장 방법
  89. *
  90. * @param String $capture_url 이미지 캡처에 사용된 웹 주소
  91. * @param String $img_url 저장해야 하는 이미지의 URL
  92. *
  93. */
  94. 공개 함수 save_one_img($capture_url,$img_url)
  95. {
  96. //이미지 경로 주소
  97. if ( strpos($img_url, ' http://')!==false )
  98. {
  99. // $img_url = $img_url
  100. }else
  101. {
  102. $domain_url = substr($capture_url, 0,strpos( $capture_url, '/',8) 1); $img_url=$domain_url.$img_url;
  103. }
  104. $pathinfo = pathinfo($img_url); //이미지 경로 정보 가져오기
  105. $ pic_name=$pathinfo['basename']; //사진 이름을 가져옵니다
  106. if (file_exists($this->save_path.$pic_name)) //사진이 존재하면 캡쳐되었음을 증명합니다 , 함수 종료
  107. {
  108. echo $img_url . '이 이미지가 캡처되었습니다!
    return;
  109. }
  110. //이미지 내용을 문자열로 읽습니다.
  111. $img_data = @file_get_contents($img_url) //이미지 주소를 읽을 수 없어 발생하는 경고 오류 읽어보세요
  112. if ( strlen($img_data) > $this->img_size ) //크기가 제한보다 큰 사진을 다운로드합니다
  113. {
  114. $img_size = file_put_contents($this->save_path . $pic_name, $img_data );
  115. if ($img_size)
  116. {
  117. echo $img_url . '이미지가 저장되었습니다. < ;br/>';
  118. } else
  119. {
  120. echo $img_url ' 이미지를 저장하세요!
    ';
  121. }
  122. } else
  123. {
  124. echo $img_url '사진 읽기 실패!
    ';
  125. }
  126. }
  127. } // END
  128. set_time_limit(120); //스크립트의 최대 실행 시간을 상황에 따라 설정
  129. $download_img=new download_image('E:/images/',0) //다운로드 이미지 객체 인스턴스화
  130. $download_img-> recursive_download_images('http://bbs.it-home .org/'); //재귀적으로 이미지 캡처 방법
  131. //$download_img->download_current_page_images($_POST['capture_url']); 현재 페이지 이미지 방법
  132. ?>
코드 복사

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
PHP 세션에 어떤 데이터를 저장할 수 있습니까?PHP 세션에 어떤 데이터를 저장할 수 있습니까?May 02, 2025 am 12:17 AM

phpsessionscanstorestrings, 숫자, 배열 및 객체 1.Strings : TextDatalikeUsernames.2.numbers : integorfloatsforcounters.3.arrays : listslikeshoppingcarts.4.objects : complexStructuresThatareserialized.

PHP 세션을 어떻게 시작합니까?PHP 세션을 어떻게 시작합니까?May 02, 2025 am 12:16 AM

tostartAphPessession, us

세션 재생이란 무엇이며 보안을 어떻게 개선합니까?세션 재생이란 무엇이며 보안을 어떻게 개선합니까?May 02, 2025 am 12:15 AM

세션 재생은 세션 고정 공격의 경우 사용자가 민감한 작업을 수행 할 때 새 세션 ID를 생성하고 이전 ID를 무효화하는 것을 말합니다. 구현 단계에는 다음이 포함됩니다. 1. 민감한 작업 감지, 2. 새 세션 ID 생성, 3. 오래된 세션 ID 파괴, 4. 사용자 측 세션 정보 업데이트.

PHP 세션을 사용할 때 몇 가지 성능 고려 사항은 무엇입니까?PHP 세션을 사용할 때 몇 가지 성능 고려 사항은 무엇입니까?May 02, 2025 am 12:11 AM

PHP 세션은 응용 프로그램 성능에 큰 영향을 미칩니다. 최적화 방법은 다음과 같습니다. 1. 데이터베이스를 사용하여 세션 데이터를 저장하여 응답 속도를 향상시킵니다. 2. 세션 데이터 사용을 줄이고 필요한 정보 만 저장하십시오. 3. 비 차단 세션 프로세서를 사용하여 동시성 기능을 향상시킵니다. 4. 사용자 경험과 서버 부담의 균형을 맞추기 위해 세션 만료 시간을 조정하십시오. 5. 영구 세션을 사용하여 데이터 읽기 및 쓰기 시간의 수를 줄입니다.

PHP 세션은 쿠키와 어떻게 다릅니 까?PHP 세션은 쿠키와 어떻게 다릅니 까?May 02, 2025 am 12:03 AM

phpsessionsareser-side, whilecookiesareclient-side.1) sessions stessoredataontheserver, andhandlargerdata.2) cookiesstoredataonthecure, andlimitedinsize.usesessionsforsensitivestataondcookiesfornon-sensistive, client-sensation.

PHP는 사용자 세션을 어떻게 식별합니까?PHP는 사용자 세션을 어떻게 식별합니까?May 01, 2025 am 12:23 AM

phpidifiesauser의 sssessionusessessioncookiesandssessionids.1) whensession_start () iscalled, phpgeneratesauniquessessionStoredInacookienamedPhpsSessIdonSeuser 'sbrowser.2) thisidallowsphptoretrievessessionDataTromServer.

PHP 세션을 확보하기위한 모범 사례는 무엇입니까?PHP 세션을 확보하기위한 모범 사례는 무엇입니까?May 01, 2025 am 12:22 AM

PHP 세션의 보안은 다음 측정을 통해 달성 할 수 있습니다. 1. Session_REGENEREAT_ID ()를 사용하여 사용자가 로그인하거나 중요한 작업 일 때 세션 ID를 재생합니다. 2. HTTPS 프로토콜을 통해 전송 세션 ID를 암호화합니다. 3. 세션 _save_path ()를 사용하여 세션 데이터를 저장하고 권한을 올바르게 설정할 보안 디렉토리를 지정하십시오.

PHP 세션 파일은 기본적으로 어디에 저장됩니까?PHP 세션 파일은 기본적으로 어디에 저장됩니까?May 01, 2025 am 12:15 AM

phpsessionfilesarestoredInTheRectorySpecifiedBysession.save_path, 일반적으로/tmponunix-likesystemsorc : \ windows \ temponwindows.tocustomizethis : 1) austession_save_path () toSetacustomDirectory, verlyTeCustory-swritation;

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

VSCode Windows 64비트 다운로드

VSCode Windows 64비트 다운로드

Microsoft에서 출시한 강력한 무료 IDE 편집기

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

Dreamweaver Mac版

Dreamweaver Mac版

시각적 웹 개발 도구

SublimeText3 Linux 새 버전

SublimeText3 Linux 새 버전

SublimeText3 Linux 최신 버전