집 >백엔드 개발 >PHP 튜토리얼 >PHP로 웹페이지에 액세스하고 해당 콘텐츠를 파일에 저장

PHP로 웹페이지에 액세스하고 해당 콘텐츠를 파일에 저장

PHPz원래의: 2023-06-13 18:40:342175검색

오늘은 PHP를 사용하여 웹 페이지에 액세스하고 해당 내용을 로컬 파일에 저장하는 방법을 알아 보겠습니다. 이 기술은 크롤링 및 데이터 분석에 매우 유용합니다.

먼저, 웹페이지 콘텐츠를 가져오기 위해 PHP의 컬 기능을 사용해야 합니다. 컬은 네트워크에 액세스하는 데 사용할 수 있는 라이브러리이며 HTTP, FTP, SMTP 등과 같은 여러 프로토콜을 지원할 수 있습니다.

먼저 PHP 파일을 생성합니다. 예제 파일 이름은 get_html.php이고 파일에 다음 코드를 추가합니다.

<?php
// 获取网址
$url = 'http://www.example.com';

// 初始化 curl
$ch = curl_init();

// 设置参数
curl_setopt($ch, CURLOPT_URL, $url);  // 设置访问的 URL
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // 将结果返回而不显示
curl_setopt($ch, CURLOPT_HEADER, false); // 不返回头信息

// 发送请求
$result = curl_exec($ch);

// 关闭 curl
curl_close($ch);

// 打印结果
echo $result;
?>

위 코드에서는 먼저 액세스할 URL을 정의한 다음 다음으로 컬을 초기화합니다. 컬_init() 함수 . 다음으로, 액세스할 URL, 결과를 표시하지 않고 반환, 헤더 정보를 반환하지 않음 등 위에서 언급한 일부 매개변수를 설정합니다. 마지막으로, 컬_exec() 함수를 사용하여 요청을 실행하고 결과를 $result 변수에 저장합니다. 마지막으로 이 웹페이지의 내용을 보기 위해 $result 변수의 값을 인쇄합니다.

다음으로 웹 콘텐츠를 로컬 파일에 저장해야 합니다. file_put_contents() 함수를 사용하여 문자열 내용을 파일에 직접 쓸 수 있습니다. 먼저 파일을 생성한 다음 콘텐츠를 파일에 저장해야 한다는 점에 유의하는 것이 중요합니다.

<?php
// 获取网址
$url = 'http://www.example.com';

// 初始化 curl
$ch = curl_init();

// 设置参数
curl_setopt($ch, CURLOPT_URL, $url);  // 设置访问的 URL
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // 将结果返回而不显示
curl_setopt($ch, CURLOPT_HEADER, false); // 不返回头信息

// 发送请求
$result = curl_exec($ch);

// 关闭 curl
curl_close($ch);

// 将结果保存到文件中
$file = 'page.html';
file_put_contents($file, $result);
?>

위 코드에서는 먼저 액세스할 URL을 정의한 다음, 컬_init() 함수를 사용하여 컬을 초기화하고 일부 매개변수를 설정했습니다. 그런 다음 요청을 실행하고 결과를 $result 변수에 저장합니다. 마지막으로 file_put_contents() 함수를 사용하여 $result 변수의 값을 page.html이라는 파일에 저장합니다.

좋아요, 우리는 PHP를 사용하여 웹 페이지에 액세스하고 해당 콘텐츠를 파일에 저장하는 방법을 배웠습니다. 이는 데이터 스크래핑 및 분석을 위한 기본 기술입니다. 이 기사가 도움이 되기를 바랍니다.

위 내용은 PHP로 웹페이지에 액세스하고 해당 콘텐츠를 파일에 저장의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

php html cURL 字符串数据分析 http

성명：

이전 기사：PHP를 사용하여 Instagram 정보를 스크랩하는 예다음 기사：PHP를 사용하여 Instagram 정보를 스크랩하는 예