>백엔드 개발 >PHP 튜토리얼 >PHP 정규 표현식: HTML의 모든 링크를 일치시키는 방법

PHP 정규 표현식: HTML의 모든 링크를 일치시키는 방법

王林
王林원래의
2023-06-22 13:15:071427검색

웹 개발에서는 HTML 페이지의 링크를 처리해야 하는 경우가 많습니다. PHP 정규 표현식을 사용하여 HTML 페이지의 모든 링크를 일치시키는 방법은 무엇입니까? 여기 우리가 알아보러 왔습니다.

HTML 페이지의 링크는 일반적으로 태그를 통해 구현되며, 이 태그를 기반으로 링크를 일치시킬 수 있습니다. 먼저, PHP의 file_get_contents() 함수를 통해 HTML 페이지의 소스 코드를 가져와야 합니다. 예:

$html = file_get_contents('http://www.example.com');

다음으로 정규식을 사용하여 모든 링크를 일치시킬 수 있습니다. 다음은 링크를 일치시키는 간단한 정규식입니다.

$pattern = '/<a href="https://www.php.cn/link/d28a3097fa7cf63ad01c4f328314e2f2">https://www.php.cn/link/d28a3097fa7cf63ad01c4f328314e2f2</a>/';

정규식에서 로 시작하고 href 속성으로 시작하는 링크 태그와 일치합니다. href="https://www.php.cn/link/2b9bd744f7c0d06123d9d9557310fa80"은 링크 주소와 일치합니다. 괄호는 이것이 캡처 그룹임을 나타냅니다. 즉, 나중에 $matches 변수를 사용하여 일치하는 결과에 액세스할 수 있습니다. >(.?)은 링크 텍스트와 일치하며 캡처 그룹이기도 합니다.

다음으로 preg_match_all() 함수를 사용하여 HTML 페이지 소스 코드에 정규 표현식을 적용하여 모든 링크를 일치시킬 수 있습니다.

preg_match_all($pattern, $html, $matches);

이 함수는 $matches 배열을 반환합니다. 여기서 $matches[0]에는 일치하는 모든 항목이 포함됩니다. 링크 문자열에서 $matches[1]은 링크 주소인 캡처 그룹 1에 해당하고, $matches[2]는 링크 텍스트인 캡처 그룹 2에 해당합니다.

마지막으로 링크 주소 배열인 $matches[1] 배열을 반복하여 모든 링크의 주소를 얻을 수 있습니다.

foreach ($matches[1] as $link) {
    echo $link . "
";
}

전체 코드는 다음과 같습니다.

$html = file_get_contents('http://www.example.com');
$pattern = '/<a href="https://www.php.cn/link/d28a3097fa7cf63ad01c4f328314e2f2">https://www.php.cn/link/d28a3097fa7cf63ad01c4f328314e2f2</a>/';
preg_match_all($pattern, $html, $matches);

foreach ($matches[1] as $link) {
    echo $link . "
";
}

이 정규식은 다음과 같습니다. 기본 링크 형식만 일치합니다. 예:

<a href="http://www.example.com">Example</a>

링크에 다른 속성이 포함되어 있거나 라벨 형식이 기본 요구 사항을 충족하지 않는 경우 일치하지 않습니다. 실제 응용 프로그램에서는 필요에 따라 정규식을 수정하여 다양한 링크 형식에 맞게 조정할 수 있습니다.

요약하자면, PHP 정규식을 사용하여 HTML 페이지의 링크를 일치시키려면 file_get_contents() 함수를 사용하여 페이지 소스 코드를 얻은 다음 preg_match_all() 함수와 적절한 정규식을 사용하여 일치를 완료하고 마지막으로 일치하는 결과, 즉 Can을 반복합니다.

위 내용은 PHP 정규 표현식: HTML의 모든 링크를 일치시키는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.