>  기사  >  백엔드 개발  >  PHP 정규 표현식: 문자열에서 특정 시작과 끝을 가진 하위 문자열을 추출하는 방법

PHP 정규 표현식: 문자열에서 특정 시작과 끝을 가진 하위 문자열을 추출하는 방법

WBOY
WBOY원래의
2023-06-22 09:10:301669검색

PHP는 강력한 정규식 기능을 갖춘 인기 있는 프로그래밍 언어입니다. 정규식은 문자열에서 원하는 내용을 쉽게 추출할 수 있게 해주는 강력한 문자열 처리 도구입니다.

이 기사에서는 PHP 정규 표현식의 사용, 특히 문자열에서 특정 시작과 끝이 있는 하위 문자열을 추출하는 방법을 소개합니다. PHP 정규식을 사용하여 하위 문자열을 추출하는 방법을 배우고 싶다면 이 문서가 도움이 될 것입니다.

먼저 정규 표현식의 기본 사항을 복습해 보겠습니다. 정규식은 문자열의 패턴을 정의하는 구문 규칙입니다. 텍스트를 검색하고 바꾸고 유효성을 검사하는 데 사용할 수 있습니다.

PHP에서는 preg_match() 함수를 사용하여 문자열에서 정규 표현식과 일치하는 하위 문자열을 검색합니다. 이 함수에는 정규식, 검색할 문자열, 결과 배열이라는 세 가지 매개 변수가 필요합니다. 함수가 일치하는 하위 문자열을 성공적으로 찾으면 결과 배열에 결과를 저장하고 true를 반환합니다. 그렇지 않으면 false를 반환합니다.

다음으로 정규식을 사용하여 문자열에서 특정 시작과 끝을 갖는 부분 문자열을 추출하는 방법을 살펴보겠습니다. 다음 예를 고려해 보세요.

$string = "The quick brown fox jumps over the lazy dog.";

이제 이 문자열에서 문자 "q"로 시작하고 문자 "g"로 끝나는 하위 문자열을 추출하려고 합니다. 이를 달성하기 위해 다음 정규식을 사용할 수 있습니다.

$regex = '/q.*g/';

이 정규식은 문자 "q"로 시작하고 문자 "g"로 끝날 때까지 모든 문자(.로 표시)가 뒤에 올 수 있음을 의미합니다. 이제 preg_match() 함수를 사용하여 이 문자열을 검색할 수 있습니다.

if (preg_match($regex, $string, $matches)) {
    echo $matches[0];
}

이 코드의 기능은 $string에서 $regex 정규 표현식과 일치하는 콘텐츠를 검색하고 결과를 $matches 배열에 저장한 다음 $를 출력하는 것입니다. [0]과 일치합니다. 작업 결과는 다음과 같습니다.

quick brown fox jumps over the lazy dog

문자열에서 문자 "q"로 시작하고 문자 "g"로 끝나는 하위 문자열을 성공적으로 추출했습니다!

더 복잡한 예를 살펴보겠습니다. 이제 HTML 페이지의 소스 코드가 있습니다.

$html = '<div class="content">
            <h1>Welcome to my website</h1>
            <p>I hope you enjoy your stay!</p>
        </div>';

HTML 페이지에서 4a249f0d628e2318394fd9b75b4636b1 태그의 콘텐츠를 추출하려고 합니다. 정규식을 사용하면 이 작업을 쉽게 수행할 수 있습니다.

$regex = '/<h1>(.*?)</h1>/';

이 정규식은 4a249f0d628e2318394fd9b75b4636b1로 시작하고 473f0a7621bec819994bb5020d29372a로 끝나는 콘텐츠를 검색한다는 의미입니다. 괄호 안의 .*?는 모든 문자를 의미합니다. non-greedy 모드를 나타냄) 괄호는 일치하는 내용이 $matches 배열의 첫 번째 요소에 저장됨을 나타냅니다. 다음으로, preg_match() 함수를 사용하여 이 HTML 소스 코드를 검색할 수 있습니다.

if (preg_match($regex, $html, $matches)) {
    echo $matches[1];
}

이 코드의 기능은 $regex 정규 표현식과 일치하는 $html의 콘텐츠를 검색하고 결과를 $matches 배열에 저장하는 것입니다. 일치하는 콘텐츠의 첫 번째 대괄호 안의 콘텐츠를 출력합니다. 실행 결과는 다음과 같습니다.

Welcome to my website

HTML 페이지에서 4a249f0d628e2318394fd9b75b4636b1 태그의 콘텐츠를 성공적으로 추출했습니다!

이 기사에서는 PHP 정규식의 기본 사항, 특히 정규식을 사용하여 문자열에서 특정 시작과 끝이 있는 하위 문자열을 추출하는 방법을 다루었습니다. 이러한 예제를 통해 PHP 정규식을 능숙하게 사용하여 필요한 문자열을 검색하고 추출할 수 있어야 합니다.

위 내용은 PHP 정규 표현식: 문자열에서 특정 시작과 끝을 가진 하위 문자열을 추출하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.