>  기사  >  백엔드 개발  >  PHP 정규식 실행: XML 문서 일치

PHP 정규식 실행: XML 문서 일치

王林
王林원래의
2023-06-22 10:39:12861검색

인터넷이 발전하면서 XML 문서가 점점 일반화되고 있으므로 정규식을 사용하여 XML 문서의 내용을 일치시키는 방법을 이해해야 합니다. 이 기사에서는 개발자가 XML 문서를 더 잘 처리하고 분석하는 데 도움이 되는 PHP 정규식의 실제 적용 방법을 소개합니다.

XML 문서란 무엇인가요?

XML(Extensible Markup Language)은 데이터를 저장하고 전송하는 데 사용되는 마크업 언어입니다. XML 문서는 태그, 속성, 콘텐츠로 구성됩니다. 태그는 데이터를 식별하는 데 사용되는 설명이고, 속성은 태그의 일부 특수 정보이며, 콘텐츠는 태그가 설명하는 데이터입니다.

예:

<book genre="mystery">
   <title>The Hound of the Baskervilles</title>
   <author>Arthur Conan Doyle</author>
   <price>5.99</price>
</book>

여기에서 book은 태그이고 genre는 속성이며 The Hound of the Baskervilles는 콘텐츠입니다. XML 문서에는 원하는 수의 태그, 속성 및 콘텐츠가 포함될 수 있습니다. book是标签,genre是属性,The Hound of the Baskervilles是内容。XML文档中可以包含任意数量的标签、属性和内容。

如何使用PHP正则表达式匹配XML文档?

在PHP中,可以使用preg_match()函数来匹配XML文档。该函数需要三个参数:正则表达式、要匹配的字符串和一个可选的数组,用于存储匹配结果。

下面是一个例子,该例子演示了如何使用正则表达式来匹配XML文档中的标签:

$xml = '<book genre="mystery">
           <title>The Hound of the Baskervilles</title>
           <author>Arthur Conan Doyle</author>
           <price>5.99</price>
        </book>';

$pattern = '/<([a-zA-Z0-9]+)>/';

preg_match($pattern, $xml, $matches);

print_r($matches);

输出结果如下:

Array
(
    [0] => <book>
    [1] => book
)

这里的正则表达式/9e57713c5d37d2d6d4d698166f96244f/可以匹配XML文档中的标签。([a-zA-Z0-9]+)表示匹配一个或多个大小写字母和数字字符。637dade88b2e55fa23a9dd8b003912dc表示标签的开始和结束。

在匹配过程中,preg_match()函数会搜索字符串中符合正则表达式的子串,并将匹配的结果存储在$matches数组中。$matches[0]表示整个符合正则表达式的子串,$matches[1]表示正则表达式中第一个括号内的子串。

下面是一些其他常用的正则表达式:

匹配属性:

$pattern = '/([a-zA-Z]+)="([^"]+)"/';

preg_match($pattern, $xml, $matches);

print_r($matches);

输出结果如下:

Array
(
    [0] => genre="mystery"
    [1] => genre
    [2] => mystery
)

这里的正则表达式/([a-zA-Z]+)="([^"]+)"/可以匹配XML文档中的属性。([a-zA-Z]+)表示匹配一个或多个大小写字母,="表示属性的开始,([^"]+)表示匹配除双引号之外的任意字符,"表示属性的结束。

匹配内容:

$pattern = '/<title>([^<]+)</title>/';

preg_match($pattern, $xml, $matches);

print_r($matches);

输出结果如下:

Array
(
    [0] => <title>The Hound of the Baskervilles</title>
    [1] => The Hound of the Baskervilles
)

这里的正则表达式/b2386ffb911b14667cb8f0f91ea547a7([^5fdde8e76f2e6499112bdf9087bded19/可以匹配XML文档中b2386ffb911b14667cb8f0f91ea547a7标签的内容。([^00d9d8fa7dc1827d67a48c8f554d6f31表示匹配6e916e0f7d1e588d4f442bf645aedb2f

PHP 정규식을 사용하여 XML 문서를 일치시키는 방법은 무엇입니까?

PHP에서는 preg_match() 함수를 사용하여 XML 문서를 일치시킬 수 있습니다. 이 함수는 정규식, 일치시킬 문자열, 일치 결과를 저장할 선택적 배열 등 세 가지 매개변수를 사용합니다.

다음은 정규식을 사용하여 XML 문서의 태그를 일치시키는 방법을 보여주는 예입니다. 🎜rrreee🎜출력은 다음과 같습니다. 🎜rrreee🎜여기 정규식 /b498e459bba663a3ea133e6f1b56f36f/는 XML 문서의 태그와 일치할 수 있습니다. ([a-zA-Z0-9]+)는 하나 이상의 대문자, 소문자 및 숫자가 일치함을 의미합니다. 및 <code>>는 태그의 시작과 끝을 나타냅니다. 🎜🎜일치 프로세스 중에 preg_match() 함수는 문자열의 정규 표현식과 일치하는 하위 문자열을 검색하고 일치 결과를 $matches 배열에 저장합니다. $matches[0]는 정규식과 일치하는 전체 하위 문자열을 나타내고 $matches[1]는 정규식의 첫 번째 대괄호 내의 하위 문자열을 나타냅니다. 🎜🎜다음은 일반적으로 사용되는 기타 정규 표현식입니다. 🎜🎜일치 속성: 🎜rrreee🎜출력은 다음과 같습니다. 🎜rrreee🎜여기 정규 표현식은 /([a-zA-Z]+)="([ ^"]+)"/는 XML 문서의 속성과 일치할 수 있습니다. ([a-zA-Z]+)는 하나 이상의 대문자 및 소문자 일치를 의미합니다. = " 는 속성의 시작을 나타내고 ([^"]+)는 큰따옴표를 제외한 모든 문자 일치를 나타내며 "는 속성의 끝을 나타냅니다. 🎜🎜일치하는 콘텐츠: 🎜rrreee🎜출력 결과는 다음과 같습니다. 🎜rrreee🎜여기의 정규 표현식은 /b2386ffb911b14667cb8f0f91ea547a7([^5fdde8e76f2e6499112bdf9087bded19/와 일치할 수 있습니다. XML 문서 b2386ffb911b14667cb8f0f91ea547a7 태그의 내용입니다. ([^는 미만 기호를 제외한 모든 문자와 일치함을 의미하고, <code>6e916e0f7d1e588d4f442bf645aedb2f6e916e0f7d1e588d4f442bf645aedb2f과 일치함을 의미합니다. 코드> 태그입니다. 🎜🎜요약🎜🎜 PHP 정규식은 XML 문서를 처리할 때 매우 유용한 도구입니다. 정규식을 사용하면 XML 문서의 데이터를 쉽게 일치, 추출 및 처리할 수 있습니다. 그러나 정규식은 그다지 효율적이지 않다는 점에 유의해야 합니다. 대규모 XML 문서를 처리할 때는 전문적인 XML 파서를 사용하여 데이터를 처리하는 것이 좋습니다. 🎜

위 내용은 PHP 정규식 실행: XML 문서 일치의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.