>  기사  >  백엔드 개발  >  PHP 정규식 전투: 구두점 일치

PHP 정규식 전투: 구두점 일치

PHPz
PHPz원래의
2023-06-23 08:03:072284검색

PHP 프로그래밍에서 정규식은 문자열에 대해 빠르고 효과적인 일치 및 대체 작업을 수행할 수 있는 매우 일반적으로 사용되는 도구입니다. 구두점은 텍스트에 풍부한 의미를 부여할 수 있는 일반적인 문자열 요소입니다. 이 기사에서는 보다 지능적인 텍스트 처리를 위해 정규식을 사용하여 문장 부호를 일치시키는 방법을 소개합니다.

1. 구두점의 종류

정규식에서 구두점은 특정한 개념이나 종류가 아닙니다. 대신 쉼표, 마침표, 느낌표, 물음표, 세미콜론 등과 같은 다양한 일반 특수 문자를 나타냅니다. 이러한 구두점은 언어학, 문학, 출판 등 다양한 분야에서 널리 사용되고 있습니다.

2. 구두점 일치 방법

정규식에서는 특수 문자나 메타 문자를 사용하여 다양한 구두점을 일치시킬 수 있습니다. 다음은 몇 가지 일반적인 구두점 일치 방법입니다.

  1. 일반 구두점 일치

일반 구두점은 쉼표, 마침표, 느낌표, 물음표, 세미콜론, 콜론 등과 같은 일반적인 기호를 나타냅니다. 대괄호를 사용할 수 있습니다. [] 일치:

preg_match_all('/[,.?!;:]/', $text, $matches);
// 匹配逗号、句号、感叹号、问号、分号、冒号

위 코드에서 preg_match_all 함수와 정규 표현식 '/[,.?!;:]/'를 사용하여 모든 쉼표, 마침표, 느낌표, 물음표, 세미콜론 및 콜론. 대괄호 []는 여러 문자가 포함된 문자 집합을 나타냅니다. 정규식에서 마침표는 모든 문자에 대한 와일드카드 문자를 나타내며 로 이스케이프되어야 합니다.

  1. 줄임표 일치

줄임표는 세 개의 연속 마침표로 구성된 기호이므로 정규식 '…'을 사용하여 일치시킬 수 있습니다.

preg_match_all('/…/', $text, $matches);
// 匹配省略号

위 코드에서 preg_match_all 함수와 정규식 '/ …' /'는 모든 타원과 일치합니다. 줄임표 안의 마침표는 로 이스케이프되어야 합니다.

  1. 큰따옴표와 작은따옴표 일치

PHP 프로그램에서 큰따옴표와 작은따옴표는 문자열을 정의하는 데 자주 사용되며 이 두 따옴표는 일반적인 구두점이기도 합니다. 대괄호 []를 사용하여 일치시킬 수 있습니다.

preg_match_all('/["']/', $text, $matches);
// 匹配双引号和单引号

위 코드에서는 preg_match_all 함수와 정규식 '/["']/'를 사용하여 큰따옴표와 작은따옴표를 일치시킵니다. 정규식 자체도 다음을 사용하므로 작은따옴표나 큰따옴표이므로 ' 또는 "로 이스케이프해야 합니다.

3. 사례 분석

구두점 일치 방법을 더 잘 이해하기 위해 아래에 실제 사례를 보여줍니다. 텍스트에서 다양한 구두점이 사용된 횟수를 계산합니다.

먼저 PHP에 내장된 file_get_contents 함수를 사용하여 텍스트 파일을 문자열 변수로 읽어온 다음 preg_match_all 함수를 사용하여 모든 문장 부호를 일치시키고 이를 배열에 저장할 수 있습니다.

$text = file_get_contents('article.txt');
preg_match_all('/[,.?!;:]/', $text, $matches);
$counts = array_count_values($matches[0]);
print_r($counts);

위 코드에서 우리는 텍스트 파일에서 텍스트를 읽고 정규식 '/[,.?!;:]/'를 사용하여 그 안의 모든 구두점을 일치시킵니다. 그런 다음 PHP 내장 함수 array_count_values를 사용하여 다양한 문장 부호의 발생 횟수를 계산합니다. 마지막으로 print_r 함수를 사용하여 통계 결과를 출력합니다.

텍스트 파일 Article.txt에 다음 내용이 포함되어 있는 경우:

잘 지내세요, 감사합니다. 제 이름은 Mike입니다.

그러면 위 코드의 출력이 나옵니다. will be :

Array
(
    [,] => 2
    [.] => 3
    [?] => 2
)

위 텍스트에 쉼표 2개, 마침표 3개, 물음표 2개가 사용되었다는 의미입니다.

4. 요약

이 글에서는 일반 구두점, 줄임표, 큰따옴표, 작은따옴표 등 다양한 구두점을 일치시키기 위해 정규식을 사용하는 방법을 소개합니다. 실제 사례의 시연을 통해 정규식을 사용하면 다양한 텍스트 데이터를 쉽고 효율적으로 처리할 수 있어 프로그램 개발에 많은 편의성을 가져다 주는 것을 확인할 수 있습니다. 실제 개발에서는 실제 요구에 따라 적절한 방법을 선택하고 정규식의 기능을 최대한 활용할 수 있습니다.

위 내용은 PHP 정규식 전투: 구두점 일치의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.