>백엔드 개발 >PHP 튜토리얼 >인용문을 그대로 유지하면서 문자열을 단어로 분할하려면 어떻게 해야 합니까?

인용문을 그대로 유지하면서 문자열을 단어로 분할하려면 어떻게 해야 합니까?

Linda Hamilton
Linda Hamilton원래의
2024-12-12 16:20:09872검색

How Can I Split a String into Words While Keeping Quoted Phrases Intact?

따옴표 붙은 문구를 유지하면서 문자열 분할

이 작업은 인용문을 사용하는 고유한 요구 사항에 따라 주어진 문자열을 단어 배열로 분해하는 것입니다. 구문은 단일 단위로 처리됩니다.

이를 달성하기 위한 한 가지 접근 방식은 정규식 일치를 활용하는 것입니다. 인용된 문구와 개별 단어를 모두 캡처하는 데 적합한 패턴은 다음과 같습니다.

"(?:\.|[^\"])*"|\S+

이 패턴은 대체 연산자(|)로 구분된 두 부분으로 구성됩니다.

  1. "(?: \.|[^\"])*": 큰따옴표(")로 묶인 문자열과 일치합니다. 또한 비캡처 그룹 1을 사용하여 인용된 텍스트 내의 이스케이프된 따옴표()를 설명합니다.
  2. S: 이는 개별 단어를 나타내는 하나 이상의 공백이 아닌 문자와 일치합니다.

PHP에서 이 패턴을 사용하려면 preg_match_all(...)을 사용할 수 있습니다.

$text = 'Lorem ipsum "dolor sit amet" consectetur "adipiscing \"elit" dolor';
preg_match_all('/"(?:\.|[^\"])*"|\S+/', $text, $matches);

이렇게 하면 $matches 배열은 캡처된 모든 일치 항목의 배열입니다. 여기서 인용된 문구는 단일 요소로 분리됩니다.

예를 들어 제공된 입력 문자열의 경우:

Lorem ipsum "dolor sit amet" consectetur "adipiscing \"elit" dolor

preg_match_all( ...) 다음과 같습니다.

Array
(
    [0] => Array
        (
            [0] => Lorem
            [1] => ipsum
            [2] => "dolor sit amet"
            [3] => consectetur
            [4] => "adipiscing \"elit"
            [5] => dolor
        )
)

위 내용은 인용문을 그대로 유지하면서 문자열을 단어로 분할하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.