PCRE/PHP에서 유니코드 문자 일치 난제 디코딩
개발자는 PHP에서 PCRE를 사용하여 이름을 확인하는 데 어려움을 겪었습니다. 특히 ASCII가 아닌 경우에는 더욱 그렇습니다. Ă 또는 张 같은 문자. 초기 패턴인 "/^([p{L}'- ]) $/"는 이러한 문자를 캡처하지 못하여 패턴이나 입력 처리가 원인일 수 있다는 의혹을 불러일으켰습니다.
문제를 명확히 하고 패턴을 살펴보겠습니다. p{L}은 모든 유니코드 문자에 대한 유니코드 문자 속성 약어입니다. 그러나 올바르게 작동하려면 UTF-8 모드가 필요합니다. 기본적으로 PHP는 대소문자를 구분하고 유니코드가 아닌 모드로 작동합니다.
알고 보니 개발자는 패턴에 "u" 수정자를 지정하는 것을 무시했습니다. 이 수정자는 유니코드 지원을 활성화하여 p{L}과 같은 문자 속성이 의도한 대로 작동하도록 허용합니다.
문제를 해결하려면 다음과 같이 패턴을 업데이트하세요.
$namePattern = '/^[-\' \p{L}]+$/u';
"u" 수정자를 추가하여 을 사용하면 이제 패턴이 ASCII가 아닌 알파벳 문자를 포함하여 유니코드 문자 문자와 정확하게 일치하므로 Ă 및 张 같은 문자가 포함된 이름을 성공적으로 확인할 수 있습니다.
위 내용은 내 PCRE 패턴이 PHP의 유니코드 문자와 일치하지 않는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!