>  기사  >  백엔드 개발  >  PHP에서 한자가 아닌 문자를 제거하는 방법

PHP에서 한자가 아닌 문자를 제거하는 방법

青灯夜游
青灯夜游원래의
2022-04-24 14:32:101575검색

PHP에서 중국어가 아닌 문자를 제거하는 방법: 정규식과 함께 preg_replace() 함수를 사용하여 문자열에서 중국어가 아닌 문자를 검색하고 이를 빈 문자로 바꿉니다. 구문은 "preg_replace("/[^x{)입니다. 4E00}-x{9FFF}]+/u",'', $str)".

PHP에서 한자가 아닌 문자를 제거하는 방법

이 튜토리얼의 운영 환경: Windows 7 시스템, PHP 버전 7.1, DELL G3 컴퓨터

PHP에서는 preg_replace() 함수를 정규 표현식과 함께 사용하여 문자열에서 중국어가 아닌 문자를 제거할 수 있습니다. .

정규식은 다음과 같습니다: /[^x{4E00}-x{9FFF}]+/u/[^x{4E00}-x{9FFF}]+/u

preg_replace()删除原理:利用正则表达式搜索字符串中的非中文字母,并将其替换成空字符''

preg_replace() 삭제 원칙: 정규식을 사용하여 문자열 검색 한자를 빈 문자 ''로 바꿉니다.

구현예: PHP에서 한자가 아닌 문자를 제거하는 방법

<?php
header(&#39;content-type:text/html;charset=utf-8&#39;);   
$str= &#39;php中文网!-=1548&#39;;
$pattern = "/[^\x{4E00}-\x{9FFF}]+/u";
echo preg_replace($pattern,&#39;&#39;, $str);
?>

설명: preg_replace():

preg_replace() 함수는 정규식 검색 및 치환을 수행할 수 있으며, 이 함수의 구문 형식은 다음과 같습니다. :

preg_replace($pattern, $replacement, $subject [, $limit = -1 [, &$count]])
    매개변수 설명은 다음과 같습니다.
  • $pattern: 검색할 패턴. 문자열 또는 문자열 배열일 수 있습니다.
  • $replacement: 대체에 사용되는 문자열 또는 문자열 배열입니다. 이 인수가 문자열이고 $pattern이 배열이면 모든 패턴이 이 문자열로 대체됩니다. $pattern과 $replacement가 모두 배열인 경우 각 $pattern은 $replacement의 해당 요소로 대체됩니다. $pattern보다 $replacement에 요소가 더 적은 경우 추가 $pattern이 빈 문자열로 대체됩니다.
  • $subject: 검색하고 바꿀 문자열 또는 문자열 배열입니다. $subject가 배열인 경우 $subject의 각 요소에 대해 검색 및 바꾸기가 수행되고 반환 값도 배열이 됩니다.
  • $limit: 선택적 매개변수, 각 $subject의 패턴당 최대 대체 수입니다. 기본값은 -1(무한)입니다.
$count: 선택적 매개변수가 지정된 경우 완료된 대체 수로 채워집니다.

$subject가 배열이면 preg_replace() 함수는 배열을 반환하고, 그렇지 않으면 문자열을 반환합니다.

preg_replace() 함수가 일치하는 항목을 찾으면 대체된 $subject를 반환하고, 그렇지 않으면 변경되지 않은 $subject를 반환합니다. preg_replace() 함수의 각 매개변수($limit 매개변수 제외)는 배열일 수 있습니다. $pattern 매개변수와 $replacement 매개변수가 모두 배열인 경우 함수는 배열에 나타나는 순서대로 키를 처리합니다. 오류가 발생하면 NULL이 반환됩니다.

$replacement 매개변수에는 역참조 \n 또는 $n이 포함될 수 있으며, 구문상 후자가 선호됩니다. 이러한 각 참조는 일치된 n번째 캡처 하위 그룹에 의해 캡처된 텍스트로 대체됩니다. n은 0-99일 수 있으며, \0 및 $0은 텍스트와 일치하는 완전한 패턴을 나타냅니다.

하위 그룹 캡처의 일련 번호 계산 방법은 다음과 같습니다. 캡처 하위 그룹을 나타내는 왼쪽 괄호는 1부터 시작하여 왼쪽에서 오른쪽으로 계산됩니다. $replacement에 백슬래시를 사용하려면 4(먼저 PHP 문자열이므로 "\\", 이스케이프 후 2개, 정규식 엔진 백슬래시를 통과한 후 원본 텍스트로 간주되므로 "\\")를 사용해야 합니다.

대체 모드에서 작업하고 역참조 뒤에 다른 숫자가 와야 하는 경우(예: 일치하는 패턴 바로 뒤에 원래 숫자 추가) \1과 같은 구문을 사용하여 역참조를 설명할 수 없습니다. 예를 들어, \11은 preg_replace()가 \1 역참조 뒤에 원래 1이 오는지, 아니면 \11 역참조 뒤에 아무 것도 나오지 않는지 이해할 수 없게 만듭니다. 이 경우 해결책은 ${1}1을 사용하는 것입니다. 이렇게 하면 소스 1에 대한 별도의 역참조인 $1에 대한 별도의 역참조가 생성됩니다.

더 이상 사용되지 않는 e 수정자를 사용하는 경우 이 함수는 일부 문자(예: ', " 및 NULL)를 이스케이프한 다음 역참조 대체를 수행합니다. 이 작업이 완료되면 단일로 인한 구문 오류를 구문 분석한 후 역참조가 없는지 확인하세요. 따옴표 또는 큰따옴표(예: 'strlen('$1')+strlen("$2")') PHP의 문자열 구문을 준수하고 교체가 완료되면 엔진이 사용됩니다. 결과 문자열을 PHP 코드로 평가하고 반환 값을 대체할 최종 문자열로 사용하는 eval 메서드. PHP 비디오 튜토리얼"

위 내용은 PHP에서 한자가 아닌 문자를 제거하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.