>  기사  >  백엔드 개발  >  PHP에서 문자열에 포함된 한자 수를 감지하는 방법

PHP에서 문자열에 포함된 한자 수를 감지하는 방법

青灯夜游
青灯夜游원래의
2022-09-22 18:55:543670검색

탐지 단계: 1. 정규 표현식과 함께 preg_replace() 함수를 사용하여 문자열을 필터링하고 문자열에서 중국어가 아닌 문자를 제거합니다. 구문은 "preg_replace("/[^x{4E00}-x{9FFF}]입니다. +/u ",'', 원래 문자열)"은 모든 중국어 문자를 포함하는 문자열을 반환합니다. 2. mb_strlen() 함수를 사용하여 필터 문자열의 길이(한자 수)를 계산하고 구문 "mb_strlen(filter) 문자열, "utf-8")".

PHP에서 문자열에 포함된 한자 수를 감지하는 방법

이 튜토리얼의 운영 환경: Windows 7 시스템, PHP 버전 8.1, DELL G3 컴퓨터

PHP에서는 preg_replace() 함수와 mb_strlen() 함수를 사용하여 문자열에 중국어 문자 수를 감지할 수 있습니다. 포함되어 있습니다.

구현 단계:

1단계: 정규 표현식과 함께 preg_replace() 함수를 사용하여 문자열을 필터링하고 문자열에서 중국어가 아닌 문자를 제거합니다.

preg_replace() 삭제 원칙: 정규 표현식을 사용하여 검색 문자열에서 중국어가 아닌 문자를 null 문자 ''로 바꿉니다.

<?php
header("Content-type:text/html;charset=utf-8");
$str = "欢迎4546来到php这里。zblog,我的?#$%^天呀&())*(&^";
echo "原字符串:";
var_dump($str);
$pattern = "/[^\x{4E00}-\x{9FFF}]+/u";
echo "过滤字符串后:";
$newStr=preg_replace($pattern,&#39;&#39;, $str);
var_dump($newStr);
?>

는 모든 중국어 문자가 포함된 문자열을 반환합니다.

PHP에서 문자열에 포함된 한자 수를 감지하는 방법

2단계: mb_strlen() 함수를 사용하여 필터링된 문자열의 길이(한자 수)를 계산합니다.

$len=mb_strlen($newStr,"utf-8");
echo "中文字符的个数:".$len;

PHP에서 문자열에 포함된 한자 수를 감지하는 방법

지침 :

preg_replace():

preg_replace() 함수는 정규식 검색 및 치환을 수행할 수 있는 강력한 문자열 대체 처리 함수입니다.

preg_replace($pattern, $replacement, $subject [, $limit = -1 [, &$count]])

매개변수 설명입니다.

  • $pattern: 검색할 패턴으로, 문자열 또는 문자열 배열일 수 있습니다.
  • $replacement: 대체에 사용되는 문자열 또는 문자열 배열입니다. 이 인수가 문자열이고 $pattern이 배열이면 모든 패턴이 이 문자열로 대체됩니다. $pattern과 $replacement가 모두 배열인 경우 각 $pattern은 $replacement의 해당 요소로 대체됩니다. $pattern보다 $replacement에 요소가 더 적은 경우 추가 $pattern이 빈 문자열로 대체됩니다.
  • $subject: 검색하고 바꿀 문자열 또는 문자열 배열입니다. $subject가 배열인 경우 $subject의 각 요소에 대해 검색 및 바꾸기가 수행되고 반환 값도 배열이 됩니다.
  • $limit: 선택적 매개변수, 각 $subject의 패턴당 최대 대체 수입니다. 기본값은 -1(무한)입니다.
  • $count: 선택적 매개변수가 지정된 경우 완료된 대체 수로 채워집니다.

$subject가 배열이면 preg_replace() 함수는 배열을 반환하고, 그렇지 않으면 문자열을 반환합니다.

preg_replace() 함수가 일치하는 항목을 찾으면 대체된 $subject를 반환하고, 그렇지 않으면 변경되지 않은 $subject를 반환합니다. preg_replace() 함수의 각 매개변수($limit 매개변수 제외)는 배열일 수 있습니다. $pattern 매개변수와 $replacement 매개변수가 모두 배열인 경우 함수는 배열에 나타나는 순서대로 키를 처리합니다. 오류가 발생하면 NULL이 반환됩니다.

$replacement 매개변수에는 역참조 \n 또는 $n이 포함될 수 있으며, 구문상 후자가 선호됩니다. 이러한 각 참조는 일치된 n번째 캡처 하위 그룹에 의해 캡처된 텍스트로 대체됩니다. n은 0-99일 수 있으며, \0 및 $0은 텍스트와 일치하는 완전한 패턴을 나타냅니다.

하위 그룹 캡처의 일련 번호 계산 방법은 다음과 같습니다. 캡처 하위 그룹을 나타내는 왼쪽 괄호는 1부터 시작하여 왼쪽에서 오른쪽으로 계산됩니다. $replacement에 백슬래시를 사용하려면 4(먼저 PHP 문자열이므로 "\\", 이스케이프 후 2개, 정규식 엔진 백슬래시를 통과한 후 원본 텍스트로 간주되므로 "\\")를 사용해야 합니다.

대체 모드에서 작업하고 역참조 뒤에 다른 숫자가 와야 하는 경우(예: 일치하는 패턴 바로 뒤에 원래 숫자 추가) \1과 같은 구문을 사용하여 역참조를 설명할 수 없습니다. 예를 들어, \11은 preg_replace()가 \1 역참조 뒤에 원래 1이 오는지, 아니면 \11 역참조 뒤에 아무 것도 나오지 않는지 이해할 수 없게 만듭니다. 이 경우 해결책은 ${1}1을 사용하는 것입니다. 이렇게 하면 소스 1에 대한 별도의 역참조인 $1에 대한 별도의 역참조가 생성됩니다.

더 이상 사용되지 않는 e 수정자를 사용하는 경우 이 함수는 일부 문자(예: ', " 및 NULL)를 이스케이프한 다음 역참조 대체를 수행합니다. 이 작업이 완료되면 단일로 인한 구문 오류를 구문 분석한 후 역참조가 없는지 확인하세요. 따옴표 또는 큰따옴표(예: 'strlen('$1')+strlen("$2")') PHP의 문자열 구문을 준수하고 교체가 완료되면 엔진이 사용됩니다. 결과 문자열을 PHP 코드로 평가하고 반환 값을 대체

mb_strlen() 함수

와 관련된 최종 문자열로 사용하는 평가 메서드입니다.

mb_strlen()函数可以计算英文字符串、中文字符串或中英混合字符串的长度。

mb_strlen($str [, $encoding = mb_internal_encoding()])
  • $str 为需要计算长度的字符串

  • $encoding 是可选参数,为字符编码,如果省略则使用内部字符编码。

mb_strlen() 函数的返回值为具有 $encoding 编码的字符串 $str 所包含的字符数,如果 $encoding 无效则返回 false。

注意:在 mb_strlen() 函数中,无论是汉字,还是英文、数字、小数点、下划线和空格,都只占一个字符长度。

推荐学习:《PHP视频教程

위 내용은 PHP에서 문자열에 포함된 한자 수를 감지하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.