>  기사  >  백엔드 개발  >  PHP 문자열에서 한자만 추출하는 방법

PHP 문자열에서 한자만 추출하는 방법

青灯夜游
青灯夜游원래의
2022-09-22 19:44:534420검색

두 가지 방법: 1. 일반 필터 문자열과 함께 preg_match_all()을 사용합니다. 구문은 "preg_match_all("/[x{4e00}-x{9fff}]+/u","$str",$arr);"입니다. 2. 일반 검색 문자열과 함께 preg_replace()를 사용하여 문자열에서 중국어가 아닌 문자를 검색하고 이를 빈 문자로 바꿉니다. 구문은 "preg_replace("/[^x{4E00}-x{9FFF}]+입니다. /u",' ',$str)".

PHP 문자열에서 한자만 추출하는 방법

이 튜토리얼의 운영 환경: Windows 7 시스템, PHP 버전 8.1, DELL G3 컴퓨터

PHP에서는 다음 두 함수를 사용하여

  • preg_replace 문자열의 한자만 추출할 수 있습니다. () 함수

  • preg_match_all() 함수

방법 1: preg_match_all() 함수

preg_match_all() 함수를 사용하여 정규 표현식 "/[x{4e00}- x{9fff}] +/u"는 문자열을 필터링하고 중국어 문자만 가져올 수 있습니다. /[x{4e00}-x{9fff}]+/u”可以过滤字符串,只获取中文字符。

会将匹配的中文字符一个个存入数组中(该数组由第三个参数指定)。

<?php
header("Content-type:text/html;charset=utf-8");
$str = "欢迎4546来到php这里。zblog,我的?#$%^天呀&())*(&^";
echo $str;
preg_match_all("/[\x{4e00}-\x{9fff}]+/u","$str",$arr);
var_dump($arr);
?>

PHP 문자열에서 한자만 추출하는 방법

然后可以使用join()函数将结果值拼接成一个字符串。

join(&#39;&#39;,$arr[0])

PHP 문자열에서 한자만 추출하는 방법

说明:

1)preg_match_all()函数

preg_match_all()函数会搜索字符串中所有可以和正则表达式匹配的结果

preg_match_all(pattern,subject,matches,flags,offset)

参数说明如下:

  • pattern:要搜索的模式,也就是定义好的正则表达式;
  • subject:要搜索的字符串;
  • matches:可选参数(多维数组),用来存放所有匹配的结果, 数组排序通过 $flags 指定;
  • flags:可选参数,可以结合下面几个标记使用(注意不能同时使用 PREG_PATTERN_ORDER 和 PREG_SET_ORDER):
    • PREG_PATTERN_ORDER:结果排序为 $matches[0] 保存完整模式的所有匹配,$matches[1] 保存第一个子组的所有匹配,以此类推。
    • PREG_SET_ORDER:结果排序为 $matches[0] 包含第一次匹配得到的所有匹配(包含子组), $matches[1] 是包含第二次匹配到的所有匹配(包含子组)的数组,以此类推。
    • PREG_OFFSET_CAPTURE:如果这个标记被传递,每个发现的匹配返回时会增加它相对目标字符串的偏移量。注意这会改变 $matches 中的每一个匹配结果字符串元素,使其成为一个第 0 个元素为匹配结果字符串,第 1 个元素为匹配结果字符串在 subject 中的偏移量。
  • offset:可选参数,$offset 用于从目标字符串中指定位置开始搜索(单位是字节)。

preg_match_all() 函数可以返回 pattern 的匹配次数(可能是 0),如果发生错误则返回 FALSE。

2)join()函数

join() 函数返回一个由数组元素组合成的字符串。

join() 函数是 implode() 函数的别名。

join(separator,array)
  • separator:可选。规定数组元素之间放置的内容。默认是 ""(空字符串)。

  • array:必需。要组合为字符串的数组。

返回值:返回一个由数组元素组合成的字符串。    

方法2:使用preg_replace()函数

preg_match_all()函数配合正则表达式“/[^x{4E00}-x{9FFF}]+/u”搜索字符串中的非中文字母,并将其替换成空字符''

일치하는 한자가 하나씩 배열에 저장됩니다. (배열은 세 번째 매개변수로 지정됩니다.)

<?php
header("Content-type:text/html;charset=utf-8");
$str= &#39;php中文网!-=1548&#39;;
echo $str."<br>";
$pattern = "/[^\x{4E00}-\x{9FFF}]+/u";
$newstr=preg_replace($pattern,&#39;&#39;, $str);preg_match_all("/[\x{4e00}-\x{9fff}]+/u","$str",$arr);
var_dump($newstr);
?>
PHP 문자열에서 한자만 추출하는 방법PHP 문자열에서 한자만 추출하는 방법

그런 다음 결과 값은 Join() 함수를 사용하여 문자열로 연결될 수 있습니다.

preg_replace($pattern, $replacement, $subject [, $limit = -1 [, &$count]])
PHP 문자열에서 한자만 추출하는 방법

지침:

🎜1) preg_match_all() 함수 🎜🎜preg_match_all() 함수는 문자열에서 정규식과 일치할 수 있는 모든 결과를 검색합니다. 🎜rrreee🎜매개변수 설명은 다음과 같습니다. 🎜
    🎜pattern: the 🎜🎜subject: 검색할 문자열 🎜🎜matches: 일치하는 모든 결과를 저장하는 데 사용되는 선택적 매개변수(다차원 배열), 배열 정렬은 $flags로 지정됩니다. 🎜flags: 다음 태그와 함께 사용할 수 있는 선택적 매개변수(PREG_PATTERN_ORDER 및 PREG_SET_ORDER는 동시에 사용할 수 없음):
      🎜PREG_PATTERN_ORDER: 결과는 $matches[0]로 정렬되어 모두 저장됩니다. 전체 패턴 일치, $matches[1] 하위 그룹의 첫 번째 모든 일치 항목 저장 등. 🎜🎜PREG_SET_ORDER: 결과는 $matches[0]에 첫 번째 일치에서 얻은 모든 일치(하위 그룹 포함)가 포함되어 있고 $matches[1]는 두 번째 일치에서 얻은 모든 일치(하위 그룹 포함)가 포함된 배열이므로 정렬됩니다. 에. 🎜🎜PREG_OFFSET_CAPTURE: 이 플래그가 전달되면 발견된 각 일치 항목이 대상 문자열을 기준으로 증가된 오프셋과 함께 반환됩니다. 이렇게 하면 $matches의 각 일치 문자열 요소가 0번째 요소가 일치 문자열이고 첫 번째 요소가 주제 내 일치 문자열의 오프셋인 요소로 변경됩니다. 🎜🎜🎜🎜offset: 선택적 매개변수인 $offset은 대상 문자열의 지정된 위치부터 검색을 시작하는 데 사용됩니다(단위는 바이트). 🎜🎜🎜preg_match_all() 함수는 패턴에 대한 일치 수(아마도 0)를 반환하거나, 오류가 발생하면 FALSE를 반환할 수 있습니다. 🎜🎜2) Join() 함수 🎜🎜join() 함수는 배열 요소로 구성된 문자열을 반환합니다. 🎜🎜join() 함수는 implode() 함수의 별칭입니다. 🎜rrreee🎜🎜🎜구분 기호: 선택 사항입니다. 배열 요소 사이에 무엇을 배치할지 지정합니다. 기본값은 ""(빈 문자열)입니다. 🎜🎜🎜🎜배열: 필수입니다. 문자열로 결합할 배열입니다. 🎜🎜🎜🎜반환값: 배열 요소로 구성된 문자열을 반환합니다. 🎜🎜🎜🎜방법 2: 정규식 "/[^x{4E00}-x{9FFF}]+/u"와 함께 preg_replace() 함수 🎜🎜🎜🎜preg_match_all() 함수를 사용합니다. 문자열에서 중국어가 아닌 문자를 검색하여 빈 문자 ''로 바꿉니다. 🎜rrreee🎜🎜🎜🎜🎜설명: preg_replace()🎜🎜🎜preg_replace() 함수는 정규식 검색 및 교체를 수행할 수 있습니다. 이 함수의 구문 형식은 다음과 같습니다. 지침은 다음과 같습니다: 🎜
      • $pattern: 검색할 패턴으로, 문자열 또는 문자열 배열일 수 있습니다.
      • $replacement: 대체에 사용되는 문자열 또는 문자열 배열입니다. 이 인수가 문자열이고 $pattern이 배열이면 모든 패턴이 이 문자열로 대체됩니다. $pattern과 $replacement가 모두 배열인 경우 각 $pattern은 $replacement의 해당 요소로 대체됩니다. $pattern보다 $replacement에 요소가 더 적은 경우 추가 $pattern이 빈 문자열로 대체됩니다.
      • $subject: 검색하고 바꿀 문자열 또는 문자열 배열입니다. $subject가 배열인 경우 $subject의 각 요소에 대해 검색 및 바꾸기가 수행되고 반환 값도 배열이 됩니다.
      • $limit: 선택적 매개변수, 각 $subject의 패턴당 최대 대체 수입니다. 기본값은 -1(무한)입니다.
      • $count: 선택적 매개변수가 지정된 경우 완료된 대체 수로 채워집니다.

      $subject가 배열이면 preg_replace() 함수는 배열을 반환하고, 그렇지 않으면 문자열을 반환합니다.

      preg_replace() 함수가 일치하는 항목을 찾으면 대체된 $subject를 반환하고, 그렇지 않으면 변경되지 않은 $subject를 반환합니다. preg_replace() 함수의 각 매개변수($limit 매개변수 제외)는 배열일 수 있습니다. $pattern 매개변수와 $replacement 매개변수가 모두 배열인 경우 함수는 배열에 나타나는 순서대로 키를 처리합니다. 오류가 발생하면 NULL이 반환됩니다.

      $replacement 매개변수에는 역참조 \n 또는 $n이 포함될 수 있으며, 구문상 후자가 선호됩니다. 이러한 각 참조는 일치된 n번째 캡처 하위 그룹에 의해 캡처된 텍스트로 대체됩니다. n은 0-99일 수 있으며, \0 및 $0은 텍스트와 일치하는 완전한 패턴을 나타냅니다.

      추천 학습: "PHP 비디오 튜토리얼"

위 내용은 PHP 문자열에서 한자만 추출하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.