首頁  >  文章  >  後端開發  >  php怎麼偵測一個字串有幾個中文

php怎麼偵測一個字串有幾個中文

青灯夜游
青灯夜游原創
2022-09-22 18:55:543644瀏覽

偵測步驟:1、使用preg_replace()函數來配合正規表示式過濾字串,去掉字串中的非中文字母,語法「preg_replace("/[^\x{4E00}-\x{ 9FFF}] /u",'', 原始字串)”,會傳回包含全部中文字母的字串;2、使用mb_strlen()函數計算過濾字串的長度(中文字元的個數)即可,語法「mb_strlen(過濾字串,"utf-8")」。

php怎麼偵測一個字串有幾個中文

本教學操作環境:windows7系統、PHP8.1版、DELL G3電腦

在php中,可以使用preg_replace()函數和mb_strlen()函數來偵測一個字串有幾個中文。

實作步驟:

步驟1:使用preg_replace()函數來配合正規表示式過濾字串,去掉字串中的非中文字母

preg_replace()刪除原理:利用正規表示式搜尋字串中的非中文字母,並將其替換成空字元''。

<?php
header("Content-type:text/html;charset=utf-8");
$str = "欢迎4546来到php这里。zblog,我的?#$%^天呀&())*(&^";
echo "原字符串:";
var_dump($str);
$pattern = "/[^\x{4E00}-\x{9FFF}]+/u";
echo "过滤字符串后:";
$newStr=preg_replace($pattern,&#39;&#39;, $str);
var_dump($newStr);
?>

會傳回包含全部中文字母的字串

php怎麼偵測一個字串有幾個中文

#步驟2:使用mb_strlen()函數計算過濾字串的長度(中文字元的個數)

$len=mb_strlen($newStr,"utf-8");
echo "中文字符的个数:".$len;

php怎麼偵測一個字串有幾個中文

說明:

preg_replace():

##preg_replace() 函數可以執行正規表示式的搜尋和替換,是一個強大的字串替換處理函數,該函數的語法格式如下:

preg_replace($pattern, $replacement, $subject [, $limit = -1 [, &$count]])

參數說明如下:

$pattern:要搜尋的模式,可以使字串或字串陣列;

$replacement:用於替換的字串或字串陣列。如果這個參數是一個字串,而 $pattern 是一個數組,那麼所有的模式都使用這個字串進行替換。如果 $pattern 和 $replacement 都是數組,每個 $pattern 使用 $replacement 中對應的元素進行替換。如果 $replacement 中的元素比 $pattern 中的少,多出來的 $pattern 使用空字串進行替換。

$subject:要進行搜尋和替換的字串或字串數組,如果$subject 是一個數組,搜尋和替換回在$subject 的每一個元素上進行, 並且返回值也會是一個數組。

$limit:可選參數,每個模式在每個 $subject 上進行替換的最大次數。預設是 -1(無限)。 $count:可選參數,如果指定,將會被填入完成的替換次數。

######如果 $subject 是一個數組,preg_replace() 函數會傳回一個數組,在其他情況下會傳回字串。 ######如果函數 preg_replace() 搜尋到符合項,則會傳回被取代後的 $subject,否則傳回沒有改變的 $subject。 preg_replace() 函數的每個參數(除了參數 $limit)可以是一個陣列。如果參數 $pattern 和參數 $replacement 都是數組,那麼函數將以其鍵名在數組中出現的順序來進行處理。如果發生錯誤,則傳回 NULL。 ######參數 $replacement 中可以包含後向引用 \\n 或 $n,語法上首選後者。每個這樣的引用將被匹配到的第 n 個捕獲子組捕獲到的文本替換。 n 可以是 0-99,\\0 和 $0 代表完整的模式匹配文字。 ######捕獲子組的序號計數方式為:代表捕獲子組的左括號從左到右,從 1 開始數。如果要在$replacement 中使用反斜線,必須使用4 個("\\\\" 因為這首先是php 的字串,經過轉義後是兩個,再經過正規表示式引擎後才被認為是一個原文反斜線)。 ######當在替換模式下工作並且後向引用後面緊跟著需要是另外一個數字(比如:在一個匹配模式後緊接著增加一個原文數字),不能使用\\1 這樣的語法來描述後向引用。例如,\\11 將會使 preg_replace() 無法理解你希望的是一個 \\1 後向引用緊接一個原文 1,還是一個 \\11 後向引用後面不跟任何東西。這種情況下解是使用 ${1}1。這創建了一個獨立的 $1 後向引用,一個獨立的原文 1。 ######當使用被棄用的e 修飾符時,這個函數會轉義一些字元(即:'、"、\ 和NULL)然後進行後向引用替換。當這些完成後請確保後向引用解析完後沒有單引號或雙引號引起的語法錯誤(例如:'strlen(\'$1\') strlen("$2")')。確保符合PHP 的字串語法,並且符合eval 語法。因為在完成替換後,引擎會將結果字串作為php 程式碼使用eval 方式進行評估並將傳回值作為最終參與替換的字串。########mb_strlen()函數######

mb_strlen()函数可以计算英文字符串、中文字符串或中英混合字符串的长度。

mb_strlen($str [, $encoding = mb_internal_encoding()])
  • $str 为需要计算长度的字符串

  • $encoding 是可选参数,为字符编码,如果省略则使用内部字符编码。

mb_strlen() 函数的返回值为具有 $encoding 编码的字符串 $str 所包含的字符数,如果 $encoding 无效则返回 false。

注意:在 mb_strlen() 函数中,无论是汉字,还是英文、数字、小数点、下划线和空格,都只占一个字符长度。

推荐学习:《PHP视频教程

以上是php怎麼偵測一個字串有幾個中文的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn