兩種方法:1、用preg_match_all()配合正規過濾字串,語法「preg_match_all("/[\x{4e00}-\x{9fff}] /u","$str", $arr);」;2、用preg_replace()配合正規搜尋字串中的非中文字母,並將其替換成空字符,語法「preg_replace("/[^\x{4E00}-\x{9FFF} ] /u",'',$str)」。
本教學操作環境:windows7系統、PHP8.1版、DELL G3電腦
在php中,可以利用以下兩種函數來只提取字串的中文字元
preg_replace()函數
preg_match_all()函數
#方法1:使用preg_match_all()函數
preg_match_all()函數來配合正規表示式「/[\x{4e00}-\x {9fff}] /u
」可以過濾字串,只取得中文字元。
會將符合的中文字元一個個存入數組中(該陣列由第三個參數指定)。
<?php header("Content-type:text/html;charset=utf-8"); $str = "欢迎4546来到php这里。zblog,我的?#$%^天呀&())*(&^"; echo $str; preg_match_all("/[\x{4e00}-\x{9fff}]+/u","$str",$arr); var_dump($arr); ?>
然後可以使用join()函數將結果值拼接成一個字串。
join('',$arr[0])
說明:
1)preg_match_all()函數
preg_match_all()函數會搜尋字串中所有可以和正規表示式匹配的結果
preg_match_all(pattern,subject,matches,flags,offset)
參數說明如下:
preg_match_all() 函數可以傳回 pattern 的符合次數(可能是 0),如果發生錯誤則傳回 FALSE。
2)join()函數
join() 函數傳回由陣列元素組合成的字串。
join() 函數是 implode() 函數的別名。
join(separator,array)
separator:可選。規定數組元素之間放置的內容。預設是 ""(空字串)。
array:必要。要組合為字串的陣列。
傳回值:傳回一個由陣列元素組合成的字串。
方法2:使用preg_replace()函數
#preg_match_all()函數來配合正規表示式「/[^\x{ 4E00}-\x{9FFF}] /u
」搜尋字串中的非中文字母,並將其替換成空字元''
即可。
<?php header("Content-type:text/html;charset=utf-8"); $str= 'php中文网!-=1548'; echo $str."<br>"; $pattern = "/[^\x{4E00}-\x{9FFF}]+/u"; $newstr=preg_replace($pattern,'', $str);preg_match_all("/[\x{4e00}-\x{9fff}]+/u","$str",$arr); var_dump($newstr); ?>
說明:preg_replace()
preg_replace() 函數可以執行正規表示式的搜尋和替換,是個強大的字串替換處理函數,函數的語法格式如下:
preg_replace($pattern, $replacement, $subject [, $limit = -1 [, &$count]])
參數說明如下:
如果 $subject 是一個數組,preg_replace() 函數會傳回一個數組,在其他情況下會傳回字串。
如果函數 preg_replace() 搜尋到符合項,則會傳回被取代後的 $subject,否則傳回沒有改變的 $subject。 preg_replace() 函數的每個參數(除了參數 $limit)可以是一個陣列。如果參數 $pattern 和參數 $replacement 都是數組,那麼函數將以其鍵名在數組中出現的順序來進行處理。如果發生錯誤,則傳回 NULL。
參數 $replacement 中可以包含後向引用 \\n 或 $n,語法上首選後者。每個這樣的引用將被匹配到的第 n 個捕獲子組捕獲到的文本替換。 n 可以是 0-99,\\0 和 $0 代表完整的模式匹配文字。
推薦學習:《PHP影片教學》
以上是php字串怎麼只提取中文字符的詳細內容。更多資訊請關注PHP中文網其他相關文章!