UTF-8漢字正規表示式-php教程-PHP中文網

首頁

後端開發

php教程

UTF-8漢字正規表示式

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Aug 08, 2016 am 09:19 AM

fontmatchnbspphpstr

原文連結：http://blog.csdn.net/wide288/article/details/30066639

$str = "程式設計";
// if(!preg_match("/^[x{4e00}-x{9fa5 }A-Za-z0-9_]+$/u",$str)) //UTF-8漢字字母數字底線正規表示式
if(!preg_match("/^[x{4e00}-x{9fa5} ]+$/u",$str)) //UTF-8漢字字母數字底線正規表示式
{
echo "您輸入的[".$str."]含有違規字元 font>";
}
else
{
echo "您輸入的[ -------------------

UTF-8符合:

在javascript中，要判斷字串是中文是很簡單的。例如： var str = "php程式設計"; if (/^[u4e00-u9fa5]+$/.test(str)) { alert("該字串全部是中文"); } else{ alert("該字串不全部是中文"); }

php中，是用x表示十六進位資料的。於是，變換成如下的程式碼： $str = "php程式設計"; if (preg_match("/^[x4e00-x9fa5]+$/",$str)) { print("該字串全部是中文"); } else { print("該字串不全部是中文"); } 似乎不報錯了，判斷的結果也正確，不過把$str換成“編程”兩字，結果卻還是顯示“該字符串不全部是中文”，看來這樣的判斷還是不夠準確。

重要:查閱了發現,對於[x4e00-x9fa5]這塊東西,自己做一個強化的解釋

php的正則中, [x4e00-x9fa5],其實就是字符和字符組的概念, x{hex},表達一個16進位數, 需要注意的是hex 可以是1-2位的,也可以是4位的,但是如果是4位的必須加上大括號,
同時,如果是大於x{FF}的hex,必須和u 修飾符連用,不然會非法出錯
網上只能找到匹配全角字符的正則: ^[x80-xff]*^/ ,這裡可以不加大括號[u4e00-u9fa5]可以匹配中文,但是PHP又不支援不過，既然x表示的十六進位數據，為什麼和js裡邊提供的範圍x4e00-x9fa5不一樣呢？於是我就換成了下邊的程式碼,發現真的準確了： $str = "php程式設計"; if (preg_match("/^[x{4e00}-x{9fa5}]+$/u",$str )) { print("該字串全部是中文"); } else { print("該字串不全部是中文"); }
知道了php中utf-8編碼下用正則表達式匹配漢字的最終正確表達式－/^[x{4e00}-x{9fa5}]+$/u，參考以上文章寫瞭如下一段測試程式碼(複製以下程式碼儲存成.php檔案)
您輸入的[". $str."]含有非法字元"; } else { echo "您輸入的[".$str >

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

您什麼時候使用特質與PHP中的抽像類或接口？Apr 10, 2025 am 09:39 AM

在PHP中，trait適用於需要方法復用但不適合使用繼承的情況。 1)trait允許在類中復用方法，避免多重繼承複雜性。 2)使用trait時需注意方法衝突，可通過insteadof和as關鍵字解決。 3)應避免過度使用trait，保持其單一職責，以優化性能和提高代碼可維護性。

什麼是依賴性注入容器（DIC），為什麼在PHP中使用一個？Apr 10, 2025 am 09:38 AM

依賴注入容器（DIC）是一種管理和提供對象依賴關係的工具，用於PHP項目中。 DIC的主要好處包括：1.解耦，使組件獨立，代碼易維護和測試；2.靈活性，易替換或修改依賴關係；3.可測試性，方便注入mock對象進行單元測試。

與常規PHP陣列相比，解釋SPL SplfixedArray及其性能特徵。Apr 10, 2025 am 09:37 AM

SplFixedArray在PHP中是一種固定大小的數組，適用於需要高性能和低內存使用量的場景。 1)它在創建時需指定大小，避免動態調整帶來的開銷。 2)基於C語言數組，直接操作內存，訪問速度快。 3)適合大規模數據處理和內存敏感環境，但需謹慎使用，因其大小固定。

PHP如何安全地上載文件？Apr 10, 2025 am 09:37 AM

PHP通過$\_FILES變量處理文件上傳，確保安全性的方法包括：1.檢查上傳錯誤，2.驗證文件類型和大小，3.防止文件覆蓋，4.移動文件到永久存儲位置。

什麼是無效的合併操作員（??）和無效分配運算符（?? =）？Apr 10, 2025 am 09:33 AM

JavaScript中處理空值可以使用NullCoalescingOperator(??)和NullCoalescingAssignmentOperator(??=)。 1.??返回第一個非null或非undefined的操作數。 2.??=將變量賦值為右操作數的值，但前提是該變量為null或undefined。這些操作符簡化了代碼邏輯，提高了可讀性和性能。

什麼是內容安全策略（CSP）標頭，為什麼重要？Apr 09, 2025 am 12:10 AM

CSP重要因為它能防範XSS攻擊和限制資源加載，提升網站安全性。 1.CSP是HTTP響應頭的一部分，通過嚴格策略限制惡意行為。 2.基本用法是只允許從同源加載資源。 3.高級用法可設置更細粒度的策略，如允許特定域名加載腳本和样式。 4.使用Content-Security-Policy-Report-Only頭部可調試和優化CSP策略。