搜尋
首頁後端開發php教程 php判断是不是为中文正则表达式大全(转)

php判断是否为中文正则表达式大全(转)

转载自?? http://www.cnblogs.com/DavidYan/articles/2032115.html

?

?

php判断是否为中文正则表达式大全

?


$str="aaa";
if(!eregi("[^\x80-\xff]","$str"))
{
echo "是";
}
else
{
echo "不是";
}
?>



$str = "中国";
echo $str;
echo "


";

//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) { //只能在GB2312情况下使用
if (preg_match("/^[\x7f-\xff]+$/", $str)) { //兼容gb2312,utf-8
echo "正确输入";
} else {
echo "错误输入";
}
?>


如果想判断一个字符串内是否有含有中文,请用下面的代码:

if (preg_match("/[\x7f-\xff]/", $string)) {
echo "有中文";
}else{
echo "没有中文";
}

判断中文和编码有关 gbk是双字节,utf8是三字节,可以根据中文的范围来判断???

?

编码范围1. GBK (GB2312/GB18030)???
\x00-\xff GBK双字节编码范围???
\x20-\x7f ASCII???
\xa1-\xff 中文???
\x80-\xff 中文??
??
2. UTF-8 (Unicode)???
\u4e00-\u9fa5 (中文)???
\x3130-\x318F (韩文???
\xAC00-\xD7A3 (韩文)???
\u0800-\u4e00 (日文)???
ps: 韩文是大于[\u9fa5]的字符???
正则例子:???
preg_replace(”/([\x80-\xff])/”,”",$str);??
preg_replace(”/([u4e00-u9fa5])/”,”",$str);???

?

?

  1. //判断内容里有没有中文-GBK?(PHP)????? ??
  2. function ?check_is_chinese( $s ){????? ??
  3. ????? return ?preg_match( '/[\x80-\xff]./' ,? $s );????? ??
  4. }????? ??
  5. ??? ??
  6. //获取字符串长度-GBK?(PHP)????? ??
  7. function ?gb_strlen( $str ){????? ??
  8. ????? $count ?=?0;????? ??
  9. ????? for ( $i =0;? $i strlen ( $str );? $i ++){????? ??
  10. ????????? $s ?=? substr ( $str ,? $i ,?1);????? ??
  11. ????????? if ?(preg_match( "/[\x80-\xff]/" ,? $s ))?++ $i ;????? ??
  12. ???????????++ $count ;????? ??
  13. ?????}????? ??
  14. ????? return ? $count ;????? ??
  15. }????? ??
  16. ??? ??
  17. //截取字符串字串-GBK?(PHP)????? ??
  18. function ?gb_substr( $str ,? $len ){????? ??
  19. ????? $count ?=?0;????? ??
  20. ????? for ( $i =0;? $i strlen ( $str );? $i ++){????? ??
  21. ????????? if ( $count ?==? $len )? break ;????? ??
  22. ????????? if (preg_match( "/[\x80-\xff]/" ,? substr ( $str ,? $i ,?1)))?++ $i ;????? ??
  23. ???????????++ $count ;????????????? ??
  24. ?????}????? ??
  25. ????? return ? substr ( $str ,?0,? $i );????? ??
  26. }????? ??
  27. ??? ??
  28. //统计字符串长度-UTF8?(PHP)????? ??
  29. function ?utf8_strlen( $str )?{????? ??
  30. ????? $count ?=?0;????? ??
  31. ????? for ( $i ?=?0;? $i ? strlen ( $str );? $i ++){????? ??
  32. ????????? $value ?=?ord( $str [ $i ]);????? ??
  33. ????????? if ( $value ?>?127)?{????? ??
  34. ????????????? $count ++;????? ??
  35. ????????????? if ( $value ?>=?192?&&? $value ? $i ++;????? ??
  36. ????????????? elseif ( $value ?>=?224?&&? $value ? $i ?=? $i ?+?2;????? ??
  37. ????????????? elseif ( $value ?>=?240?&&? $value ? $i ?=? $i ?+?3;????? ??
  38. ????????????? else ? die ( 'Not?a?UTF-8?compatible?string' );????? ??
  39. ?????????}????? ??
  40. ????????? $count ++;????? ??
  41. ?????}????? ??
  42. ????? return ? $count ;????? ??
  43. }????? ??
  44. ??? ??
  45. ??? ??
  46. //截取字符串-UTF8(PHP)????? ??
  47. function ?utf8_substr( $str , $position , $length ){????? ??
  48. ????? $start_position ?=? strlen ( $str );????? ??
  49. ????? $start_byte ?=?0;????? ??
  50. ????? $end_position ?=? strlen ( $str );????? ??
  51. ????? $count ?=?0;????? ??
  52. ????? for ( $i ?=?0;? $i ? strlen ( $str );? $i ++){????? ??
  53. ????????? if ( $count ?>=? $position ?&&? $start_position ?>? $i ){????? ??
  54. ????????????? $start_position ?=? $i ;????? ??
  55. ????????????? $start_byte ?=? $count ;????? ??
  56. ?????????}????? ??
  57. ????????? if (( $count - $start_byte )>= $length )?{????? ??
  58. ????????????? $end_position ?=? $i ;????? ??
  59. ????????????? break ;????? ??
  60. ?????????}????????? ??
  61. ????????? $value ?=?ord( $str [ $i ]);????? ??
  62. ????????? if ( $value ?>?127){????? ??
  63. ????????????? $count ++;????? ??
  64. ????????????? if ( $value ?>=?192?&&? $value ? $i ++;????? ??
  65. ????????????? elseif ( $value ?>=?224?&&? $value ? $i ?=? $i ?+?2;????? ??
  66. ????????????? elseif ( $value ?>=?240?&&? $value ? $i ?=? $i ?+?3;????? ??
  67. ????????????? else ? die ( 'Not?a?UTF-8?compatible?string' );????? ??
  68. ?????????}????? ??
  69. ????????? $count ++;????? ??
  70. ??? ??
  71. ?????}????? ??
  72. ????? return ( substr ( $str , $start_position , $end_position - $start_position ));????? ??
  73. }????? ??
  74. ??? ??
  75. //判断是否是有韩文-UTF-8?(JavaScript)????? ??
  76. function ?checkKoreaChar(str)?{????? ??
  77. ????? for (i=0;?i
  78. ????????? if (((str.charCodeAt(i)?>?0x3130?&&?str.charCodeAt(i)?0x318F)?||?(str.charCodeAt(i)?>=?0xAC00?&&?str.charCodeAt(i)?
  79. ????????????? return ?true;????? ??
  80. ?????????}????? ??
  81. ?????}????? ??
  82. ????? return ?false;????? ??
  83. }????? ??
  84. ??? ??
  85. //判断是否有中文字符-GBK?(JavaScript)????? ??
  86. function ?check_chinese_char(s){????? ??
  87. ????? return ?(s.length?!=?s.replace(/[^\x00-\xff]/g, "**" ).length);????? ??
  88. }???

?

UTF-8匹配:

在javascript中,要判断字符串是中文是很简单的。比如:
var str = "php编程";
if (/^[\u4e00-\u9fa5]+$/.test(str)) {
alert("该字符串全部是中文");
}
else{
alert("该字符串不全部是中文");
}

php中,是用\x表示十六进制数据的。于是,变换成如下的代码:
$str = "php编程";
if (preg_match("/^[\x4e00-\x9fa5]+$/",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}
貌似不报错了,判断的结果也正确,不过把$str换成“编程”两字,结果却还是显示“该字符串不全部是中文”,看来这样的判断还是不够准确。

重要:查阅了发现,对于[\x4e00-\x9fa5]这块东西,自己做一个强化的解释

php的正则中, [\x4e00-\x9fa5],其实就是 字符和字符组的概念, \x{hex},表达一个16进制数, 需要注意的是hex 可以是1-2位的,也可以是4位的,但是如果是4位的必须加上大括号,

同时,如果是大于x{FF}的hex,必须和u 修饰符连用,不然会非法出错


网上只能找到匹配全角字符的正则:?? ^[\x80-\xff]*^/??? ,这里可以不加大括号
[\u4e00-\u9fa5]可以匹配中文,但是PHP又不支持???
不过,既然\x表示的十六进制数据,为什么和js里边提供的范围\x4e00-\x9fa5不一样呢?于是我就换成了下边的代码,发现真的准确了:
$str = "php编程";
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}

知道了php中utf-8编码下用正则表达式匹配汉字的最终正确表达式――/^[\x{4e00}-\x{9fa5}]+$/u,
参考以上文章写了如下一段测试代码(复制以下代码保存成.php文件)

$action = trim($_GET['action']);
if($action == "sub")
{
??? $str = $_POST['dir'];???
??? //if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312汉字字母数字下划线正则表达式
??? if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str))?? //UTF-8汉字字母数字下划线正则表达式
??? {??
??????? echo "您输入的[".$str."]含有违法字符";??
??? }
??? else
??? {
??????? echo "您输入的[".$str."]完全合法,通过!";??
??? }
}
?>


输入字符(数字,字母,汉字,下划线):
???
???


GBK:

preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312汉字字母数字下划线正则表达式

?


$str="aaa";
if(!eregi("[^\x80-\xff]","$str"))
{
echo "是";
}
else
{
echo "不是";
}
?>



$str = "中国";
echo $str;
echo "


";

//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) { //只能在GB2312情况下使用
if (preg_match("/^[\x7f-\xff]+$/", $str)) { //兼容gb2312,utf-8
echo "正确输入";
} else {
echo "错误输入";
}
?>


如果想判断一个字符串内是否有含有中文,请用下面的代码:

if (preg_match("/[\x7f-\xff]/", $string)) {
echo "有中文";
}else{
echo "没有中文";
}

?

?

?

?

?

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
PHP和Python:解釋了不同的範例PHP和Python:解釋了不同的範例Apr 18, 2025 am 12:26 AM

PHP主要是過程式編程,但也支持面向對象編程(OOP);Python支持多種範式,包括OOP、函數式和過程式編程。 PHP適合web開發,Python適用於多種應用,如數據分析和機器學習。

PHP和Python:深入了解他們的歷史PHP和Python:深入了解他們的歷史Apr 18, 2025 am 12:25 AM

PHP起源於1994年,由RasmusLerdorf開發,最初用於跟踪網站訪問者,逐漸演變為服務器端腳本語言,廣泛應用於網頁開發。 Python由GuidovanRossum於1980年代末開發,1991年首次發布,強調代碼可讀性和簡潔性,適用於科學計算、數據分析等領域。

在PHP和Python之間進行選擇:指南在PHP和Python之間進行選擇:指南Apr 18, 2025 am 12:24 AM

PHP適合網頁開發和快速原型開發,Python適用於數據科學和機器學習。 1.PHP用於動態網頁開發,語法簡單,適合快速開發。 2.Python語法簡潔,適用於多領域,庫生態系統強大。

PHP和框架:現代化語言PHP和框架:現代化語言Apr 18, 2025 am 12:14 AM

PHP在現代化進程中仍然重要,因為它支持大量網站和應用,並通過框架適應開發需求。 1.PHP7提升了性能並引入了新功能。 2.現代框架如Laravel、Symfony和CodeIgniter簡化開發,提高代碼質量。 3.性能優化和最佳實踐進一步提升應用效率。

PHP的影響:網絡開發及以後PHP的影響:網絡開發及以後Apr 18, 2025 am 12:10 AM

PHPhassignificantlyimpactedwebdevelopmentandextendsbeyondit.1)ItpowersmajorplatformslikeWordPressandexcelsindatabaseinteractions.2)PHP'sadaptabilityallowsittoscaleforlargeapplicationsusingframeworkslikeLaravel.3)Beyondweb,PHPisusedincommand-linescrip

PHP類型提示如何起作用,包括標量類型,返回類型,聯合類型和無效類型?PHP類型提示如何起作用,包括標量類型,返回類型,聯合類型和無效類型?Apr 17, 2025 am 12:25 AM

PHP類型提示提升代碼質量和可讀性。 1)標量類型提示:自PHP7.0起,允許在函數參數中指定基本數據類型,如int、float等。 2)返回類型提示:確保函數返回值類型的一致性。 3)聯合類型提示:自PHP8.0起,允許在函數參數或返回值中指定多個類型。 4)可空類型提示:允許包含null值,處理可能返回空值的函數。

PHP如何處理對象克隆(克隆關鍵字)和__clone魔法方法?PHP如何處理對象克隆(克隆關鍵字)和__clone魔法方法?Apr 17, 2025 am 12:24 AM

PHP中使用clone關鍵字創建對象副本,並通過\_\_clone魔法方法定制克隆行為。 1.使用clone關鍵字進行淺拷貝,克隆對象的屬性但不克隆對象屬性內的對象。 2.通過\_\_clone方法可以深拷貝嵌套對象,避免淺拷貝問題。 3.注意避免克隆中的循環引用和性能問題,優化克隆操作以提高效率。

PHP與Python:用例和應用程序PHP與Python:用例和應用程序Apr 17, 2025 am 12:23 AM

PHP適用於Web開發和內容管理系統,Python適合數據科學、機器學習和自動化腳本。 1.PHP在構建快速、可擴展的網站和應用程序方面表現出色,常用於WordPress等CMS。 2.Python在數據科學和機器學習領域表現卓越,擁有豐富的庫如NumPy和TensorFlow。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前By尊渡假赌尊渡假赌尊渡假赌
威爾R.E.P.O.有交叉遊戲嗎?
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。