php判断是否为中文正则表达式大全(转)
转载自?? http://www.cnblogs.com/DavidYan/articles/2032115.html
?
?
php判断是否为中文正则表达式大全
?
$str="aaa";
if(!eregi("[^\x80-\xff]","$str"))
{
echo "是";
}
else
{
echo "不是";
}
?>
$str = "中国";
echo $str;
echo "
";
//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) {
//只能在GB2312情况下使用
if (preg_match("/^[\x7f-\xff]+$/", $str)) { //兼容gb2312,utf-8
echo "正确输入";
} else {
echo "错误输入";
}
?>
如果想判断一个字符串内是否有含有中文,请用下面的代码:
if (preg_match("/[\x7f-\xff]/", $string)) {
echo "有中文";
}else{
echo "没有中文";
}
判断中文和编码有关 gbk是双字节,utf8是三字节,可以根据中文的范围来判断???
?
编码范围1. GBK
(GB2312/GB18030)???
\x00-\xff
GBK双字节编码范围???
\x20-\x7f
ASCII???
\xa1-\xff
中文???
\x80-\xff 中文??
??
2. UTF-8
(Unicode)???
\u4e00-\u9fa5
(中文)???
\x3130-\x318F
(韩文???
\xAC00-\xD7A3
(韩文)???
\u0800-\u4e00
(日文)???
ps:
韩文是大于[\u9fa5]的字符???
正则例子:???
preg_replace(”/([\x80-\xff])/”,”",$str);??
preg_replace(”/([u4e00-u9fa5])/”,”",$str);???
?
?
- //判断内容里有没有中文-GBK?(PHP)????? ??
- function ?check_is_chinese( $s ){????? ??
- ????? return ?preg_match( '/[\x80-\xff]./' ,? $s );????? ??
- }????? ??
- ??? ??
- //获取字符串长度-GBK?(PHP)????? ??
- function ?gb_strlen( $str ){????? ??
- ????? $count ?=?0;????? ??
- ????? for ( $i =0;? $i strlen ( $str );? $i ++){????? ??
- ????????? $s ?=? substr ( $str ,? $i ,?1);????? ??
- ????????? if ?(preg_match( "/[\x80-\xff]/" ,? $s ))?++ $i ;????? ??
- ???????????++ $count ;????? ??
- ?????}????? ??
- ????? return ? $count ;????? ??
- }????? ??
- ??? ??
- //截取字符串字串-GBK?(PHP)????? ??
- function ?gb_substr( $str ,? $len ){????? ??
- ????? $count ?=?0;????? ??
- ????? for ( $i =0;? $i strlen ( $str );? $i ++){????? ??
- ????????? if ( $count ?==? $len )? break ;????? ??
- ????????? if (preg_match( "/[\x80-\xff]/" ,? substr ( $str ,? $i ,?1)))?++ $i ;????? ??
- ???????????++ $count ;????????????? ??
- ?????}????? ??
- ????? return ? substr ( $str ,?0,? $i );????? ??
- }????? ??
- ??? ??
- //统计字符串长度-UTF8?(PHP)????? ??
- function ?utf8_strlen( $str )?{????? ??
- ????? $count ?=?0;????? ??
- ????? for ( $i ?=?0;? $i ? strlen ( $str );? $i ++){????? ??
- ????????? $value ?=?ord( $str [ $i ]);????? ??
- ????????? if ( $value ?>?127)?{????? ??
- ????????????? $count ++;????? ??
- ????????????? if ( $value ?>=?192?&&? $value ? $i ++;????? ??
- ????????????? elseif ( $value ?>=?224?&&? $value ? $i ?=? $i ?+?2;????? ??
- ????????????? elseif ( $value ?>=?240?&&? $value ? $i ?=? $i ?+?3;????? ??
- ????????????? else ? die ( 'Not?a?UTF-8?compatible?string' );????? ??
- ?????????}????? ??
- ????????? $count ++;????? ??
- ?????}????? ??
- ????? return ? $count ;????? ??
- }????? ??
- ??? ??
- ??? ??
- //截取字符串-UTF8(PHP)????? ??
- function ?utf8_substr( $str , $position , $length ){????? ??
- ????? $start_position ?=? strlen ( $str );????? ??
- ????? $start_byte ?=?0;????? ??
- ????? $end_position ?=? strlen ( $str );????? ??
- ????? $count ?=?0;????? ??
- ????? for ( $i ?=?0;? $i ? strlen ( $str );? $i ++){????? ??
- ????????? if ( $count ?>=? $position ?&&? $start_position ?>? $i ){????? ??
- ????????????? $start_position ?=? $i ;????? ??
- ????????????? $start_byte ?=? $count ;????? ??
- ?????????}????? ??
- ????????? if (( $count - $start_byte )>= $length )?{????? ??
- ????????????? $end_position ?=? $i ;????? ??
- ????????????? break ;????? ??
- ?????????}????????? ??
- ????????? $value ?=?ord( $str [ $i ]);????? ??
- ????????? if ( $value ?>?127){????? ??
- ????????????? $count ++;????? ??
- ????????????? if ( $value ?>=?192?&&? $value ? $i ++;????? ??
- ????????????? elseif ( $value ?>=?224?&&? $value ? $i ?=? $i ?+?2;????? ??
- ????????????? elseif ( $value ?>=?240?&&? $value ? $i ?=? $i ?+?3;????? ??
- ????????????? else ? die ( 'Not?a?UTF-8?compatible?string' );????? ??
- ?????????}????? ??
- ????????? $count ++;????? ??
- ??? ??
- ?????}????? ??
- ????? return ( substr ( $str , $start_position , $end_position - $start_position ));????? ??
- }????? ??
- ??? ??
- //判断是否是有韩文-UTF-8?(JavaScript)????? ??
- function ?checkKoreaChar(str)?{????? ??
-
?????
for
(i=0;?i
- ????????? if (((str.charCodeAt(i)?>?0x3130?&&?str.charCodeAt(i)?0x318F)?||?(str.charCodeAt(i)?>=?0xAC00?&&?str.charCodeAt(i)?
- ????????????? return ?true;????? ??
- ?????????}????? ??
- ?????}????? ??
- ????? return ?false;????? ??
- }????? ??
- ??? ??
- //判断是否有中文字符-GBK?(JavaScript)????? ??
- function ?check_chinese_char(s){????? ??
- ????? return ?(s.length?!=?s.replace(/[^\x00-\xff]/g, "**" ).length);????? ??
- }???
?
UTF-8匹配:
在javascript中,要判断字符串是中文是很简单的。比如:
var str = "php编程";
if (/^[\u4e00-\u9fa5]+$/.test(str)) {
alert("该字符串全部是中文");
}
else{
alert("该字符串不全部是中文");
}
php中,是用\x表示十六进制数据的。于是,变换成如下的代码:
$str = "php编程";
if (preg_match("/^[\x4e00-\x9fa5]+$/",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}
貌似不报错了,判断的结果也正确,不过把$str换成“编程”两字,结果却还是显示“该字符串不全部是中文”,看来这样的判断还是不够准确。
重要:查阅了发现,对于[\x4e00-\x9fa5]这块东西,自己做一个强化的解释
php的正则中, [\x4e00-\x9fa5],其实就是 字符和字符组的概念, \x{hex},表达一个16进制数, 需要注意的是hex 可以是1-2位的,也可以是4位的,但是如果是4位的必须加上大括号,
同时,如果是大于x{FF}的hex,必须和u 修饰符连用,不然会非法出错
网上只能找到匹配全角字符的正则:??
^[\x80-\xff]*^/???
,这里可以不加大括号
[\u4e00-\u9fa5]可以匹配中文,但是PHP又不支持???
不过,既然\x表示的十六进制数据,为什么和js里边提供的范围\x4e00-\x9fa5不一样呢?于是我就换成了下边的代码,发现真的准确了:
$str = "php编程";
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}
知道了php中utf-8编码下用正则表达式匹配汉字的最终正确表达式――/^[\x{4e00}-\x{9fa5}]+$/u,
参考以上文章写了如下一段测试代码(复制以下代码保存成.php文件)
$action = trim($_GET['action']);
if($action == "sub")
{
??? $str =
$_POST['dir'];???
???
//if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str))
//GB2312汉字字母数字下划线正则表达式
???
if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str))??
//UTF-8汉字字母数字下划线正则表达式
???
{??
???????
echo "您输入的[".$str."]含有违法字符";??
??? }
??? else
??? {
???????
echo "您输入的[".$str."]完全合法,通过!";??
??? }
}
?>
GBK:
preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312汉字字母数字下划线正则表达式
?
$str="aaa";
if(!eregi("[^\x80-\xff]","$str"))
{
echo "是";
}
else
{
echo "不是";
}
?>
$str = "中国";
echo $str;
echo "
";
//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) {
//只能在GB2312情况下使用
if (preg_match("/^[\x7f-\xff]+$/", $str)) { //兼容gb2312,utf-8
echo "正确输入";
} else {
echo "错误输入";
}
?>
如果想判断一个字符串内是否有含有中文,请用下面的代码:
if (preg_match("/[\x7f-\xff]/", $string)) {
echo "有中文";
}else{
echo "没有中文";
}
?
?
?
?
?

PHP主要是過程式編程,但也支持面向對象編程(OOP);Python支持多種範式,包括OOP、函數式和過程式編程。 PHP適合web開發,Python適用於多種應用,如數據分析和機器學習。

PHP起源於1994年,由RasmusLerdorf開發,最初用於跟踪網站訪問者,逐漸演變為服務器端腳本語言,廣泛應用於網頁開發。 Python由GuidovanRossum於1980年代末開發,1991年首次發布,強調代碼可讀性和簡潔性,適用於科學計算、數據分析等領域。

PHP適合網頁開發和快速原型開發,Python適用於數據科學和機器學習。 1.PHP用於動態網頁開發,語法簡單,適合快速開發。 2.Python語法簡潔,適用於多領域,庫生態系統強大。

PHP在現代化進程中仍然重要,因為它支持大量網站和應用,並通過框架適應開發需求。 1.PHP7提升了性能並引入了新功能。 2.現代框架如Laravel、Symfony和CodeIgniter簡化開發,提高代碼質量。 3.性能優化和最佳實踐進一步提升應用效率。

PHPhassignificantlyimpactedwebdevelopmentandextendsbeyondit.1)ItpowersmajorplatformslikeWordPressandexcelsindatabaseinteractions.2)PHP'sadaptabilityallowsittoscaleforlargeapplicationsusingframeworkslikeLaravel.3)Beyondweb,PHPisusedincommand-linescrip

PHP類型提示提升代碼質量和可讀性。 1)標量類型提示:自PHP7.0起,允許在函數參數中指定基本數據類型,如int、float等。 2)返回類型提示:確保函數返回值類型的一致性。 3)聯合類型提示:自PHP8.0起,允許在函數參數或返回值中指定多個類型。 4)可空類型提示:允許包含null值,處理可能返回空值的函數。

PHP中使用clone關鍵字創建對象副本,並通過\_\_clone魔法方法定制克隆行為。 1.使用clone關鍵字進行淺拷貝,克隆對象的屬性但不克隆對象屬性內的對象。 2.通過\_\_clone方法可以深拷貝嵌套對象,避免淺拷貝問題。 3.注意避免克隆中的循環引用和性能問題,優化克隆操作以提高效率。

PHP適用於Web開發和內容管理系統,Python適合數據科學、機器學習和自動化腳本。 1.PHP在構建快速、可擴展的網站和應用程序方面表現出色,常用於WordPress等CMS。 2.Python在數據科學和機器學習領域表現卓越,擁有豐富的庫如NumPy和TensorFlow。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

WebStorm Mac版
好用的JavaScript開發工具

Dreamweaver CS6
視覺化網頁開發工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。