【转】UTF-8汉字正则表达式，utf-8汉字正则表达式

首頁

後端開發

php教程

【转】UTF-8汉字正则表达式，utf-8汉字正则表达式_PHP教程

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jul 13, 2016 am 09:45 AM

正規表示式

【转】UTF-8汉字正则表达式，utf-8汉字正则表达式

原文链接：http://blog.csdn.net/wide288/article/details/30066639

$str = "编程";
// if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str)) //UTF-8汉字字母数字下划线正则表达式
if(!preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) //UTF-8汉字字母数字下划线正则表达式
{
echo "您输入的[".$str."]含有违法字符";
}
else
{
echo "您输入的[".$str."]完全合法,通过!";

}

-----------------------

UTF-8匹配:
在javascript中，要判断字符串是中文是很简单的。比如： var str = "php编程"; if (/^[\u4e00-\u9fa5]+$/.test(str)) { alert("该字符串全部是中文"); } else{ alert("该字符串不全部是中文"); }
php中，是用\x表示十六进制数据的。于是，变换成如下的代码： $str = "php编程"; if (preg_match("/^[\x4e00-\x9fa5]+$/",$str)) { print("该字符串全部是中文"); } else { print("该字符串不全部是中文"); } 貌似不报错了，判断的结果也正确，不过把$str换成“编程”两字，结果却还是显示“该字符串不全部是中文”，看来这样的判断还是不够准确。
重要:查阅了发现,对于[\x4e00-\x9fa5]这块东西,自己做一个强化的解释
php的正则中, [\x4e00-\x9fa5],其实就是字符和字符组的概念, \x{hex},表达一个16进制数, 需要注意的是hex 可以是1-2位的,也可以是4位的,但是如果是4位的必须加上大括号,
同时,如果是大于x{FF}的hex,必须和u 修饰符连用,不然会非法出错

网上只能找到匹配全角字符的正则: ^[\x80-\xff]*^/ ,这里可以不加大括号 [\u4e00-\u9fa5]可以匹配中文,但是PHP又不支持不过，既然\x表示的十六进制数据，为什么和js里边提供的范围\x4e00-\x9fa5不一样呢？于是我就换成了下边的代码,发现真的准确了： $str = "php编程"; if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) { print("该字符串全部是中文"); } else { print("该字符串不全部是中文"); }
知道了php中utf-8编码下用正则表达式匹配汉字的最终正确表达式——/^[\x{4e00}-\x{9fa5}]+$/u，参考以上文章写了如下一段测试代码(复制以下代码保存成.php文件)
您输入的[".$str."]含有违法字符"; } else { echo "您输入的[".$str."]完全合法,通过!"; } } ?>

GBK:
preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312汉字字母数字下划线正则表达式

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

php怎么去除字符串中的所有大写字母Sep 26, 2022 pm 07:59 PM

两种去除方法：1、利用preg_replace()执行正则表达式搜索所有大写字母并将其替换为空字符即可，语法“preg_replace('/[A-Z]/','',$str)”。2、利用preg_filter()执行正则表达式搜索所有大写字母并将其替换为空字符即可，语法“preg_filter('/[A-Z]/','',$str)”。

php怎么替换nbsp空格符Apr 24, 2022 pm 02:55 PM

方法：1、用“str_replace(" ","其他字符",$str)”语句，可将nbsp符替换为其他字符；2、用“preg_replace("/(\s|\&nbsp\;||\xc2\xa0)/","其他字符",$str)”语句。

使用Go语言编写高性能的正则表达式匹配Jun 15, 2023 pm 10:56 PM

随着数据量的不断增大，正则表达式匹配成为了程序中常用的操作之一。而在Go语言中，由于其天然的并行ism，以及与底层系统的交互性和高效性，使得Go语言的正则表达式匹配极具优势。那么如何使用Go语言编写高性能的正则表达式匹配呢？一、了解正则表达式在使用正则表达式前，我们首先需要了解正则表达式，了解其基本语法规则以及常用的匹配字符，使我们能够在编写正则表达式时更加

php怎么利用正则排除字符串中的字符Dec 15, 2022 pm 03:30 PM

两种方法：1、用preg_replace()，可执行正则表达式的搜索和替换，只需将字符串中匹配的字符替换为空字符即可，语法“preg_replace(正则, "", $str)”。2、用preg_match_all()，可搜索字符串中所有和正则表达式匹配的结果，会将每次的匹配结果放在一个数组$array中，语法“preg_match_all(正则,$str,$array);”。

javascript怎么正则替换非汉字的字符Oct 13, 2022 pm 05:37 PM

在javascript中，可以使用replace()函数配合正则表达式“/[u4e00-u9fa5|,]+/ig”来查找字符串中的所有非汉字字符，并将其替换为其他指定值，语法“字符串对象.replace(/[u4e00-u9fa5|,]+/ig,'指定替换值')”。

php怎么只获取中文字符Apr 28, 2022 pm 08:15 PM

php中可用preg_match_all()配合正则表达式过滤字符串，只获取中文字符；语法“preg_match_all("/[\x{4e00}-\x{9fff}]+/u","$str",$arr);”，会将匹配字符存入“$arr”数组中。

Java语言正则表达式的使用方法Jun 10, 2023 am 08:13 AM

Java语言正则表达式的使用方法正则表达式是一种强大的文本处理工具，可以用来匹配和验证文本。在Java语言中，也可以使用正则表达式来实现字符串的匹配和处理。本文将介绍Java语言正则表达式的使用方法，涵盖正则表达式的基础知识，常用的正则表达式语法，以及在Java程序中使用正则表达式的方法。一、基础知识正则表达式是什么？正则表达式是一种文本模式，用来描述一组字

PHP开发：如何编写高效的正则表达式Jun 15, 2023 pm 09:04 PM

在PHP开发中，正则表达式是非常重要的工具，用于匹配、查找和替换文本中的特定字符串。然而，编写高效的正则表达式并不是一件易事，需要开发者具备一定的技巧和经验。下面是一些可以帮助您编写高效正则表达式的技巧：1.尽可能使用非贪婪匹配默认情况下，正则表达式是贪婪的，即它们将尽可能匹配更多的文本。在某些情况下，可能需要使用非贪婪匹配来避免这种情况。非贪婪匹配使用"

See all articles