搜索
首页后端开发php教程 php判断是不是为中文正则表达式大全(转)

php判断是否为中文正则表达式大全(转)

转载自?? http://www.cnblogs.com/DavidYan/articles/2032115.html

?

?

php判断是否为中文正则表达式大全

?


$str="aaa";
if(!eregi("[^\x80-\xff]","$str"))
{
echo "是";
}
else
{
echo "不是";
}
?>



$str = "中国";
echo $str;
echo "


";

//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) { //只能在GB2312情况下使用
if (preg_match("/^[\x7f-\xff]+$/", $str)) { //兼容gb2312,utf-8
echo "正确输入";
} else {
echo "错误输入";
}
?>


如果想判断一个字符串内是否有含有中文,请用下面的代码:

if (preg_match("/[\x7f-\xff]/", $string)) {
echo "有中文";
}else{
echo "没有中文";
}

判断中文和编码有关 gbk是双字节,utf8是三字节,可以根据中文的范围来判断???

?

编码范围1. GBK (GB2312/GB18030)???
\x00-\xff GBK双字节编码范围???
\x20-\x7f ASCII???
\xa1-\xff 中文???
\x80-\xff 中文??
??
2. UTF-8 (Unicode)???
\u4e00-\u9fa5 (中文)???
\x3130-\x318F (韩文???
\xAC00-\xD7A3 (韩文)???
\u0800-\u4e00 (日文)???
ps: 韩文是大于[\u9fa5]的字符???
正则例子:???
preg_replace(”/([\x80-\xff])/”,”",$str);??
preg_replace(”/([u4e00-u9fa5])/”,”",$str);???

?

?

  1. //判断内容里有没有中文-GBK?(PHP)????? ??
  2. function ?check_is_chinese( $s ){????? ??
  3. ????? return ?preg_match( '/[\x80-\xff]./' ,? $s );????? ??
  4. }????? ??
  5. ??? ??
  6. //获取字符串长度-GBK?(PHP)????? ??
  7. function ?gb_strlen( $str ){????? ??
  8. ????? $count ?=?0;????? ??
  9. ????? for ( $i =0;? $i strlen ( $str );? $i ++){????? ??
  10. ????????? $s ?=? substr ( $str ,? $i ,?1);????? ??
  11. ????????? if ?(preg_match( "/[\x80-\xff]/" ,? $s ))?++ $i ;????? ??
  12. ???????????++ $count ;????? ??
  13. ?????}????? ??
  14. ????? return ? $count ;????? ??
  15. }????? ??
  16. ??? ??
  17. //截取字符串字串-GBK?(PHP)????? ??
  18. function ?gb_substr( $str ,? $len ){????? ??
  19. ????? $count ?=?0;????? ??
  20. ????? for ( $i =0;? $i strlen ( $str );? $i ++){????? ??
  21. ????????? if ( $count ?==? $len )? break ;????? ??
  22. ????????? if (preg_match( "/[\x80-\xff]/" ,? substr ( $str ,? $i ,?1)))?++ $i ;????? ??
  23. ???????????++ $count ;????????????? ??
  24. ?????}????? ??
  25. ????? return ? substr ( $str ,?0,? $i );????? ??
  26. }????? ??
  27. ??? ??
  28. //统计字符串长度-UTF8?(PHP)????? ??
  29. function ?utf8_strlen( $str )?{????? ??
  30. ????? $count ?=?0;????? ??
  31. ????? for ( $i ?=?0;? $i ? strlen ( $str );? $i ++){????? ??
  32. ????????? $value ?=?ord( $str [ $i ]);????? ??
  33. ????????? if ( $value ?>?127)?{????? ??
  34. ????????????? $count ++;????? ??
  35. ????????????? if ( $value ?>=?192?&&? $value ? $i ++;????? ??
  36. ????????????? elseif ( $value ?>=?224?&&? $value ? $i ?=? $i ?+?2;????? ??
  37. ????????????? elseif ( $value ?>=?240?&&? $value ? $i ?=? $i ?+?3;????? ??
  38. ????????????? else ? die ( 'Not?a?UTF-8?compatible?string' );????? ??
  39. ?????????}????? ??
  40. ????????? $count ++;????? ??
  41. ?????}????? ??
  42. ????? return ? $count ;????? ??
  43. }????? ??
  44. ??? ??
  45. ??? ??
  46. //截取字符串-UTF8(PHP)????? ??
  47. function ?utf8_substr( $str , $position , $length ){????? ??
  48. ????? $start_position ?=? strlen ( $str );????? ??
  49. ????? $start_byte ?=?0;????? ??
  50. ????? $end_position ?=? strlen ( $str );????? ??
  51. ????? $count ?=?0;????? ??
  52. ????? for ( $i ?=?0;? $i ? strlen ( $str );? $i ++){????? ??
  53. ????????? if ( $count ?>=? $position ?&&? $start_position ?>? $i ){????? ??
  54. ????????????? $start_position ?=? $i ;????? ??
  55. ????????????? $start_byte ?=? $count ;????? ??
  56. ?????????}????? ??
  57. ????????? if (( $count - $start_byte )>= $length )?{????? ??
  58. ????????????? $end_position ?=? $i ;????? ??
  59. ????????????? break ;????? ??
  60. ?????????}????????? ??
  61. ????????? $value ?=?ord( $str [ $i ]);????? ??
  62. ????????? if ( $value ?>?127){????? ??
  63. ????????????? $count ++;????? ??
  64. ????????????? if ( $value ?>=?192?&&? $value ? $i ++;????? ??
  65. ????????????? elseif ( $value ?>=?224?&&? $value ? $i ?=? $i ?+?2;????? ??
  66. ????????????? elseif ( $value ?>=?240?&&? $value ? $i ?=? $i ?+?3;????? ??
  67. ????????????? else ? die ( 'Not?a?UTF-8?compatible?string' );????? ??
  68. ?????????}????? ??
  69. ????????? $count ++;????? ??
  70. ??? ??
  71. ?????}????? ??
  72. ????? return ( substr ( $str , $start_position , $end_position - $start_position ));????? ??
  73. }????? ??
  74. ??? ??
  75. //判断是否是有韩文-UTF-8?(JavaScript)????? ??
  76. function ?checkKoreaChar(str)?{????? ??
  77. ????? for (i=0;?i
  78. ????????? if (((str.charCodeAt(i)?>?0x3130?&&?str.charCodeAt(i)?0x318F)?||?(str.charCodeAt(i)?>=?0xAC00?&&?str.charCodeAt(i)?
  79. ????????????? return ?true;????? ??
  80. ?????????}????? ??
  81. ?????}????? ??
  82. ????? return ?false;????? ??
  83. }????? ??
  84. ??? ??
  85. //判断是否有中文字符-GBK?(JavaScript)????? ??
  86. function ?check_chinese_char(s){????? ??
  87. ????? return ?(s.length?!=?s.replace(/[^\x00-\xff]/g, "**" ).length);????? ??
  88. }???

?

UTF-8匹配:

在javascript中,要判断字符串是中文是很简单的。比如:
var str = "php编程";
if (/^[\u4e00-\u9fa5]+$/.test(str)) {
alert("该字符串全部是中文");
}
else{
alert("该字符串不全部是中文");
}

php中,是用\x表示十六进制数据的。于是,变换成如下的代码:
$str = "php编程";
if (preg_match("/^[\x4e00-\x9fa5]+$/",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}
貌似不报错了,判断的结果也正确,不过把$str换成“编程”两字,结果却还是显示“该字符串不全部是中文”,看来这样的判断还是不够准确。

重要:查阅了发现,对于[\x4e00-\x9fa5]这块东西,自己做一个强化的解释

php的正则中, [\x4e00-\x9fa5],其实就是 字符和字符组的概念, \x{hex},表达一个16进制数, 需要注意的是hex 可以是1-2位的,也可以是4位的,但是如果是4位的必须加上大括号,

同时,如果是大于x{FF}的hex,必须和u 修饰符连用,不然会非法出错


网上只能找到匹配全角字符的正则:?? ^[\x80-\xff]*^/??? ,这里可以不加大括号
[\u4e00-\u9fa5]可以匹配中文,但是PHP又不支持???
不过,既然\x表示的十六进制数据,为什么和js里边提供的范围\x4e00-\x9fa5不一样呢?于是我就换成了下边的代码,发现真的准确了:
$str = "php编程";
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}

知道了php中utf-8编码下用正则表达式匹配汉字的最终正确表达式――/^[\x{4e00}-\x{9fa5}]+$/u,
参考以上文章写了如下一段测试代码(复制以下代码保存成.php文件)

$action = trim($_GET['action']);
if($action == "sub")
{
??? $str = $_POST['dir'];???
??? //if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312汉字字母数字下划线正则表达式
??? if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str))?? //UTF-8汉字字母数字下划线正则表达式
??? {??
??????? echo "您输入的[".$str."]含有违法字符";??
??? }
??? else
??? {
??????? echo "您输入的[".$str."]完全合法,通过!";??
??? }
}
?>


输入字符(数字,字母,汉字,下划线):
???
???


GBK:

preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312汉字字母数字下划线正则表达式

?


$str="aaa";
if(!eregi("[^\x80-\xff]","$str"))
{
echo "是";
}
else
{
echo "不是";
}
?>



$str = "中国";
echo $str;
echo "


";

//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) { //只能在GB2312情况下使用
if (preg_match("/^[\x7f-\xff]+$/", $str)) { //兼容gb2312,utf-8
echo "正确输入";
} else {
echo "错误输入";
}
?>


如果想判断一个字符串内是否有含有中文,请用下面的代码:

if (preg_match("/[\x7f-\xff]/", $string)) {
echo "有中文";
}else{
echo "没有中文";
}

?

?

?

?

?

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
PHP的目的:构建动态网站PHP的目的:构建动态网站Apr 15, 2025 am 12:18 AM

PHP用于构建动态网站,其核心功能包括:1.生成动态内容,通过与数据库对接实时生成网页;2.处理用户交互和表单提交,验证输入并响应操作;3.管理会话和用户认证,提供个性化体验;4.优化性能和遵循最佳实践,提升网站效率和安全性。

PHP:处理数据库和服务器端逻辑PHP:处理数据库和服务器端逻辑Apr 15, 2025 am 12:15 AM

PHP在数据库操作和服务器端逻辑处理中使用MySQLi和PDO扩展进行数据库交互,并通过会话管理等功能处理服务器端逻辑。1)使用MySQLi或PDO连接数据库,执行SQL查询。2)通过会话管理等功能处理HTTP请求和用户状态。3)使用事务确保数据库操作的原子性。4)防止SQL注入,使用异常处理和关闭连接来调试。5)通过索引和缓存优化性能,编写可读性高的代码并进行错误处理。

您如何防止PHP中的SQL注入? (准备的陈述,PDO)您如何防止PHP中的SQL注入? (准备的陈述,PDO)Apr 15, 2025 am 12:15 AM

在PHP中使用预处理语句和PDO可以有效防范SQL注入攻击。1)使用PDO连接数据库并设置错误模式。2)通过prepare方法创建预处理语句,使用占位符和execute方法传递数据。3)处理查询结果并确保代码的安全性和性能。

PHP和Python:代码示例和比较PHP和Python:代码示例和比较Apr 15, 2025 am 12:07 AM

PHP和Python各有优劣,选择取决于项目需求和个人偏好。1.PHP适合快速开发和维护大型Web应用。2.Python在数据科学和机器学习领域占据主导地位。

PHP行动:现实世界中的示例和应用程序PHP行动:现实世界中的示例和应用程序Apr 14, 2025 am 12:19 AM

PHP在电子商务、内容管理系统和API开发中广泛应用。1)电子商务:用于购物车功能和支付处理。2)内容管理系统:用于动态内容生成和用户管理。3)API开发:用于RESTfulAPI开发和API安全性。通过性能优化和最佳实践,PHP应用的效率和可维护性得以提升。

PHP:轻松创建交互式Web内容PHP:轻松创建交互式Web内容Apr 14, 2025 am 12:15 AM

PHP可以轻松创建互动网页内容。1)通过嵌入HTML动态生成内容,根据用户输入或数据库数据实时展示。2)处理表单提交并生成动态输出,确保使用htmlspecialchars防XSS。3)结合MySQL创建用户注册系统,使用password_hash和预处理语句增强安全性。掌握这些技巧将提升Web开发效率。

PHP和Python:比较两种流行的编程语言PHP和Python:比较两种流行的编程语言Apr 14, 2025 am 12:13 AM

PHP和Python各有优势,选择依据项目需求。1.PHP适合web开发,尤其快速开发和维护网站。2.Python适用于数据科学、机器学习和人工智能,语法简洁,适合初学者。

PHP的持久相关性:它还活着吗?PHP的持久相关性:它还活着吗?Apr 14, 2025 am 12:12 AM

PHP仍然具有活力,其在现代编程领域中依然占据重要地位。1)PHP的简单易学和强大社区支持使其在Web开发中广泛应用;2)其灵活性和稳定性使其在处理Web表单、数据库操作和文件处理等方面表现出色;3)PHP不断进化和优化,适用于初学者和经验丰富的开发者。

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
4 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
1 个月前By尊渡假赌尊渡假赌尊渡假赌

热工具

VSCode Windows 64位 下载

VSCode Windows 64位 下载

微软推出的免费、功能强大的一款IDE编辑器

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中