ホームページ  >  記事  >  バックエンド開発  >  PHP は正規表現を使用して中国語を照合しますが、一部のソリューションは照合できません

PHP は正規表現を使用して中国語を照合しますが、一部のソリューションは照合できません

WBOY
WBOYオリジナル
2016-06-13 12:23:211153ブラウズ

PHP使用正则表达式匹配中文,有部分匹配不出来的解决办法

今天在开发的时候有个需要,就是匹配出一条计价公式里的材料文本,示例:[羊脂玉价格]*[羊脂玉重量]+[白金价格]*[白金重量]+[皓石价格]*[皓石重量]+[钻石价格]*1.5*[钻石重量]+[硬金价格]*1.67*[硬金重量],要匹配出[***_价格],就是中括号内,以_价格结尾的字符串(代表材料的名称),我用的语言是PHP,写了一条正则表达式出来,代码如下:

<code class=" hljs bash"><span class="hljs-variable">$pattern</span> = <span class="hljs-string">"/\\[([^_价格]+)_价格\\]/"</span>;<span class="hljs-variable">$res</span> = preg_match_all(<span class="hljs-variable">$pattern</span>, <span class="hljs-variable">$s</span>, <span class="hljs-variable">$matches</span>);var_dump(<span class="hljs-variable">$matches</span>);</code>

,前面三个能匹配出来,但“钻石”一直匹配不到,非常奇怪,后面测试了一下,跟匹配的数量没有关系,因为如果把“钻石”也改成“白金”的话是能匹配出来的,改成“石”字的话也可以匹配出来,根据这种现象判断,感觉有可能是字符集的问题,有可能是默认的字符集中是没有“钻”这个字的,所以匹配不到,后面搜索了很多网友关于PHP使用正则匹配中文的文章,发现最全面的匹配方式是使用16进制的,换过来后,果然成功了,故分享出来,以飨大家,最终的代码如下:
$s = ‘[羊脂玉价格]*[羊脂玉重量]+[白金价格]*[白金重量]+[皓石价格]*[皓石重量]+[钻石价格]*1.5*[钻石重量]+[硬金价格]*1.67*[硬金重量]’;

<code class=" hljs bash"><span class="hljs-variable">$pattern</span> = <span class="hljs-string">"/\\[([\x{4e00}-\x{9fa5}]+)_价格\\]/u"</span>;<span class="hljs-variable">$res</span> = preg_match_all(<span class="hljs-variable">$pattern</span>, <span class="hljs-variable">$s</span>, <span class="hljs-variable">$matches</span>);var_dump(<span class="hljs-variable">$matches</span>);</code>

这样就能把羊脂玉/白金/皓石/钻石/硬金全部提取出来啦

版权声明:本文为博主原创文章,未经博主允许不得转载。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。