如何在使用 PREG_OFFSET_CAPTURE 的 preg_match() 之后获取 UTF-8 字符串中的正确字符偏移量？-php教程-PHP中文网

首页

后端开发

php教程

如何在使用 PREG_OFFSET_CAPTURE 的 preg_match() 之后获取 UTF-8 字符串中的正确字符偏移量？

Linda Hamilton

Dec 03, 2024 am 01:01 AM

How to Get the Correct Character Offset in UTF-8 Strings After a preg_match() with PREG_OFFSET_CAPTURE?

使用 preg_match() 获取匹配前的多字节字符计数

问题：

执行时使用 preg_match() 与 UTF-8 编码字符串进行正则表达式匹配PREG_OFFSET_CAPTURE 参数，生成的偏移量以字节为单位计算，而不是字符数。在匹配多字节字符时，这可能会出现问题，因为它们的字节长度可能与其字符长度不同。

例如，使用以下代码来匹配 UTF-8 编码字符串中的“H”字符，结果偏移量为 2，即使字符“H”位于索引处1:

$str = "\xC2\xA1Hola!";
preg_match('/H/u', $str, $a_matches, PREG_OFFSET_CAPTURE);
echo $a_matches[0][1];

解决方案：

要获取正确的字符计数偏移量，请使用 mb_strlen() 确定匹配的子字符串的长度：

$str = "\xC2\xA1Hola!";
preg_match('/H/u', $str, $a_matches, PREG_OFFSET_CAPTURE);
echo mb_strlen(substr($str, 0, $a_matches[0][1]));

这将计算 UTF-8 字符的偏移量，提供正确的结果。

以上是如何在使用 PREG_OFFSET_CAPTURE 的 preg_match() 之后获取 UTF-8 字符串中的正确字符偏移量？的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

在Laravel中使用Flash会话数据Mar 12, 2025 pm 05:08 PM

Laravel使用其直观的闪存方法简化了处理临时会话数据。这非常适合在您的应用程序中显示简短的消息，警报或通知。默认情况下，数据仅针对后续请求： $请求 -

php中的卷曲：如何在REST API中使用PHP卷曲扩展Mar 14, 2025 am 11:42 AM

PHP客户端URL（curl）扩展是开发人员的强大工具，可以与远程服务器和REST API无缝交互。通过利用Libcurl（备受尊敬的多协议文件传输库），PHP curl促进了有效的执行

PHP记录：PHP日志分析的最佳实践Mar 10, 2025 pm 02:32 PM

PHP日志记录对于监视和调试Web应用程序以及捕获关键事件，错误和运行时行为至关重要。它为系统性能提供了宝贵的见解，有助于识别问题并支持更快的故障排除

简化的HTTP响应在Laravel测试中模拟了Mar 12, 2025 pm 05:09 PM

Laravel 提供简洁的 HTTP 响应模拟语法，简化了 HTTP 交互测试。这种方法显着减少了代码冗余，同时使您的测试模拟更直观。基本实现提供了多种响应类型快捷方式： use Illuminate\Support\Facades\Http; Http::fake([ 'google.com' => 'Hello World', 'github.com' => ['foo' => 'bar'], 'forge.laravel.com' =>