为什么 Go 正则表达式 \\b 边界对于拉丁字符会失败？-Golang-PHP中文网

首页

后端开发

Golang

为什么 Go 正则表达式 \\b 边界对于拉丁字符会失败？

Barbara Streisand

Nov 03, 2024 am 04:20 AM

$Why Does Go Regex \b Boundary Fail with Latin Characters?$

b Go 正则表达式中带有拉丁字符的边界

在 Go 正则表达式的世界中，b 边界选项在处理时有一个轻微的怪癖带有拉丁字符。当尝试定义包含拉丁字符（例如重音元音和特殊字符）的单词时，就会出现此问题。

考虑以下示例，我们希望使用 b 边界选项来匹配单词“vis”：

<code class="go">import (
    "fmt"
    "regexp"
)

func main() {
    r, _ := regexp.Compile(`\b(vis)\b`)
    fmt.Println(r.MatchString("re vis e"))
    fmt.Println(r.MatchString("revise"))
    fmt.Println(r.MatchString("révisé"))
}</code>

令人惊讶的是，将“révisé”匹配为 false 的预期结果并没有出现。相反，它匹配为 true。这是因为 b 仅在 ASCII 单词边界上运行。

为了解决此问题并准确匹配拉丁字符，我们可以用更具包容性的替代方案替换 b 边界。下面是一个示例：

<code class="go">import (
    "fmt"
    "regexp"
)

func main() {
    r, _ := regexp.Compile(`(?:\A|\s)(vis)(?:\s|\z)`)
    fmt.Println(r.MatchString("vis"))
    fmt.Println(r.MatchString("re vis e"))
    fmt.Println(r.MatchString("revise"))
    fmt.Println(r.MatchString("révisé"))
}</code>

通过此修改，正则表达式现在使用字符串开头 (A)、字符串结尾 (z) 和空格 (s) 的组合来识别单词的开头和结尾。结果准确地将“vis”匹配为 true，将“révisé”匹配为 false：

true
true
false
false

无论是否存在拉丁字符，此技术都可确保准确的单词匹配。

以上是为什么 Go 正则表达式 \\b 边界对于拉丁字符会失败？的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

GO中的字符串操纵：掌握'字符串”软件包May 14, 2025 am 12:19 AM

掌握Go语言中的strings包可以提高文本处理能力和开发效率。1)使用Contains函数检查子字符串，2)用Index函数查找子字符串位置，3)Join函数高效拼接字符串切片，4)Replace函数替换子字符串。注意避免常见错误，如未检查空字符串和大字符串操作性能问题。

去'字符串”包装提示和技巧May 14, 2025 am 12:18 AM

你应该关心Go语言中的strings包，因为它能简化字符串操作，使代码更清晰高效。1)使用strings.Join高效拼接字符串；2)用strings.Fields按空白符分割字符串；3)通过strings.Index和strings.LastIndex查找子串位置；4)用strings.ReplaceAll进行字符串替换；5)利用strings.Builder进行高效字符串拼接；6)始终验证输入以避免意外结果。

GO中的'字符串”软件包：您的首选字符串操作May 14, 2025 am 12:17 AM

thestringspackageingoisesential forefficientstringManipulation.1）itoffersSimpleyetpoperfulfunctionsFortaskSlikeCheckingSslingSubstringsStringStringsStringsandStringsN.2）ithandhishiCodeDewell，withFunctionsLikestrings.fieldsfieldsfieldsfordsforeflikester.fieldsfordsforwhitespace-fieldsforwhitespace-separatedvalues.3）3）

Go Bytes软件包与字符串软件包：我应该使用哪个？May 14, 2025 am 12:12 AM

WhendecidingbetweenGo'sbytespackageandstringspackage,usebytes.Bufferforbinarydataandstrings.Builderforstringoperations.1)Usebytes.Bufferforworkingwithbyteslices,binarydata,appendingdifferentdatatypes,andwritingtoio.Writer.2)Usestrings.Builderforstrin

如何使用'字符串”软件包逐步操纵字符串May 13, 2025 am 12:12 AM

Go的strings包提供了多种字符串操作功能。1)使用strings.Contains检查子字符串。2)用strings.Split将字符串分割成子字符串切片。3)通过strings.Join合并字符串。4)用strings.TrimSpace或strings.Trim去除字符串首尾的空白或指定字符。5)用strings.ReplaceAll替换所有指定子字符串。6)使用strings.HasPrefix或strings.HasSuffix检查字符串的前缀或后缀。

Go Strings软件包：如何改进我的代码？May 13, 2025 am 12:10 AM

使用Go语言的strings包可以提升代码质量。1)使用strings.Join()优雅地连接字符串数组，避免性能开销。2)结合strings.Split()和strings.Contains()处理文本，注意大小写敏感问题。3)避免滥用strings.Replace()，考虑使用正则表达式进行大量替换。4)使用strings.Builder提高频繁拼接字符串的性能。

GO BYTES软件包中最有用的功能是什么？May 13, 2025 am 12:09 AM

Go的bytes包提供了多种实用的函数来处理字节切片。1.bytes.Contains用于检查字节切片是否包含特定序列。2.bytes.Split用于将字节切片分割成smallerpieces。3.bytes.Join用于将多个字节切片连接成一个。4.bytes.TrimSpace用于去除字节切片的前后空白。5.bytes.Equal用于比较两个字节切片是否相等。6.bytes.Index用于查找子切片在largerslice中的起始索引。

使用GO的'编码/二进制”软件包掌握二进制数据处理：综合指南May 13, 2025 am 12:07 AM

theEncoding/binarypackageingoisesenebecapeitProvidesAstandArdArdArdArdArdArdArdArdAndWriteBinaryData，确保Cross-cross-platformCompatibilitiational and handhandlingdifferentendenness.itoffersfunctionslikeread，写下，写，dearte，readuvarint，andwriteuvarint，andWriteuvarIntforPreciseControloverBinary

See all articles