首页 >Java >java教程 >为什么 Java 中的 String.replaceAll(\'.*\', \'a\') 结果是 \'aa\' ?

为什么 Java 中的 String.replaceAll(\'.*\', \'a\') 结果是 \'aa\' ?

Barbara Streisand
Barbara Streisand原创
2024-10-31 02:51:31917浏览

Why does String.replaceAll(

String.replaceAll(regex) 匹配行为

String.replaceAll(".*", "a") 结果的奇怪观察in "aa" 引发了有关 .* 正则表达式性质的问题。

匹配任何内容

.* 匹配任何字符序列,甚至是空字符串。因此,第一个匹配包含整个输入字符串,促使正则表达式引擎从末尾开始搜索后续匹配。

但是,.* 也可以匹配输入末尾的空字符串。因此,它找到第二个匹配项并将其替换为“a”,从而得到“aa”结果。

使用 . 和 .replaceFirst()

要防止这种行为,请使用 . 相反,因为它需要至少一个字符来匹配。或者,使用 .replaceFirst() 将替换限制为第一次出现。

行为解释

.* 匹配空字符串的事实是奇特的,值得更深入的探索。与大多数正则表达式引擎不同,Java 的正则表达式引擎在第二次与 .* 匹配后在输入中进一步移动一个字符。这种偏差在下图中很明显:

<code class="text"># Before first run
regex: |.*
input: |whatever
# After first run
regex: .*|
input: whatever|
# Before second run
regex: |.*
input: whatever|
# After second run: since .* can match an empty string, it is satisfied...
regex: .*|
input: whatever|
# However, this means the regex engine matched an empty input.
# All regex engines, in this situation, will shift
# one character further in the input.
# So, before third run, the situation is:
regex: |.*
input: whatever<|ExhaustionOfInput>
# Nothing can ever match here: out</code>

但是,值得注意的是,其他正则表达式引擎(如 GNU sed)会在第一次匹配后考虑输入已耗尽。

以上是为什么 Java 中的 String.replaceAll('.*', 'a') 结果是 'aa' ?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn