首页  >  文章  >  Java  >  如何拆分字符串并保留分隔符?

如何拆分字符串并保留分隔符?

Barbara Streisand
Barbara Streisand原创
2024-10-24 18:19:03861浏览

How to Split Strings Preserving Delimiters?

在保留分隔符的情况下拆分字符串

使用多行字符串时,通常需要使用分隔符将它们拆分为各个组成部分。但是, String.split() 的默认行为会丢弃分隔符,只留下提取的文本。

问题:

考虑以下字符串:

(Text1)(DelimiterA)(Text2)(DelimiterC)(Text3)(DelimiterB)(Text4)

使用 String.split() 分割此字符串会产生:

  • Text1
  • Text2
  • Text3
  • Text4

期望的输出:

要保留分隔符并相应地分割字符串,我们需要一种保留分隔符的方法。

解决方案:

JDK 提供了一种使用前向和后向正则表达式 (regex) 功能来实现此目的的方法。它的工作原理如下:

<code class="java">System.out.println(Arrays.toString("a;b;c;d".split("(?<=;)")));
System.out.println(Arrays.toString("a;b;c;d".split("(?=;)")));
System.out.println(Arrays.toString("a;b;c;d".split("((?<;=;)|(?=;))")));</code>

这会产生以下输出:

  • [a;, b;, c;, d]
  • [a , ;b, ;c, ;d]
  • [a, ;, b, ;, c, ;, d]

最后的输出与所需的格式对齐,其中每个分隔符都被保留,字符串被分成单独的部分。

正则表达式解释:

  • (?
  • (?=;):向前查找分号并在其后面选择一个零宽度占位符。
  • ((?

通过组合这些模式,我们可以在每个分隔符处有效地分割字符串同时保留分隔符本身作为输出的一部分。

可读性增强:

为了提高可读性,请考虑使用命名正则表达式,如下所示:

<code class="java">static public final String WITH_DELIMITER = "((?<=%1$s)|(?=%1$s))";

public void someMethod() {
    final String[] aEach = "a;b;c;d".split(String.format(WITH_DELIMITER, ";"));
    ...
}</code>

这使得正则表达式更加不言自明并且更易于维护。

以上是如何拆分字符串并保留分隔符?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn