首页 >Java >java教程 >如何使用嵌入的引号拆分逗号分隔的字符串?

如何使用嵌入的引号拆分逗号分隔的字符串?

DDD
DDD原创
2024-12-07 08:11:11194浏览

How to Split Comma-Delimited Strings with Embedded Quotes?

使用嵌入引号拆分分隔文本

解析采用逗号分隔格式的文本时,处理嵌入的引号可能会带来挑战。本文解决了这个问题,提供了一种解决方案,可以用逗号分割字符串,同时保留引号内文本的完整性。

考虑以下文本:

123,test,444,"don't split, this",more test,1

使用基本字符串。 split(",") 方法将产生以下结果:

123
test
444
"don't split
 this"
more test
1

但是,目标是将引用的文本保留为单个实体:

123
test
444
"don't split, this"
more test
1

为了实现这一点,我们采用基于正则表达式的解决方案:

str.split(",(?=(?:[^\"]*\"[^\"]*\")*[^\"]*$)");

此表达式根据逗号分割字符串,后跟偶数个 double引号。这可确保引用文本中的逗号被忽略为分隔符。

理解正则表达式:

  • ,(?=( - 匹配逗号后跟前瞻断言。
  • (?:[^"]*"[^"]*")*:匹配以下引用文本模式的零次或多次重复:“[^”]*“(单引号后跟非引号字符,后跟另一个引号)。
  • [^”]*:匹配零个或引号前有更多非引号字符。
  • $[^"]*$:断言匹配非引号后到达字符串末尾字符。

替代语法:

为了便于阅读,您还可以使用 (?x) 修饰符将正则表达式分成多行:

String[] arr = str.split("(?x)   " + 
                     ",          " +   // Split on comma
                     "(?=        " +   // Followed by
                     "  (?:      " +   // Start a non-capture group
                     "    [^\"]* " +   // 0 or more non-quote characters
                     "    \"     " +   // 1 quote
                     "    [^\"]* " +   // 0 or more non-quote characters
                     "    \"     " +   // 1 quote
                     "  )*       " +   // 0 or more repetition of non-capture group (multiple of 2 quotes will be even)
                     "  [^\"]*   " +   // Finally 0 or more non-quotes
                     "  $        " +   // Till the end  (This is necessary, else every comma will satisfy the condition)
                     ")          "     // End look-ahead
                         );

考虑到逗号和嵌入的引号,这种方法可确保准确分割分隔文本。

以上是如何使用嵌入的引号拆分逗号分隔的字符串?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn