首頁 >Java >java教程 >如何在 Java 中對帶空格的字串進行標記,排除引用的子字串?

如何在 Java 中對帶空格的字串進行標記,排除引用的子字串?

Mary-Kate Olsen
Mary-Kate Olsen原創
2024-11-20 15:01:17566瀏覽

How to Tokenize Strings with Spaces, Excluding Quoted Substrings in Java?

用空格標記字串,排除Java 中帶引號的子字串

基於空格分隔字串可能很簡單,但是如果字串被引用並且應該被視為單一標記?在 Java 中,您可以使用正規表示式實現這種細緻入微的拆分。

要處理這種情況,可以使用以下方法:

String str = "Location \"Welcome  to india\" Bangalore Channai \"IT city\"  Mysore";

List<String> list = new ArrayList<>();
Matcher m = Pattern.compile("([^\"]\S*|\".+?\")\s*").matcher(str);
while (m.find())
    list.add(m.group(1));

此處使用的正規表示式有效地將字串拆分為基於空格的標記,但它也標識引用的子字串。透過將這些帶有引號的子字串捕獲為單個標記,我們可以確保像「Welcome to india」這樣的短語保持完整。

正規表示式可以理解如下:

  • [^" ]:符合任何非雙引號 (") 的字元。
  • S*:符合零個或多個非空白字元。
  • |:管道符號表示 OR 條件。
  • ". ?":匹配雙引號,後面跟著一個或多個字元(包括空格),後面跟著雙引號。
  • s*:符合零個或多個空格字元。

這使我們能夠有效地處理帶有引號短語的複雜字串。結果清單包含代表單字或引用的短語的標記,如所提供的範例中所要求的。

以上是如何在 Java 中對帶空格的字串進行標記,排除引用的子字串?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn