ホームページ >Java >&#&チュートリアル >引用符が埋め込まれたカンマ区切りの文字列を分割するにはどうすればよいですか?

引用符が埋め込まれたカンマ区切りの文字列を分割するにはどうすればよいですか?

DDD
DDDオリジナル
2024-12-07 08:11:11194ブラウズ

How to Split Comma-Delimited Strings with Embedded Quotes?

引用符が埋め込まれた区切りテキストの分割

カンマ区切り形式に従うテキストを解析する場合、埋め込まれた引用符の処理が問題になる可能性があります。この記事ではこの問題に取り組み、引用符で囲まれたテキストの整合性を維持しながら文字列をカンマで分割する解決策を提供します。

次のテキストを考えてみましょう:

123,test,444,"don't split, this",more test,1

基本的な文字列を使用します。 Split(",") メソッドは次の結果を生成します:

123
test
444
"don't split
 this"
more test
1

ただし、目標は保持することです。単一のエンティティとしての引用符で囲まれたテキスト:

123
test
444
"don't split, this"
more test
1

これを実現するには、正規表現ベースのソリューションを採用します:

str.split(",(?=(?:[^\"]*\"[^\"]*\")*[^\"]*$)");

この式は、後に続くカンマに基づいて文字列を分割します。偶数個の二重引用符で囲みます。これにより、引用符で囲まれたテキスト内のカンマが区切り文字として無視されます。

正規表現の理解:

  • ,(?=( - カンマとその後に続くカンマに一致します。先読みAssertion.
  • (?:[^"]*"[^"]*")*: 次の引用符で囲まれたテキスト パターンの 0 個以上の繰り返しと一致します: "[^"]*" (単一引用符の後に続きます)
  • [^"]*: 引用符以外の文字の前にある 0 個以上の非引用文字と一致します。 quotes.
  • $[^"]*$: 非引用文字の一致後に文字列の末尾に到達したことをアサートします。

代替構文:

読みやすくするために、(?x) を使用して正規表現を複数行に分割することもできます。 modifier:

String[] arr = str.split("(?x)   " + 
                     ",          " +   // Split on comma
                     "(?=        " +   // Followed by
                     "  (?:      " +   // Start a non-capture group
                     "    [^\"]* " +   // 0 or more non-quote characters
                     "    \"     " +   // 1 quote
                     "    [^\"]* " +   // 0 or more non-quote characters
                     "    \"     " +   // 1 quote
                     "  )*       " +   // 0 or more repetition of non-capture group (multiple of 2 quotes will be even)
                     "  [^\"]*   " +   // Finally 0 or more non-quotes
                     "  $        " +   // Till the end  (This is necessary, else every comma will satisfy the condition)
                     ")          "     // End look-ahead
                         );

このアプローチにより、カンマと埋め込まれた引用符の両方を考慮して、区切り文字で区切られたテキストが正確に分割されます。

以上が引用符が埋め込まれたカンマ区切りの文字列を分割するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。