ホームページ >Java >&#&チュートリアル >引用符が埋め込まれたカンマ区切りの文字列を分割するにはどうすればよいですか?
引用符が埋め込まれた区切りテキストの分割
カンマ区切り形式に従うテキストを解析する場合、埋め込まれた引用符の処理が問題になる可能性があります。この記事ではこの問題に取り組み、引用符で囲まれたテキストの整合性を維持しながら文字列をカンマで分割する解決策を提供します。
次のテキストを考えてみましょう:
123,test,444,"don't split, this",more test,1
基本的な文字列を使用します。 Split(",") メソッドは次の結果を生成します:
123 test 444 "don't split this" more test 1
ただし、目標は保持することです。単一のエンティティとしての引用符で囲まれたテキスト:
123 test 444 "don't split, this" more test 1
これを実現するには、正規表現ベースのソリューションを採用します:
str.split(",(?=(?:[^\"]*\"[^\"]*\")*[^\"]*$)");
この式は、後に続くカンマに基づいて文字列を分割します。偶数個の二重引用符で囲みます。これにより、引用符で囲まれたテキスト内のカンマが区切り文字として無視されます。
正規表現の理解:
代替構文:
読みやすくするために、(?x) を使用して正規表現を複数行に分割することもできます。 modifier:
String[] arr = str.split("(?x) " + ", " + // Split on comma "(?= " + // Followed by " (?: " + // Start a non-capture group " [^\"]* " + // 0 or more non-quote characters " \" " + // 1 quote " [^\"]* " + // 0 or more non-quote characters " \" " + // 1 quote " )* " + // 0 or more repetition of non-capture group (multiple of 2 quotes will be even) " [^\"]* " + // Finally 0 or more non-quotes " $ " + // Till the end (This is necessary, else every comma will satisfy the condition) ") " // End look-ahead );
このアプローチにより、カンマと埋め込まれた引用符の両方を考慮して、区切り文字で区切られたテキストが正確に分割されます。
以上が引用符が埋め込まれたカンマ区切りの文字列を分割するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。