引用符で囲まれた文字列の適切なセグメント化
Java で文字列を操作する場合、文字列をスペースに基づいてトークンに分割することが必要になる場合があります。ただし、文字列に引用符で囲まれた部分文字列が含まれている場合は、これらを分離するのではなく、単一の実体として扱うことが重要です。この記事では、Java でこれを実現する方法について説明します。
文字列を正確にセグメント化するために、正規表現ベースのアプローチが採用されています。使用されるパターン「(1S|". ?")s」は、引用符で囲まれていない部分文字列、または引用符で囲まれた部分文字列を構成する部分文字列をキャプチャします。
実装には、指定されたパターンを持つ Matcher オブジェクトを使用して入力文字列を反復処理することが含まれます。一致する各トークンが ArrayList に追加され、目的のセグメンテーションが効果的に作成されます。
たとえば、文字列「場所 "インドへようこそ" バンガロール チャンナイ "IT 都市" マイソール」について考えてみましょう。前述のアプローチを適用すると、トークンは次のように保存されます。
[Location, "Welcome to india", Bangalore, Channai, "IT city", Mysore]
この方法では、文字列が効果的にセグメント化され、引用符で囲まれた部分文字列の整合性が維持されます。これは、引用符で囲まれたテキストが重要な意味を持つシナリオでは特に重要です。
以上がJavaで引用符で囲まれた部分文字列を含む文字列を適切にセグメント化する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。