ホームページ >バックエンド開発 >Python チュートリアル >Python で正規表現を使用して複数の区切り文字で文字列を分割するにはどうすればよいですか?
Python で複数の区切り文字を使用して文字列を分割する
プログラミングにおける多くのタスクには、文字列の操作が含まれます。セミコロンやカンマなどの複数の区切り文字を含む文字列を操作する場合、それらを効率的に分割することが不可欠です。
正規表現の使用
一般的なアプローチの 1 つは、正規表現を使用することです。文字列の例を考えてみましょう:
"b-staged divinylsiloxane-bis-benzocyclobutene [124221-30-3], mesitylene [000108-67-8]; polymerized 1,2-dihydro-2,2,4- trimethyl quinoline [026780-96-1]"
この文字列をセミコロンまたはカンマとそれに続くスペースで分割するには、次の正規表現を使用できます:
'; |, '
このパターンは一致しますセミコロンまたはカンマの後にスペースを入力します。 re.split() 関数を使用すると、次のように文字列を分割できます:
import re re.split('; |, ', "b-staged divinylsiloxane-bis-benzocyclobutene [124221-30-3], mesitylene [000108-67-8]; polymerized 1,2-dihydro-2,2,4- trimethyl quinoline [026780-96-1]")
注: 末尾にスペースのない個々のカンマは分割されません。
更新: 拡張区切りパターン
指定されたソリューションをさらに拡張して、以下を含めることができます。追加の区切り文字。たとえば、次の文字列をセミコロン、コンマ、アスタリスク、改行で分割するには:
"Beautiful, is; better*than\nugly"
正規表現は次のようになります:
'; |, |\*|\n'
re.split() 関数の使用前と同様:
re.split('; |, |\*|\n', 'Beautiful, is; better*than\nugly')
これにより、次の分割が行われます。結果:
['Beautiful', 'is', 'better', 'than', 'ugly']
以上がPython で正規表現を使用して複数の区切り文字で文字列を分割するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。