首頁 >後端開發 >Python教學 >如何使用 Python 正規表示式來匹配多行文字區塊:捕獲小寫和大寫元件?

如何使用 Python 正規表示式來匹配多行文字區塊:捕獲小寫和大寫元件?

DDD
DDD原創
2024-10-25 09:56:28558瀏覽

How to Match Multiline Text Blocks with Python Regular Expressions: Capturing Lowercase and Uppercase Components?

使用Python 正規表示式匹配多行文字區塊

在這個程式設計問題中,我們的目標是符合跨多行的特定格式的文字。輸入文字由小寫和大寫文字交替區塊組成,其中小寫文字代表基本成分,大寫文字代表胺基酸序列。

問題陳述

任務是在Python中建立一個正規表示式,它可以從輸入文字中捕獲兩個元件:

  1. 基本小寫組件
  2. 出現兩個的大寫行序列下面的行

輸出應分為兩個捕獲組,基本小寫組件在組(1) 中,大寫序列在組(2) 中。

要解決這個問題,我們可以利用以下正規表示式:

re.compile(r"^(.+)\n((?:\n.+)+)", re.MULTILINE)

此正規表示式以多行模式運行,這意味著^ 和$ 錨點將匹配分別是行的開頭和結尾。

解釋

  • ^(. )$:單獨配對基本小寫組件line.
  • n((?:n. ) ):符合基本元件後面的連續大寫文字行。

    • n:符合換行符。
    • (?:n. ) :非捕獲組,匹配一個或多個出現的換行符,後面跟著一個或多個非空白字元 ( )。

用法

要使用此正規表示式,您可以按照下列步驟操作:

import re

text = """
some Varying TEXT
...
[lines of uppercase text]
...
"""

regex = re.compile(r"^(.+)\n((?:\n.+)+)", re.MULTILINE)

match = regex.search(text)
if match:
    lowercase_text = match.group(1)
    uppercase_text = match.group(2)
    # Process the captured text as needed

以上是如何使用 Python 正規表示式來匹配多行文字區塊:捕獲小寫和大寫元件?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn