使用Python 正規表示式匹配多行文字區塊
在這個程式設計問題中,我們的目標是符合跨多行的特定格式的文字。輸入文字由小寫和大寫文字交替區塊組成,其中小寫文字代表基本成分,大寫文字代表胺基酸序列。
問題陳述
任務是在Python中建立一個正規表示式,它可以從輸入文字中捕獲兩個元件:
輸出應分為兩個捕獲組,基本小寫組件在組(1) 中,大寫序列在組(2) 中。
解
要解決這個問題,我們可以利用以下正規表示式:
re.compile(r"^(.+)\n((?:\n.+)+)", re.MULTILINE)
此正規表示式以多行模式運行,這意味著^ 和$ 錨點將匹配分別是行的開頭和結尾。
解釋
n((?:n. ) ):符合基本元件後面的連續大寫文字行。
用法
要使用此正規表示式,您可以按照下列步驟操作:
import re text = """ some Varying TEXT ... [lines of uppercase text] ... """ regex = re.compile(r"^(.+)\n((?:\n.+)+)", re.MULTILINE) match = regex.search(text) if match: lowercase_text = match.group(1) uppercase_text = match.group(2) # Process the captured text as needed
以上是如何使用 Python 正規表示式來匹配多行文字區塊:捕獲小寫和大寫元件?的詳細內容。更多資訊請關注PHP中文網其他相關文章!