首頁 >後端開發 >Python教學 >為什麼「re.findall」不回傳重疊的正規表示式匹配,前瞻斷言如何解決這個問題?

為什麼「re.findall」不回傳重疊的正規表示式匹配,前瞻斷言如何解決這個問題?

Barbara Streisand
Barbara Streisand原創
2024-12-06 07:54:11939瀏覽

Why Doesn't `re.findall` Return Overlapping Regex Matches, and How Can Lookahead Assertions Solve This?

發現重疊的正規表示式比對:深入研究先行斷言

問題:
當使用re.findall 符合正規表示式模式時,為什麼它不檢索所有重疊的匹配項?例如,在字串“hello”中,為什麼正規表示式 r'ww' 只匹配“he”和“ll”而不匹配“el”和“lo”?

答案:
預設情況下,re.findall 不會產生重疊匹配。要實現此目的,請使用前瞻斷言,這是一個強大的正規表示式功能。

解:

# Using a lookahead assertion
matches = re.findall(r'(?=(\w\w))', 'hello')

# Output: ['he', 'el', 'll', 'lo']

正規表示式中的 (?=...) 構造是前瞻性斷言。如果指定的模式立即出現在當前位置之後,則它匹配,但它不會消耗字串中的任何字元。在這種情況下,它識別“hello”中的所有兩個字元序列(“ww”),而不消耗任何字元。

解釋:

  • 括號表達式 (ww) 定義要匹配的兩個字元模式。
  • (?=) 位於模式之前,表示前瞻性斷言。
  • 正規表示式引擎將遊標沿著「hello」移動,並不斷檢查接下來的兩個字元是否與模式「ww」相符。
  • 如果匹配,則記錄當前位置作為匹配。
  • 此過程繼續進行,從而檢測到所有重疊匹配:「he」、「el」、「ll」和「瞧。」

以上是為什麼「re.findall」不回傳重疊的正規表示式匹配,前瞻斷言如何解決這個問題?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn