搜尋
首頁後端開發Python教學python正規表示式如何實現重疊匹配

本篇文章為大家帶來了關於Python的相關知識,主要介紹了python 正則表達式如何實現重疊匹配,具有很好的參考價值,下面一起來看一下,希望對大家有幫助。

python正規表示式如何實現重疊匹配

【相關推薦:Python3影片教學

正規表示式實作重疊符合

import regex
string = '100101010001'
str_re = '101'
print(regex.findall(str_re, string, overlapped=True))

#普通的re庫匹配,只能匹配一個'101'。

正規表示式與正規表示式符合

正規表示式

正規表示式可理解為資料篩選的表達式,是有限個原子和元字元組成。

原子:基本組成單位,每個表達式至少有一個原子

#通用字元組成原子原子表組成原子
#普通字符组成原子
pat1 = "abcd"
 
#非打印字符组成原子
pat2 = "\n"
 
#通用字符做原子
pat3 = "\w"
 
#原子表组成原子
pat4 = "py[abc]"
#可以匹配pya,pyb,pyc,但匹配pyab等原子表重复出现的情况失败
 
#原子表开头带 ^ 表示取反
pat5 = "py[^abc]"
#第三个位置匹配除了a,b,c外的任意一个字符
普通字元組成原子

非列印字元組成原子

(不印在輸出台的字元)

##\n :換行

\t:tab退格符號

\w:符合任意字母、數字、底線

\W:與\w相反

\d:符合任十進制數

\D:與\d相反

\s :符合任意空白字符,如空格、換行、縮排

\S:與\s相反

一組原子組成一個表,由[]宣告

表內原子優先權相等,但內容只出現依序

若原子表以^ 開頭,則表示取反

#元字元:正規表示式中具有特殊意義的字元

.匹配任意字符,除了換行符^匹配字串開始的位置#$符合字串結束的位置,當出現多組符合的符合時,傳回字串最後的那組符合##*#?{ j }{ j , }{ j , k }i | j( )
匹配0,1,n 次前面的原子【貪婪模式:盡可能多的匹配】
匹配0,1 次前面的原子【懶惰模式:精確匹配】
符合1,n 次前面的原子
前面的原子出現j 次
#前面的原子至少出現j 次
前面的原子至少出現j 次,至多出現k 次
符合i 或j ,若i 與j 同時出現,匹配i
組,限制這組資料的組合如()內所描述一樣,只傳回符合括號內描述的內容
模式修正符

#即函數中flag 位置的參數,在不改變正規表示式的情況下改變其意義,調整配對結果。

re.Ire.M#多行匹配re.L本地化識別匹配#re.Ure.S
##根據unicon字元匹配,影響\w \W
#符合包含換行符


    正規匹配
正規表示式是對字串進行模糊匹配,其中一個應用為正規匹配。正規匹配是python爬蟲的使用技術,用於在爬取的文字資訊中提取目標資訊。
  • 正規符合常用的函數:(呼叫正規表示式模組re)
  • #re.search(pat, str[, flag]) :掃描字串str,傳回pat的位置(第一次成功匹配的),flag用於控制正規表示式的匹配方式
  • import re
    str = 'python'
    pat = 'pytho[a-n]'
    print(re.search(pat, str))
  • re. match(pat, str[, flag])
  • :掃描字串str開始的位置,傳回pat的位置(第一次成功符合的),flag用來控制正規表示式的符合方式【若開始就不符合則結束,回傳none】
  • <pre class='brush:php;toolbar:false;'>import re str_1 = &amp;#39;hello world&amp;#39; str_2 = &amp;#39;world hello&amp;#39; pat = &amp;#39;world&amp;#39; print(re.match(pat, str_1)) print(re.match(pat, str_2))</pre>
re.complie(pat[, flag])
    :編譯正規表示式pat,傳回正規表示式物件
  • findall(str[, pos[, endpos]])
  • :符合所有,用清單傳回string中所有符合的子字串【不只第一次】,pos和endpos可指定在string中的起始位置

re.complie(pat).findall(str):全域匹配函數,符合str中所有符合pat的子字串,裝入一個列表回傳結果

###
import re
str = "hello world hello world hello world"
pat = "hello"
print(re.complie(pat).findall(str))
print(re.complie(pat).findall(str, 5, 15))
#########re.sub(pat, repl, str[, count[, flag]])###:替換字串中的符合項目【清洗資料】,可用count指定最大替換次數######
import re
str = "400-823-823"
pat = "-"
#短横改空格,最大替换次数2
str_new = re.sub(pat, " ", str, count=2)
###【相關推薦:###Python3影片教學### 】###

以上是python正規表示式如何實現重疊匹配的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:脚本之家。如有侵權,請聯絡admin@php.cn刪除
Python中有可能理解嗎?如果是,為什麼以及如果不是為什麼?Python中有可能理解嗎?如果是,為什麼以及如果不是為什麼?Apr 28, 2025 pm 04:34 PM

文章討論了由於語法歧義而導致的Python中元組理解的不可能。建議使用tuple()與發電機表達式使用tuple()有效地創建元組。 (159個字符)

Python中的模塊和包裝是什麼?Python中的模塊和包裝是什麼?Apr 28, 2025 pm 04:33 PM

本文解釋了Python中的模塊和包裝,它們的差異和用法。模塊是單個文件,而軟件包是帶有__init__.py文件的目錄,在層次上組織相關模塊。

Python中的Docstring是什麼?Python中的Docstring是什麼?Apr 28, 2025 pm 04:30 PM

文章討論了Python中的Docstrings,其用法和收益。主要問題:Docstrings對於代碼文檔和可訪問性的重要性。

什麼是lambda功能?什麼是lambda功能?Apr 28, 2025 pm 04:28 PM

文章討論了Lambda功能,與常規功能的差異以及它們在編程方案中的效用。並非所有語言都支持他們。

什麼是休息時間,繼續並通過python?什麼是休息時間,繼續並通過python?Apr 28, 2025 pm 04:26 PM

文章討論了休息,繼續並傳遞Python,並解釋了它們在控制循環執行和程序流中的作用。

Python的通行證是什麼?Python的通行證是什麼?Apr 28, 2025 pm 04:25 PM

本文討論了Python中的“ Pass”語句,該語句是函數和類等代碼結構中用作佔位符的空操作,允許在沒有語法錯誤的情況下實現將來實現。

我們可以在Python中傳遞作為參數的函數嗎?我們可以在Python中傳遞作為參數的函數嗎?Apr 28, 2025 pm 04:23 PM

文章討論了將功能作為Python中的參數,突出了模塊化和用例(例如分類和裝飾器)等好處。

Python中的 /和//有什麼區別?Python中的 /和//有什麼區別?Apr 28, 2025 pm 04:21 PM

文章在Python中討論 /和//運營商: / for for True Division,//用於地板部門。主要問題是了解它們的差異和用例。 Character數量:158

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中