首頁 >後端開發 >Python教學 >筆記之 Python正規表達式

筆記之 Python正規表達式

coldplay.xixi
coldplay.xixi轉載
2021-02-01 17:58:341857瀏覽

筆記之 Python正規表達式

文章目錄

  • 0、前言
  • 1、正規表示式模式
  • 2.正規表示式修飾符- 可選標誌
    • 2.1、`re.IGNORECASE`(`re.I`)
    • 2.2、`re.ASCII` (`re.A`)
    • 2.3、`re.DOTALL`(`re.S`)
    • 2.4、`re.MULTILINE`(`re.M`)
    • 2.5、`re.VERBOSE`(re.X)
    • 2.6、修飾符的疊加
  • 3、正規表示式函數
    • #3.1、尋找單一符合項目的函數
      • Example 3.1.1
      • Example 3.1.2
      • #Example 3.1. 3
    • 3.2、尋找多個符合項目的函數
      • #Example 3.2.1
    • 3.3、分割
      • Example 3.3.1
import re

0、前言

本筆記基於菜鳥教程以及該知乎教程,融入了自己的一些學習心得。

1、正規表示式模式

筆記之 Python正規表達式

#高亮處是我的補充,因為根據實際情況確實是能符合到的
筆記之 Python正規表達式

這邊我就偷點懶了哈,直接截的是菜鳥教學的圖。

2、正規表示式修飾符- 可選標誌

#2.1、re.IGNORECASE(re.I )

雖然第1節是常數,但我們必須先簡單提一下re.findall這個函數,因為它是貫穿這一節的函數。
re.findall(pattern, string, flag=0): 從字串任意位置找出,傳回一個清單。 pattern是想要匹配的字元(字串),string是查找來源,flag是修飾符,預設是0

re.I的作用是忽略字元大小寫

text = "I'm Jasmine-Feng. My student number is No. 321432"pattern = r"Jasmine-FENG"print('Default: ', re.findall(pattern,text))print('Ignore upper/lower case: ', re.findall(pattern,text,flags=re.I))

N.B. pattern被賦了一個r字串,這個r字串的作用是避免轉義,r是raw的縮寫,也就是保持原樣的意思。可看這篇文章。一般來說,使用正規表示式都會用到這個r字串。

Default:  []Ignore upper/lower case:  ['Jasmine-Feng']Process finished with exit code 0

在預設情況下,區分大小寫,找不到ENG;若不區分,則可以找到eng。

2.2、re.ASCII(re.A)

re.A的作用是只匹配ASCII碼支援的字符,那麼具體指哪些字符呢?下圖來自百度百科。
筆記之 Python正規表達式
漢字是不在這個裡面的,所以如果修飾符是re.A的話就匹配不了漢字了哈~

text = "我是Jasmine-Feng. 我的学号是No. 321432"pattern = r"\w+"print('Default: ', re.findall(pattern,text))print('ASCII: ', re.findall(pattern,text,flags=re.A))

\w 的功能是匹配一個或多個字母數字下劃線漢字

Default:  ['我是Jasmine', 'Feng', '我的学号是No', '321432']ASCII:  ['Jasmine', 'Feng', 'No', '321432']Process finished with exit code 0

2.3、re.DOTALLre.S

筆記之 Python正規表達式

在正規表示式模式中,.是用來

text = "我\t是Jasmine-F\neng. 我%的◉学号是No. 321432"pattern = r'.*'print('Default: ', re.findall(pattern,text))print('DOTALL: ', re.findall(pattern,text,re.S))
.*的作用是符合長度至少為0的字元(串),emmm,好像是句廢話?事實上,只要整段話不被換行符號截斷,就可以得到整個字串(外加一個空字串)。
Default:  ['我\t是Jasmine-F', '', 'eng. 我%的◉学号是No. 321432', '']DOTALL:  ['我\t是Jasmine-F\neng. 我%的◉学号是No. 321432', '']Process finished with exit code 0

2.4、re.MULTILINE(re.M)##$符合定位到字串結尾,

^

定位到字串開頭,預設情況下,如果換行,是不能定位到新一行的行頭/尾的,而用re.M修飾則可以,也就是多行模式。

text = "我\t是Jasmine-F\neng. 我%的◉\n学号是No. 321432"pattern = r'.$'pattern2 = r'^.'print('Default, end: ', re.findall(pattern, text))print('MULTILINE, end: ', re.findall(pattern, text, re.M))print('Default, start: ', re.findall(pattern2, text))print('MULTILINE, start: ', re.findall(pattern2, text, re.M))
Default, end:  ['2']MULTILINE, end:  ['F', '◉', '2']Default, start:  ['我']MULTILINE, start:  ['我', 'e', '学']Process finished with exit code 0

2.5、re.VERBOSE

(re.X)

verbose是「詳實的、冗長的」意思,透過該修飾符可以在

正規表示式

中加入註解。請注意,是往pattern裡面加,不是往

text加!我一開始以為是可以往text加註釋,然後調試半天都無法得到結果。 。 。 #使用|可以疊加修飾。 #3.1、尋找單一符合項目的函數功能#search
text = '朋友们好啊!我是xxxxxx拳掌门人xxx~'pattern = r'''朋友们  # 主语
              好啊!  # 谓语
           '''print(re.findall(pattern, text,re.VERBOSE))
['朋友们好啊!']Process finished with exit code 0
2.6、修飾符的疊加
text = 'Hello everybody!\n我是xxxxxx拳掌门人xxx~'pattern = r'BODY.*$'print(re.findall(pattern, text, re.I))print(re.findall(pattern, text, re.M))print(re.findall(pattern, text, re.M | re.I))
[][]['body!']Process finished with exit code 0
3、正規表示式函數
#函數
從任何位置開始搜尋

############match#########從開頭搜索,不用完全符合##############fullmatch#### #####從開頭搜索,必須完全匹配###############其實我本來是寫了自己的例子的,但是瀏覽器給我誤關了,又沒保存(心態直接炸裂

以上是筆記之 Python正規表達式的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:csdn.net。如有侵權,請聯絡admin@php.cn刪除
上一篇:詳解python列表下一篇:詳解python列表