文章目錄
import re
0、前言
本筆記基於菜鳥教程以及該知乎教程,融入了自己的一些學習心得。
1、正規表示式模式
#高亮處是我的補充,因為根據實際情況確實是能符合到的
這邊我就偷點懶了哈,直接截的是菜鳥教學的圖。
2、正規表示式修飾符- 可選標誌
#2.1、re.IGNORECASE
(re.I
)
雖然第1節是常數,但我們必須先簡單提一下re.findall
這個函數,因為它是貫穿這一節的函數。 re.findall(pattern, string, flag=0)
: 從字串任意位置找出,傳回一個清單。 pattern
是想要匹配的字元(字串),string
是查找來源,flag
是修飾符,預設是0
re.I
的作用是忽略字元大小寫
text = "I'm Jasmine-Feng. My student number is No. 321432"pattern = r"Jasmine-FENG"print('Default: ', re.findall(pattern,text))print('Ignore upper/lower case: ', re.findall(pattern,text,flags=re.I))
N.B. pattern被賦了一個r字串,這個r字串的作用是避免轉義,r是raw的縮寫,也就是保持原樣的意思。可看這篇文章。一般來說,使用正規表示式都會用到這個r字串。
Default: []Ignore upper/lower case: ['Jasmine-Feng']Process finished with exit code 0
在預設情況下,區分大小寫,找不到ENG;若不區分,則可以找到eng。
2.2、re.ASCII
(re.A
)
re.A
的作用是只匹配ASCII碼支援的字符,那麼具體指哪些字符呢?下圖來自百度百科。
漢字是不在這個裡面的,所以如果修飾符是re.A
的話就匹配不了漢字了哈~
text = "我是Jasmine-Feng. 我的学号是No. 321432"pattern = r"\w+"print('Default: ', re.findall(pattern,text))print('ASCII: ', re.findall(pattern,text,flags=re.A))
\w
的功能是匹配一個或多個字母數字下劃線漢字
Default: ['我是Jasmine', 'Feng', '我的学号是No', '321432']ASCII: ['Jasmine', 'Feng', 'No', '321432']Process finished with exit code 0
2.3、re.DOTALL
(re.S
)
在正規表示式模式中,
.
是用來
text = "我\t是Jasmine-F\neng. 我%的◉学号是No. 321432"pattern = r'.*'print('Default: ', re.findall(pattern,text))print('DOTALL: ', re.findall(pattern,text,re.S))
.*
的作用是符合長度至少為0的字元(串),emmm,好像是句廢話?事實上,只要整段話不被換行符號截斷,就可以得到整個字串(外加一個空字串)。 Default: ['我\t是Jasmine-F', '', 'eng. 我%的◉学号是No. 321432', '']DOTALL: ['我\t是Jasmine-F\neng. 我%的◉学号是No. 321432', '']Process finished with exit code 0
2.4、re.MULTILINE(re.M
)##$
符合定位到字串結尾,
定位到字串開頭,預設情況下,如果換行,是不能定位到新一行的行頭/尾的,而用re.M修飾則可以,也就是多行模式。
text = "我\t是Jasmine-F\neng. 我%的◉\n学号是No. 321432"pattern = r'.$'pattern2 = r'^.'print('Default, end: ', re.findall(pattern, text))print('MULTILINE, end: ', re.findall(pattern, text, re.M))print('Default, start: ', re.findall(pattern2, text))print('MULTILINE, start: ', re.findall(pattern2, text, re.M))
Default, end: ['2']MULTILINE, end: ['F', '◉', '2']Default, start: ['我']MULTILINE, start: ['我', 'e', '学']Process finished with exit code 0
2.5、
re.VERBOSE
verbose是「詳實的、冗長的」意思,透過該修飾符可以在
正規表示式中加入註解。請注意,是往pattern裡面加,不是往
text
text = '朋友们好啊!我是xxxxxx拳掌门人xxx~'pattern = r'''朋友们 # 主语 好啊! # 谓语 '''print(re.findall(pattern, text,re.VERBOSE)) ['朋友们好啊!']Process finished with exit code 0 |
2.6、修飾符的疊加 |
---|---|
text = 'Hello everybody!\n我是xxxxxx拳掌门人xxx~'pattern = r'BODY.*$'print(re.findall(pattern, text, re.I))print(re.findall(pattern, text, re.M))print(re.findall(pattern, text, re.M | re.I)) [][]['body!']Process finished with exit code 0 3、正規表示式函數 |
|
| #函數 |
|
#search |
############match#########從開頭搜索,不用完全符合##############fullmatch#### #####從開頭搜索,必須完全匹配###############其實我本來是寫了自己的例子的,但是瀏覽器給我誤關了,又沒保存(心態直接炸裂
以上是筆記之 Python正規表達式的詳細內容。更多資訊請關注PHP中文網其他相關文章!