菜鸟教程python正则表达式_python 正则表达式详解
python 正則表達(dá)式詳解
1. 正則表達(dá)式模式
模式描述
^
匹配字符串的開(kāi)頭
$
匹配字符串的末尾。
.
匹配任意字符,除了換行符,當(dāng)re.DOTALL標(biāo)記被指定時(shí),則可以匹配包括換行符的任意字符。
[...]
用來(lái)表示一組字符,單獨(dú)列出:[amk] 匹配 'a','m'或'k'
[^...]
不在[]中的字符:[^abc] 匹配除了a,b,c之外的字符。
re*
匹配0個(gè)或多個(gè)的表達(dá)式。
re+
匹配1個(gè)或多個(gè)的表達(dá)式。
re?
匹配0個(gè)或1個(gè)由前面的正則表達(dá)式定義的片段,非貪婪方式
re{ n}
匹配n個(gè)前面表達(dá)式。例如,"o{2}"不能匹配"Bob"中的"o",但是能匹配"food"中的兩個(gè)o。
re{ n,}
精確匹配n個(gè)前面表達(dá)式。例如,"o{2,}"不能匹配"Bob"中的"o",但能匹配"foooood"中的所有o。"o{1,}"等價(jià)于"o+"。"o{0,}"則等價(jià)于"o*"。
re{ n, m}
匹配 n 到 m 次由前面的正則表達(dá)式定義的片段,貪婪方式
a| b
匹配a或b
(re)
匹配括號(hào)內(nèi)的表達(dá)式,也表示一個(gè)組
(?imx)
正則表達(dá)式包含三種可選標(biāo)志:i, m, 或 x 。只影響括號(hào)中的區(qū)域。
(?-imx)
正則表達(dá)式關(guān)閉 i, m, 或 x 可選標(biāo)志。只影響括號(hào)中的區(qū)域。
(?: re)
類(lèi)似 (...), 但是不表示一個(gè)組
(?imx: re)
在括號(hào)中使用i, m, 或 x 可選標(biāo)志
(?-imx: re)
在括號(hào)中不使用i, m, 或 x 可選標(biāo)志
(?#...)
注釋.
(?= re)
前向肯定界定符。如果所含正則表達(dá)式,以 ... 表示,在當(dāng)前位置成功匹配時(shí)成功,否則失敗。但一旦所含表達(dá)式已經(jīng)嘗試,匹配引擎根本沒(méi)有提高;模式的剩余部分還要嘗試界定符的右邊。
(?! re)
前向否定界定符。與肯定界定符相反;當(dāng)所含表達(dá)式不能在字符串當(dāng)前位置匹配時(shí)成功。
(?> re)
匹配的獨(dú)立模式,省去回溯。
\w
匹配數(shù)字字母下劃線
\W
匹配非數(shù)字字母下劃線
\s
匹配任意空白字符,等價(jià)于 [\t\n\r\f]。
\S
匹配任意非空字符
\d
匹配任意數(shù)字,等價(jià)于 [0-9]。
\D
匹配任意非數(shù)字
\A
匹配字符串開(kāi)始
\Z
匹配字符串結(jié)束,如果是存在換行,只匹配到換行前的結(jié)束字符串。
\z
匹配字符串結(jié)束
\G
匹配最后匹配完成的位置。
\b
匹配一個(gè)單詞邊界,也就是指單詞和空格間的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。
\B
匹配非單詞邊界。'er\B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。
\n, \t, 等。
匹配一個(gè)換行符。匹配一個(gè)制表符, 等
\1...\9
匹配第n個(gè)分組的內(nèi)容。
\10
匹配第n個(gè)分組的內(nèi)容,如果它經(jīng)匹配。否則指的是八進(jìn)制字符碼的表達(dá)式。
2. 正則表達(dá)式修飾符 - 可選標(biāo)志
修飾符描述
re.I
使匹配對(duì)大小寫(xiě)不敏感
re.L
做本地化識(shí)別(locale-aware)匹配
re.M
多行匹配,影響 ^ 和 $
re.S
使 . 匹配包括換行在內(nèi)的所有字符
re.U
根據(jù)Unicode字符集解析字符。這個(gè)標(biāo)志影響 \w, \W, \b, \B.
re.X
該標(biāo)志通過(guò)給予你更靈活的格式以便你將正則表達(dá)式寫(xiě)得更易于理解。
3. 字符串的常用操作:一對(duì)一匹配
s1 = '菜鳥(niǎo)程序員_Python'
print(s1.find('程序員'))
4. re.findall() 函數(shù)
(1): \w 匹配中文,字母,數(shù)字,下劃線
import re
name = "菜鳥(niǎo)程序員-re.findall() 詳解"
print(re.findall("\w",name))#['菜', '鳥(niǎo)', '程', '序', '員', 'r', 'e', 'f', 'i', 'n', 'd', 'a', 'l', 'l', '詳', '解']
(2): \W 不匹配中文,字母,數(shù)字,下劃線
import re
name = "菜鳥(niǎo)程序員-re.findall() 詳解"
print(re.findall("\W",name))#['-', '.', '(', ')', ' ']
(3): \s 匹配任意的空白符
import re
name = "菜鳥(niǎo)程序員-re.findall() 詳解"
print(re.findall("\s",name))#[' ']
(4): \S 匹配不是任意的空白符
import re
name = "菜鳥(niǎo)程序員-re.findall() 詳解"
print(re.findall("\S",name))#['菜', '鳥(niǎo)', '程', '序', '員', '-', 'r', 'e', '.', 'f', 'i', 'n', 'd', 'a', 'l', 'l', '(', ')', '詳', '解']
(5): \d 匹配數(shù)字
import re
name = "菜鳥(niǎo)程序員-re.findall() 詳解 2020/03/09"
print(re.findall("\d",name))#['2', '0', '2', '0', '0', '3', '0', '9']
(6): \D 匹配非數(shù)字
import re
name = "菜鳥(niǎo)程序員-re.findall() 詳解 2020/03/09"
print(re.findall("\D",name))#['菜', '鳥(niǎo)', '程', '序', '員', '-', 'r', 'e', '.', 'f', 'i', 'n', 'd', 'a', 'l', 'l', '(', ')', ' ', '詳', '解', ' ', '/', '/']
(7): \A 與 ^ 從字符串開(kāi)頭匹配
import re
name = "菜鳥(niǎo)程序員-re.findall() 詳解"
print(re.findall("\A菜鳥(niǎo)程序員",name))print(re.findall("^菜鳥(niǎo)程序員",name))#['菜鳥(niǎo)程序員']#['菜鳥(niǎo)程序員']
(8): \Z 與 \z 與 $ 字符串結(jié)尾匹配
字符串結(jié)束位置與則符合就匹配,否則不匹配,返回值是list
import re
name = "菜鳥(niǎo)程序員-re.findall() 詳解"
print(re.findall("詳解\Z",name))print(re.findall("詳解\z",name))print(re.findall("詳解$",name))#['詳解']#[]#['詳解']
(9): . 匹配任意字符(換行符除外,re.DOTALL)
import re
name = "菜鳥(niǎo)程序員-re.findall() 詳解 \r\n"
print(re.findall(".",name))print(re.findall(".",name,re.DOTALL))#['菜', '鳥(niǎo)', '程', '序', '員', '-', 'r', 'e', '.', 'f', 'i', 'n', 'd', 'a', 'l', 'l', '(', ')', ' ', '詳', '解', ' ', '\r']#['菜', '鳥(niǎo)', '程', '序', '員', '-', 'r', 'e', '.', 'f', 'i', 'n', 'd', 'a', 'l', 'l', '(', ')', ' ', '詳', '解', ' ', '\r', '\n']
(10): ? 匹配?前元素0個(gè)或1個(gè)
問(wèn)號(hào)前面的一個(gè)字符可以是0次或1次,返回值是list
import re
name = "菜鳥(niǎo)程序員-re.findall() 詳解 \r\n"
print(re.findall("re?",name))#['re']
(11): ***** 匹配 * 前面元素0個(gè)或多個(gè) [貪婪匹配]
星號(hào)前面的一個(gè)字符可以是0次或多次,返回值是list
import re
name = "re - python_re - python_re.findall()"
print(re.findall("re*",name))print(re.findall("python_re*",name))#['re', 're', 're']#['python_re', 'python_re']
(12): + 匹配 +前面元素1個(gè)或多個(gè) [貪婪匹配]
加號(hào)前面的一個(gè)字符可以是1次或多次,返回值是list
import re
name = "re - python_re - python_re.findall()"
print(re.findall("re+",name))print(re.findall("python_re+",name))#['re', 're', 're']#['python_re', 'python_re']
(13): {n,m} 匹配n到m個(gè)元素
匹配前一個(gè)字符n-m次,返回值是list
import re
name = "re - python_re - python_re.findall()"
print(re.findall("re{1}",name))print(re.findall("re{1,2}",name))print(re.findall("python{1,2}",name))#['re', 're', 're']#['re', 're', 're']#['python', 'python']
(14): .* 任意內(nèi)容0個(gè)或多個(gè)
import re
name = "re - python_re - python_re.findall()"
print(re.findall(".*",name))#['re - python_re - python_re.findall()', '']
(15): **.*?** 任意內(nèi)容0個(gè)或1個(gè)
import re
name = "re - python_re - python_re.findall()"
print(re.findall("python.?re",name)) #.? 表示"一個(gè)"任意字符
print(re.findall("py.*?re",name)) #.*? 表示任意個(gè)任意內(nèi)容
#['python_re', 'python_re']#['python_re', 'python_re']
(16): [] 獲取括號(hào)中的內(nèi)容
import re
name = "菜鳥(niǎo)程序員_Python-re.findall() 詳解 2020/03/09"
print(re.findall("[0-9]",name)) #匹配數(shù)字0-9
print(re.findall("[a-z]",name)) #[a-z]匹配小寫(xiě)字母a-z
print(re.findall("A-z]",name)) #是按照ascii碼表位進(jìn)行匹配的
print(re.findall("[a-zA-Z]",name)) #[a-zA-Z] 匹配字母不管大小寫(xiě)
print(re.findall("[^A-z]",name)) #[^A-z] 有上尖號(hào)就是取反,獲取不是字母和特定的幾個(gè)字符
print(re.findall("[-+*]",name)) #如果想要匹配到-,就需要進(jìn)行如下操作(將-號(hào)放到最前面)
#['2', '0', '2', '0', '0', '3', '0', '9']#['y', 't', 'h', 'o', 'n', 'r', 'e', 'f', 'i', 'n', 'd', 'a', 'l', 'l']#[]#['P', 'y', 't', 'h', 'o', 'n', 'r', 'e', 'f', 'i', 'n', 'd', 'a', 'l', 'l']#['菜', '鳥(niǎo)', '程', '序', '員', '-', '.', '(', ')', ' ', '詳', '解', ' ', '2', '0', '2', '0', '/', '0', '3', '/', '0', '9']#['-']
(17): () 分組 定制一個(gè)匹配規(guī)則
import re
name = "菜鳥(niǎo)程序員_Python-re.findall() 詳解 2020/03/09"
print(re.findall("(.*?) 詳解",name))
href= "菜鳥(niǎo)程序員_Python"
print(re.findall("href='(.*?)'",href))#['菜鳥(niǎo)程序員_Python-re.findall()']#['https://www.cnblogs.com/xingxingnbsp/p/12420761.html']
(18): | 匹配 左邊或者右邊,也可以理解成或
import re
name = "python-re&python-file&python-re.findall()"
print(re.findall('python|re|python-re', name))print(re.findall('&(python|re)',name))print(re.findall('&(?:python|re)',name))#['python', 're', 'python', 'python', 're']#['python', 'python']#['&python', '&python']
5. re.match() 詳解
re.match 嘗試從字符串的起始位置匹配一個(gè)模式,如果不是起始位置匹配成功的話,match()就返回none。
函數(shù)語(yǔ)法:
re.match(pattern, string, flags=0)
參數(shù)說(shuō)明:
pattern : 匹配的正則表達(dá)式
string : 要匹配的字符串。
flags : 標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如:是否區(qū)分大小寫(xiě),多行匹配等等。
匹配成功re.match方法返回一個(gè)匹配的對(duì)象,否則返回None。
我們可以使用group(num) 或 groups() 匹配對(duì)象函數(shù)來(lái)獲取匹配表達(dá)式。group(num=0): 匹配的整個(gè)表達(dá)式的字符串,
group() 可以一次輸入多個(gè)組號(hào),在這種情況下它將返回一個(gè)包含那些組所對(duì)應(yīng)值的元組。
groups(): 返回一個(gè)包含所有小組字符串的元組,從 1 到 所含的小組號(hào)。
(1) 實(shí)例一:
import re
href = 'https://www.cnblogs.com/xingxingnbsp/p/12420761.html scrapy 基礎(chǔ)教程'
print(re.match('https', href).span()) #在起始位置匹配
print(re.match('www', href)) #不在起始位置匹配
#(0, 5)#None
(2) 實(shí)例二:
import re
href = 'https://www.cnblogs.com/xingxingnbsp/p/12420761.html scrapy 基礎(chǔ)教程'match_obj= re.match(r'https://(.*)xingxingnbsp(.*?) .*', href, re.M |re.I)ifmatch_obj:print("match_obj.group() :", match_obj.group())print("match_obj.group(1) :", match_obj.group(1))print("match_obj.group(2) :", match_obj.group(2))else:print("No match!!")#match_obj.group() : https://www.cnblogs.com/xingxingnbsp/p/12420761.html scrapy 基礎(chǔ)教程#match_obj.group(1) : www.cnblogs.com/#match_obj.group(2) : /p/12420761.html
(3) 練習(xí)一:(完成手機(jī)號(hào)匹配)
importre
#練習(xí)1:完成手機(jī)號(hào)匹配#phone_number = input("請(qǐng)輸入手機(jī)號(hào):")
phone_number = "18582896123"match_obj= re.match(r'0?(13|14|15|16|17|18|19)[0-9]{9}', phone_number)ifmatch_obj:print(phone_number + ":手機(jī)號(hào)碼正常")else:print(phone_number + ":手機(jī)號(hào)碼異常")
(4) 練習(xí)二:(完成郵箱的匹配)
import re
#練習(xí)2:完成郵箱的匹配#mailbox = input("請(qǐng)輸入郵箱號(hào):")
mailbox = "123456789@qq.com"match_obj= re.match(r'\w[-\w.+]*@([A-Za-z0-9][-A-Za-z0-9]+\.)+[A-Za-z]{2,14}', mailbox)ifmatch_obj:print(mailbox + ":郵箱號(hào)碼正常")else:print(mailbox + ":郵箱號(hào)碼異常")
(5) 練習(xí)三:(完成網(wǎng)址的匹配)
import re
#練習(xí)3:完成網(wǎng)址的匹配#href = input("請(qǐng)輸入U(xiǎn)RL地址:")
href = "https://www.cnblogs.com/xingxingnbsp/p/12420761.html"match_obj= re.match(r'(http|ftp|https):\/\/[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&:/~\+#]*[\w\-\@?^=%&/~\+#])?', href)ifmatch_obj:print(href + ":URL地址正常")else:print(href + ":URL地址異常")
6. re.search() 詳解
re.search 掃描整個(gè)字符串并返回第一個(gè)成功的匹配。
函數(shù)語(yǔ)法:
re.search(pattern, string, flags=0)
參數(shù)說(shuō)明:
pattern 匹配的正則表達(dá)式
string 要匹配的字符串。
flags 標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如:是否區(qū)分大小寫(xiě),多行匹配等等。
匹配成功re.search方法返回一個(gè)匹配的對(duì)象,否則返回None。
我們可以使用group(num) 或 groups() 匹配對(duì)象函數(shù)來(lái)獲取匹配表達(dá)式。
group(num=0) 匹配的整個(gè)表達(dá)式的字符串,group() 可以一次輸入多個(gè)組號(hào),在這種情況下它將返回一個(gè)包含那些組所對(duì)應(yīng)值的元組。
groups() 返回一個(gè)包含所有小組字符串的元組,從 1 到 所含的小組號(hào)。
(1) 實(shí)例一:
import re
href = "https://www.cnblogs.com/xingxingnbsp/p/12420761.html"
print(re.search('cnblogs', href).span()) #不在起始位置匹配
print(re.search('xingxingnbsp', href).span()) #不在起始位置匹配
#(12, 19)#(24, 36)
(2) 實(shí)例二:
import re
href = "https://www.cnblogs.com/xingxingnbsp/p/12420761.html scrapy 基礎(chǔ)教程"search_obj= re.search(r'https://(.*)xingxingnbsp(.*?) .*', href, re.M |re.I)ifsearch_obj:print("search_obj.group() :", search_obj.group())print("search_obj.group(1) :", search_obj.group(1))print("search_obj.group(2) :", search_obj.group(2))else:print("No search!!")#search_obj.group() : https://www.cnblogs.com/xingxingnbsp/p/12420761.html scrapy 基礎(chǔ)教程#search_obj.group(1) : www.cnblogs.com/#search_obj.group(2) : /p/12420761.html
(3) 練習(xí)一:(完成手機(jī)號(hào)匹配)
importre#練習(xí)1:完成手機(jī)號(hào)匹配#phone_number = input("請(qǐng)輸入手機(jī)號(hào):")
phone_number = "18582896123"search_obj= re.search(r'0?(13|14|15|16|17|18|19)[0-9]{9}', phone_number)ifsearch_obj:print(phone_number + ":手機(jī)號(hào)碼正常")else:print(phone_number + ":手機(jī)號(hào)碼異常")
(4) 練習(xí)二:(完成郵箱的匹配)
import re
#練習(xí)2:完成郵箱的匹配#mailbox = input("請(qǐng)輸入郵箱號(hào):")
mailbox = "123456789@qq.com"mailbox= "123456789@qq.com"search_obj= re.match(r'\w[-\w.+]*@([A-Za-z0-9][-A-Za-z0-9]+\.)+[A-Za-z]{2,14}', mailbox)ifsearch_obj:print(mailbox + ":郵箱號(hào)碼正常")else:print(mailbox + ":郵箱號(hào)碼異常")
(5) 練習(xí)三:(完成網(wǎng)址的匹配)
import re
#練習(xí)3:完成網(wǎng)址的匹配#href = input("請(qǐng)輸入U(xiǎn)RL地址:")
href = "https://www.cnblogs.com/xingxingnbsp/p/12420761.html"search_obj= re.match(r'(http|ftp|https):\/\/[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&:/~\+#]*[\w\-\@?^=%&/~\+#])?', href)ifsearch_obj:print(href + ":URL地址正常")else:print(href + ":URL地址異常")
7. re.match與re.search的區(qū)別
re.match 只匹配字符串的開(kāi)始,如果字符串開(kāi)始不符合正則表達(dá)式,則匹配失敗,函數(shù)返回 None,
而 re.search 匹配整個(gè)字符串,直到找到一個(gè)匹配。
importre
href= "https://www.cnblogs.com/xingxingnbsp/p/12420761.html"match_obj= re.match(r'xingxingnbsp', href, re.M |re.I)ifmatch_obj:print("match_obj.group() :", match_obj.group())else:print("No match!!")
search_obj= re.search(r'xingxingnbsp', href, re.M |re.I)ifsearch_obj:print("search_obj.group() :", search_obj.group())else:print("No match!!")
8. 檢索和替換
(1) sub()函數(shù)
Python 的re模塊提供了re.sub用于替換字符串中的匹配項(xiàng)。
語(yǔ)法:
re.sub(pattern, repl, string, count=0, flags=0)
參數(shù):
pattern : 正則中的模式字符串。
repl : 替換的字符串,也可為一個(gè)函數(shù)。
string : 要被查找替換的原始字符串。
count : 模式匹配后替換的最大次數(shù),默認(rèn) 0 表示替換所有的匹配。
flags : 編譯時(shí)用的匹配模式,數(shù)字形式。
前三個(gè)為必選參數(shù),后兩個(gè)為可選參數(shù)。
實(shí)例一:
importrer=re.sub("A\w","Python","AbAbcAbcdAbcdeAbcdef") #替換匹配成功的指定位置字符串,并且返回替換次數(shù),可以用兩個(gè)變量分別接受
print(r) #返回替換后的字符串
#PythonPythoncPythoncdPythoncdePythoncdef
實(shí)例二:
importre
phone= "185-8289-1234 # 這是一個(gè)電話號(hào)碼"num= re.sub(r'#.*$', "", phone) #將# 這是一個(gè)電話號(hào)碼替換為''
print("電話號(hào)碼 :", num)
num= re.sub(r'\D', "", phone) #獲取除了數(shù)字其他的字符并替換為''
print("電話號(hào)碼 :", num)#電話號(hào)碼 : 185-8289-1234#電話號(hào)碼 : 18582891234
實(shí)例三:
importre
string= 'PHP是最好的開(kāi)發(fā)語(yǔ)言,PHP就是一個(gè)普通開(kāi)發(fā)語(yǔ)言,PHP牛逼。'
print("替換之前的字符串:" +string)print("替換之后的字符串:" + re.sub('PHP', 'Python', string))#替換之前的字符串:PHP是最好的開(kāi)發(fā)語(yǔ)言,PHP就是一個(gè)普通開(kāi)發(fā)語(yǔ)言,PHP牛逼。#替換之后的字符串:Python是最好的開(kāi)發(fā)語(yǔ)言,Python就是一個(gè)普通開(kāi)發(fā)語(yǔ)言,Python牛逼。
實(shí)例四:(當(dāng)repl 為函數(shù)時(shí))
import re
defdouble(matched):
value= int(matched.group('value'))return str(value * 2)
s= '我的金幣數(shù)為2000'
print(re.sub('(?P\d+)', double, s))#我的金幣數(shù)為4000
(2) subn()函數(shù)
替換匹配成功的指定位置字符串,并且返回替換次數(shù),可以用兩個(gè)變量分別接受
語(yǔ)法:
re.subn(pattern, repl, string, count=0, flags=0)
參數(shù):
pattern : 正則中的模式字符串。
repl : 替換的字符串,也可為一個(gè)函數(shù)。
string : 要被查找替換的原始字符串。
count : 模式匹配后替換的最大次數(shù),默認(rèn) 0 表示替換所有的匹配。
flags : 編譯時(shí)用的匹配模式,數(shù)字形式。
前三個(gè)為必選參數(shù),后兩個(gè)為可選參數(shù)。
實(shí)例一:
importre
a,b=re.subn("A\w","Python","AbAbcAbcdAbcdeAbcdef") #替換匹配成功的指定位置字符串,并且返回替換次數(shù),可以用兩個(gè)變量分別接受
print(a) #返回替換后的字符串
print(b) #返回替換次數(shù)
#PythonPythoncPythoncdPythoncdePythoncdef#5
(3)compile 函數(shù)
compile 函數(shù)用于編譯正則表達(dá)式,生成一個(gè)正則表達(dá)式( Pattern )對(duì)象,供 match() 和 search() 這兩個(gè)函數(shù)使用。
語(yǔ)法格式為:
re.compile(pattern[,flags])
參數(shù):
pattern : 一個(gè)字符串形式的正則表達(dá)式
flags 可選,表示匹配模式,比如忽略大小寫(xiě),多行模式等,具體參數(shù)為:
re.I 忽略大小寫(xiě)
re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依賴(lài)于當(dāng)前環(huán)境
re.M 多行模式
re.S 即為' . '并且包括換行符在內(nèi)的任意字符(' . '不包括換行符)
re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依賴(lài)于 Unicode 字符屬性數(shù)據(jù)庫(kù)
re.X 為了增加可讀性,忽略空格和' # '后面的注釋
實(shí)例一:
importre
pattern= re.compile(r'\w[-\w.+]*@([A-Za-z0-9][-A-Za-z0-9]+\.)+[A-Za-z]{2,14}')
str= '123456789@qq.com'm=pattern.search(str)print(m.group())#123456789@qq.com
實(shí)例二:
importre
pattern= re.compile(r'([a-z]+) ([a-z]+)', re.I) #re.I 表示忽略大小寫(xiě)
m = pattern.match('Hello World Wide Web')print(m) #匹配成功,返回一個(gè) Match 對(duì)象
print(m.group(0)) #返回匹配成功的整個(gè)子串
print(m.span(0)) #返回匹配成功的整個(gè)子串的索引
print(m.group(1)) #返回第一個(gè)分組匹配成功的子串
print(m.span(1)) #返回第一個(gè)分組匹配成功的子串的索引
print(m.group(2)) #返回第二個(gè)分組匹配成功的子串
print(m.span(2)) #返回第二個(gè)分組匹配成功的子串索引
print(m.groups()) #等價(jià)于 (m.group(1), m.group(2), ...)
print(m.group(3)) #不存在第三個(gè)分組
"""<_sre.SRE_Match object; span=(0, 11), match='Hello World'>
Traceback (most recent call last):
Hello World
(0, 11)
Hello
(0, 5)
World
(6, 11)
('Hello', 'World')
File "D:/projects/學(xué)習(xí)項(xiàng)目目錄/python相關(guān)/python 常用模塊/python-re/5. 檢索和替換.py", line 130, in
print(m.group(3)) # 不存在第三個(gè)分組
IndexError: no such group"""
(4) split 函數(shù)
split 方法按照能夠匹配的子串將字符串分割后返回列表,它的使用形式如下:
re.split(pattern, string[, maxsplit=0, flags=0])
參數(shù):
pattern 匹配的正則表達(dá)式
string 要匹配的字符串。
maxsplit 分隔次數(shù),maxsplit=1 分隔一次,默認(rèn)為 0,不限制次數(shù)。
flags 標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如:是否區(qū)分大小寫(xiě),多行匹配等等。參見(jiàn):正則表達(dá)式修飾符 - 可選標(biāo)志
實(shí)例一:
importre
string= "python,python2,python3"re_split= re.split("\W+",string) #匹配非數(shù)字字母下劃線 并分割字符串
python_split = string.split(',') #python自帶的分割方法
print(re_split)print(python_split)#['python', 'python2', 'python3']#['python', 'python2', 'python3']
實(shí)例二:
importre
string= "python,python2,python3"re_split_1= re.split("(\W+)",string) #匹配非數(shù)字字母下劃線 并分割字符串
re_split_2 = re.split('\W+', string, 1) #匹配非數(shù)字字母下劃線 只分割一次
re_split_3 = re.split(' ', string, 1) #對(duì)于一個(gè)找不到匹配的字符串而言,split 不會(huì)對(duì)其作出分割
print(re_split_1)print(re_split_2)print(re_split_3)#['python', ',', 'python2', ',', 'python3']#['python', 'python2,python3']#['python,python2,python3']
總結(jié)
以上是生活随笔為你收集整理的菜鸟教程python正则表达式_python 正则表达式详解的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 烤瓷牙和种植牙的优缺点
- 下一篇: python批量读取文件名_python