當(dāng)前位置：首頁(yè) > 编程语言 > python >内容正文

python

菜鸟教程python正则表达式_python 正则表达式详解

發(fā)布時(shí)間：2024/9/18 python 39 豆豆

生活随笔收集整理的這篇文章主要介紹了菜鸟教程python正则表达式_python 正则表达式详解小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

python 正則表達(dá)式詳解

1. 正則表達(dá)式模式

模式描述

匹配字符串的開(kāi)頭

匹配字符串的末尾。

匹配任意字符，除了換行符，當(dāng)re.DOTALL標(biāo)記被指定時(shí)，則可以匹配包括換行符的任意字符。

[...]

用來(lái)表示一組字符,單獨(dú)列出：[amk] 匹配 'a'，'m'或'k'

[^...]

不在[]中的字符：[^abc] 匹配除了a,b,c之外的字符。

re*

匹配0個(gè)或多個(gè)的表達(dá)式。

re+

匹配1個(gè)或多個(gè)的表達(dá)式。

re?

匹配0個(gè)或1個(gè)由前面的正則表達(dá)式定義的片段，非貪婪方式

re{ n}

匹配n個(gè)前面表達(dá)式。例如，"o{2}"不能匹配"Bob"中的"o"，但是能匹配"food"中的兩個(gè)o。

re{ n,}

精確匹配n個(gè)前面表達(dá)式。例如，"o{2,}"不能匹配"Bob"中的"o"，但能匹配"foooood"中的所有o。"o{1,}"等價(jià)于"o+"。"o{0,}"則等價(jià)于"o*"。

re{ n, m}

匹配 n 到 m 次由前面的正則表達(dá)式定義的片段，貪婪方式

a| b

匹配a或b

(re)

匹配括號(hào)內(nèi)的表達(dá)式，也表示一個(gè)組

(?imx)

正則表達(dá)式包含三種可選標(biāo)志：i, m, 或 x 。只影響括號(hào)中的區(qū)域。

(?-imx)

正則表達(dá)式關(guān)閉 i, m, 或 x 可選標(biāo)志。只影響括號(hào)中的區(qū)域。

(?: re)

類(lèi)似 (...), 但是不表示一個(gè)組

(?imx: re)

在括號(hào)中使用i, m, 或 x 可選標(biāo)志

(?-imx: re)

在括號(hào)中不使用i, m, 或 x 可選標(biāo)志

(?#...)

注釋.

(?= re)

前向肯定界定符。如果所含正則表達(dá)式，以 ... 表示，在當(dāng)前位置成功匹配時(shí)成功，否則失敗。但一旦所含表達(dá)式已經(jīng)嘗試，匹配引擎根本沒(méi)有提高；模式的剩余部分還要嘗試界定符的右邊。

(?! re)

前向否定界定符。與肯定界定符相反；當(dāng)所含表達(dá)式不能在字符串當(dāng)前位置匹配時(shí)成功。

(?> re)

匹配的獨(dú)立模式，省去回溯。

匹配數(shù)字字母下劃線

匹配非數(shù)字字母下劃線

匹配任意空白字符，等價(jià)于 [\t\n\r\f]。

匹配任意非空字符

匹配任意數(shù)字，等價(jià)于 [0-9]。

匹配任意非數(shù)字

匹配字符串開(kāi)始

匹配字符串結(jié)束，如果是存在換行，只匹配到換行前的結(jié)束字符串。

匹配字符串結(jié)束

匹配最后匹配完成的位置。

匹配一個(gè)單詞邊界，也就是指單詞和空格間的位置。例如， 'er\b' 可以匹配"never" 中的 'er'，但不能匹配 "verb" 中的 'er'。

匹配非單詞邊界。'er\B' 能匹配 "verb" 中的 'er'，但不能匹配 "never" 中的 'er'。

\n, \t, 等。

匹配一個(gè)換行符。匹配一個(gè)制表符, 等

\1...\9

匹配第n個(gè)分組的內(nèi)容。

\10

匹配第n個(gè)分組的內(nèi)容，如果它經(jīng)匹配。否則指的是八進(jìn)制字符碼的表達(dá)式。

2. 正則表達(dá)式修飾符 - 可選標(biāo)志

修飾符描述

re.I

使匹配對(duì)大小寫(xiě)不敏感

re.L

做本地化識(shí)別（locale-aware）匹配

re.M

多行匹配，影響 ^ 和 $

re.S

使 . 匹配包括換行在內(nèi)的所有字符

re.U

根據(jù)Unicode字符集解析字符。這個(gè)標(biāo)志影響 \w, \W, \b, \B.

re.X

該標(biāo)志通過(guò)給予你更靈活的格式以便你將正則表達(dá)式寫(xiě)得更易于理解。

3. 字符串的常用操作：一對(duì)一匹配

s1 = '菜鳥(niǎo)程序員_Python'

print(s1.find('程序員'))

4. re.findall() 函數(shù)

(1): \w 匹配中文,字母,數(shù)字,下劃線

import re

name = "菜鳥(niǎo)程序員-re.findall() 詳解"

print(re.findall("\w",name))#['菜', '鳥(niǎo)', '程', '序', '員', 'r', 'e', 'f', 'i', 'n', 'd', 'a', 'l', 'l', '詳', '解']

(2): \W 不匹配中文,字母,數(shù)字,下劃線

import re

name = "菜鳥(niǎo)程序員-re.findall() 詳解"

print(re.findall("\W",name))#['-', '.', '(', ')', ' ']

(3): \s 匹配任意的空白符

import re

name = "菜鳥(niǎo)程序員-re.findall() 詳解"

print(re.findall("\s",name))#[' ']

(4): \S 匹配不是任意的空白符

import re

name = "菜鳥(niǎo)程序員-re.findall() 詳解"

print(re.findall("\S",name))#['菜', '鳥(niǎo)', '程', '序', '員', '-', 'r', 'e', '.', 'f', 'i', 'n', 'd', 'a', 'l', 'l', '(', ')', '詳', '解']

(5): \d 匹配數(shù)字

import re

name = "菜鳥(niǎo)程序員-re.findall() 詳解 2020/03/09"

print(re.findall("\d",name))#['2', '0', '2', '0', '0', '3', '0', '9']

(6): \D 匹配非數(shù)字

import re

name = "菜鳥(niǎo)程序員-re.findall() 詳解 2020/03/09"

print(re.findall("\D",name))#['菜', '鳥(niǎo)', '程', '序', '員', '-', 'r', 'e', '.', 'f', 'i', 'n', 'd', 'a', 'l', 'l', '(', ')', ' ', '詳', '解', ' ', '/', '/']

(7): \A 與 ^ 從字符串開(kāi)頭匹配

import re

name = "菜鳥(niǎo)程序員-re.findall() 詳解"

print(re.findall("\A菜鳥(niǎo)程序員",name))print(re.findall("^菜鳥(niǎo)程序員",name))#['菜鳥(niǎo)程序員']#['菜鳥(niǎo)程序員']

(8): \Z 與 \z 與 $ 字符串結(jié)尾匹配

字符串結(jié)束位置與則符合就匹配，否則不匹配，返回值是list

import re

name = "菜鳥(niǎo)程序員-re.findall() 詳解"

print(re.findall("詳解\Z",name))print(re.findall("詳解\z",name))print(re.findall("詳解$",name))#['詳解']#[]#['詳解']

(9): . 匹配任意字符(換行符除外,re.DOTALL)

import re

name = "菜鳥(niǎo)程序員-re.findall() 詳解 \r\n"

print(re.findall(".",name))print(re.findall(".",name,re.DOTALL))#['菜', '鳥(niǎo)', '程', '序', '員', '-', 'r', 'e', '.', 'f', 'i', 'n', 'd', 'a', 'l', 'l', '(', ')', ' ', '詳', '解', ' ', '\r']#['菜', '鳥(niǎo)', '程', '序', '員', '-', 'r', 'e', '.', 'f', 'i', 'n', 'd', 'a', 'l', 'l', '(', ')', ' ', '詳', '解', ' ', '\r', '\n']

(10): ? 匹配?前元素0個(gè)或1個(gè)

問(wèn)號(hào)前面的一個(gè)字符可以是0次或1次，返回值是list

import re

name = "菜鳥(niǎo)程序員-re.findall() 詳解 \r\n"

print(re.findall("re?",name))#['re']

(11): ***** 匹配 * 前面元素0個(gè)或多個(gè) [貪婪匹配]

星號(hào)前面的一個(gè)字符可以是0次或多次，返回值是list

import re

name = "re - python_re - python_re.findall()"

print(re.findall("re*",name))print(re.findall("python_re*",name))#['re', 're', 're']#['python_re', 'python_re']

(12): + 匹配 +前面元素1個(gè)或多個(gè) [貪婪匹配]

加號(hào)前面的一個(gè)字符可以是1次或多次，返回值是list

import re

name = "re - python_re - python_re.findall()"

print(re.findall("re+",name))print(re.findall("python_re+",name))#['re', 're', 're']#['python_re', 'python_re']

(13): {n,m} 匹配n到m個(gè)元素

匹配前一個(gè)字符n-m次，返回值是list

import re

name = "re - python_re - python_re.findall()"

print(re.findall("re{1}",name))print(re.findall("re{1,2}",name))print(re.findall("python{1,2}",name))#['re', 're', 're']#['re', 're', 're']#['python', 'python']

(14): .* 任意內(nèi)容0個(gè)或多個(gè)

import re

name = "re - python_re - python_re.findall()"

print(re.findall(".*",name))#['re - python_re - python_re.findall()', '']

(15): **.*?** 任意內(nèi)容0個(gè)或1個(gè)

import re

name = "re - python_re - python_re.findall()"

print(re.findall("python.?re",name)) #.? 表示"一個(gè)"任意字符

print(re.findall("py.*?re",name)) #.*? 表示任意個(gè)任意內(nèi)容

#['python_re', 'python_re']#['python_re', 'python_re']

(16): [] 獲取括號(hào)中的內(nèi)容

import re

name = "菜鳥(niǎo)程序員_Python-re.findall() 詳解 2020/03/09"

print(re.findall("[0-9]",name)) #匹配數(shù)字0-9

print(re.findall("[a-z]",name)) #[a-z]匹配小寫(xiě)字母a-z

print(re.findall("A-z]",name)) #是按照ascii碼表位進(jìn)行匹配的

print(re.findall("[a-zA-Z]",name)) #[a-zA-Z] 匹配字母不管大小寫(xiě)

print(re.findall("[^A-z]",name)) #[^A-z] 有上尖號(hào)就是取反,獲取不是字母和特定的幾個(gè)字符

print(re.findall("[-+*]",name)) #如果想要匹配到-,就需要進(jìn)行如下操作(將-號(hào)放到最前面)

#['2', '0', '2', '0', '0', '3', '0', '9']#['y', 't', 'h', 'o', 'n', 'r', 'e', 'f', 'i', 'n', 'd', 'a', 'l', 'l']#[]#['P', 'y', 't', 'h', 'o', 'n', 'r', 'e', 'f', 'i', 'n', 'd', 'a', 'l', 'l']#['菜', '鳥(niǎo)', '程', '序', '員', '-', '.', '(', ')', ' ', '詳', '解', ' ', '2', '0', '2', '0', '/', '0', '3', '/', '0', '9']#['-']

(17): () 分組定制一個(gè)匹配規(guī)則

import re

name = "菜鳥(niǎo)程序員_Python-re.findall() 詳解 2020/03/09"

print(re.findall("(.*?) 詳解",name))

href= "菜鳥(niǎo)程序員_Python"

print(re.findall("href='(.*?)'",href))#['菜鳥(niǎo)程序員_Python-re.findall()']#['https://www.cnblogs.com/xingxingnbsp/p/12420761.html']

(18): | 匹配左邊或者右邊,也可以理解成或

import re

name = "python-re&python-file&python-re.findall()"

print(re.findall('python|re|python-re', name))print(re.findall('&(python|re)',name))print(re.findall('&(?:python|re)',name))#['python', 're', 'python', 'python', 're']#['python', 'python']#['&python', '&python']

5. re.match() 詳解

re.match 嘗試從字符串的起始位置匹配一個(gè)模式，如果不是起始位置匹配成功的話，match()就返回none。

函數(shù)語(yǔ)法:

re.match(pattern, string, flags=0)

參數(shù)說(shuō)明:

pattern : 匹配的正則表達(dá)式

string : 要匹配的字符串。

flags : 標(biāo)志位，用于控制正則表達(dá)式的匹配方式，如：是否區(qū)分大小寫(xiě)，多行匹配等等。

匹配成功re.match方法返回一個(gè)匹配的對(duì)象，否則返回None。

我們可以使用group(num) 或 groups() 匹配對(duì)象函數(shù)來(lái)獲取匹配表達(dá)式。group(num=0): 匹配的整個(gè)表達(dá)式的字符串，

group() 可以一次輸入多個(gè)組號(hào)，在這種情況下它將返回一個(gè)包含那些組所對(duì)應(yīng)值的元組。

groups(): 返回一個(gè)包含所有小組字符串的元組，從 1 到所含的小組號(hào)。

(1) 實(shí)例一：

import re

href = 'https://www.cnblogs.com/xingxingnbsp/p/12420761.html scrapy 基礎(chǔ)教程'

print(re.match('https', href).span()) #在起始位置匹配

print(re.match('www', href)) #不在起始位置匹配

#(0, 5)#None

(2) 實(shí)例二：

import re

href = 'https://www.cnblogs.com/xingxingnbsp/p/12420761.html scrapy 基礎(chǔ)教程'match_obj= re.match(r'https://(.*)xingxingnbsp(.*?) .*', href, re.M |re.I)ifmatch_obj:print("match_obj.group() :", match_obj.group())print("match_obj.group(1) :", match_obj.group(1))print("match_obj.group(2) :", match_obj.group(2))else:print("No match!!")#match_obj.group() : https://www.cnblogs.com/xingxingnbsp/p/12420761.html scrapy 基礎(chǔ)教程#match_obj.group(1) : www.cnblogs.com/#match_obj.group(2) : /p/12420761.html

(3) 練習(xí)一：（完成手機(jī)號(hào)匹配）

importre

#練習(xí)1：完成手機(jī)號(hào)匹配#phone_number = input("請(qǐng)輸入手機(jī)號(hào):")

phone_number = "18582896123"match_obj= re.match(r'0?(13|14|15|16|17|18|19)[0-9]{9}', phone_number)ifmatch_obj:print(phone_number + "：手機(jī)號(hào)碼正常")else:print(phone_number + "：手機(jī)號(hào)碼異常")

(4) 練習(xí)二：（完成郵箱的匹配）

import re

#練習(xí)2：完成郵箱的匹配#mailbox = input("請(qǐng)輸入郵箱號(hào):")

mailbox = "123456789@qq.com"match_obj= re.match(r'\w[-\w.+]*@([A-Za-z0-9][-A-Za-z0-9]+\.)+[A-Za-z]{2,14}', mailbox)ifmatch_obj:print(mailbox + "：郵箱號(hào)碼正常")else:print(mailbox + "：郵箱號(hào)碼異常")

(5) 練習(xí)三：（完成網(wǎng)址的匹配）

import re

#練習(xí)3：完成網(wǎng)址的匹配#href = input("請(qǐng)輸入U(xiǎn)RL地址:")

href = "https://www.cnblogs.com/xingxingnbsp/p/12420761.html"match_obj= re.match(r'(http|ftp|https):\/\/[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&:/~\+#]*[\w\-\@?^=%&/~\+#])?', href)ifmatch_obj:print(href + "：URL地址正常")else:print(href + "：URL地址異常")

6. re.search() 詳解

re.search 掃描整個(gè)字符串并返回第一個(gè)成功的匹配。

函數(shù)語(yǔ)法:

re.search(pattern, string, flags=0)

參數(shù)說(shuō)明:

pattern 匹配的正則表達(dá)式

string 要匹配的字符串。

flags 標(biāo)志位，用于控制正則表達(dá)式的匹配方式，如：是否區(qū)分大小寫(xiě)，多行匹配等等。

匹配成功re.search方法返回一個(gè)匹配的對(duì)象，否則返回None。

我們可以使用group(num) 或 groups() 匹配對(duì)象函數(shù)來(lái)獲取匹配表達(dá)式。

group(num=0) 匹配的整個(gè)表達(dá)式的字符串，group() 可以一次輸入多個(gè)組號(hào)，在這種情況下它將返回一個(gè)包含那些組所對(duì)應(yīng)值的元組。

groups() 返回一個(gè)包含所有小組字符串的元組，從 1 到所含的小組號(hào)。

(1) 實(shí)例一：

import re

href = "https://www.cnblogs.com/xingxingnbsp/p/12420761.html"

print(re.search('cnblogs', href).span()) #不在起始位置匹配

print(re.search('xingxingnbsp', href).span()) #不在起始位置匹配

#(12, 19)#(24, 36)

(2) 實(shí)例二：

import re

href = "https://www.cnblogs.com/xingxingnbsp/p/12420761.html scrapy 基礎(chǔ)教程"search_obj= re.search(r'https://(.*)xingxingnbsp(.*?) .*', href, re.M |re.I)ifsearch_obj:print("search_obj.group() :", search_obj.group())print("search_obj.group(1) :", search_obj.group(1))print("search_obj.group(2) :", search_obj.group(2))else:print("No search!!")#search_obj.group() : https://www.cnblogs.com/xingxingnbsp/p/12420761.html scrapy 基礎(chǔ)教程#search_obj.group(1) : www.cnblogs.com/#search_obj.group(2) : /p/12420761.html

(3) 練習(xí)一：（完成手機(jī)號(hào)匹配）

importre#練習(xí)1：完成手機(jī)號(hào)匹配#phone_number = input("請(qǐng)輸入手機(jī)號(hào):")

phone_number = "18582896123"search_obj= re.search(r'0?(13|14|15|16|17|18|19)[0-9]{9}', phone_number)ifsearch_obj:print(phone_number + "：手機(jī)號(hào)碼正常")else:print(phone_number + "：手機(jī)號(hào)碼異常")

(4) 練習(xí)二：（完成郵箱的匹配）

import re

#練習(xí)2：完成郵箱的匹配#mailbox = input("請(qǐng)輸入郵箱號(hào):")

mailbox = "123456789@qq.com"mailbox= "123456789@qq.com"search_obj= re.match(r'\w[-\w.+]*@([A-Za-z0-9][-A-Za-z0-9]+\.)+[A-Za-z]{2,14}', mailbox)ifsearch_obj:print(mailbox + "：郵箱號(hào)碼正常")else:print(mailbox + "：郵箱號(hào)碼異常")

(5) 練習(xí)三：（完成網(wǎng)址的匹配）

import re

#練習(xí)3：完成網(wǎng)址的匹配#href = input("請(qǐng)輸入U(xiǎn)RL地址:")

href = "https://www.cnblogs.com/xingxingnbsp/p/12420761.html"search_obj= re.match(r'(http|ftp|https):\/\/[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&:/~\+#]*[\w\-\@?^=%&/~\+#])?', href)ifsearch_obj:print(href + "：URL地址正常")else:print(href + "：URL地址異常")

7. re.match與re.search的區(qū)別

re.match 只匹配字符串的開(kāi)始，如果字符串開(kāi)始不符合正則表達(dá)式，則匹配失敗，函數(shù)返回 None，

而 re.search 匹配整個(gè)字符串，直到找到一個(gè)匹配。

importre

href= "https://www.cnblogs.com/xingxingnbsp/p/12420761.html"match_obj= re.match(r'xingxingnbsp', href, re.M |re.I)ifmatch_obj:print("match_obj.group() :", match_obj.group())else:print("No match!!")

search_obj= re.search(r'xingxingnbsp', href, re.M |re.I)ifsearch_obj:print("search_obj.group() :", search_obj.group())else:print("No match!!")

8. 檢索和替換

(1) sub()函數(shù)

Python 的re模塊提供了re.sub用于替換字符串中的匹配項(xiàng)。

語(yǔ)法：

re.sub(pattern, repl, string, count=0, flags=0)

參數(shù)：

pattern : 正則中的模式字符串。

repl : 替換的字符串，也可為一個(gè)函數(shù)。

string : 要被查找替換的原始字符串。

count : 模式匹配后替換的最大次數(shù)，默認(rèn) 0 表示替換所有的匹配。

flags : 編譯時(shí)用的匹配模式，數(shù)字形式。

前三個(gè)為必選參數(shù)，后兩個(gè)為可選參數(shù)。

實(shí)例一：

importrer=re.sub("A\w","Python","AbAbcAbcdAbcdeAbcdef") #替換匹配成功的指定位置字符串,并且返回替換次數(shù)，可以用兩個(gè)變量分別接受

print(r) #返回替換后的字符串

#PythonPythoncPythoncdPythoncdePythoncdef

實(shí)例二：

importre

phone= "185-8289-1234 # 這是一個(gè)電話號(hào)碼"num= re.sub(r'#.*$', "", phone) #將# 這是一個(gè)電話號(hào)碼替換為''

print("電話號(hào)碼 :", num)

num= re.sub(r'\D', "", phone) #獲取除了數(shù)字其他的字符并替換為''

print("電話號(hào)碼 :", num)#電話號(hào)碼 : 185-8289-1234#電話號(hào)碼 : 18582891234

實(shí)例三：

importre

string= 'PHP是最好的開(kāi)發(fā)語(yǔ)言，PHP就是一個(gè)普通開(kāi)發(fā)語(yǔ)言，PHP牛逼。'

print("替換之前的字符串：" +string)print("替換之后的字符串：" + re.sub('PHP', 'Python', string))#替換之前的字符串：PHP是最好的開(kāi)發(fā)語(yǔ)言，PHP就是一個(gè)普通開(kāi)發(fā)語(yǔ)言，PHP牛逼。#替換之后的字符串：Python是最好的開(kāi)發(fā)語(yǔ)言，Python就是一個(gè)普通開(kāi)發(fā)語(yǔ)言，Python牛逼。

實(shí)例四：（當(dāng)repl 為函數(shù)時(shí)）

import re

defdouble(matched):

value= int(matched.group('value'))return str(value * 2)

s= '我的金幣數(shù)為2000'

print(re.sub('(?P\d+)', double, s))#我的金幣數(shù)為4000

(2) subn()函數(shù)

替換匹配成功的指定位置字符串,并且返回替換次數(shù)，可以用兩個(gè)變量分別接受

語(yǔ)法：

re.subn(pattern, repl, string, count=0, flags=0)

參數(shù)：

pattern : 正則中的模式字符串。

repl : 替換的字符串，也可為一個(gè)函數(shù)。

string : 要被查找替換的原始字符串。

count : 模式匹配后替換的最大次數(shù)，默認(rèn) 0 表示替換所有的匹配。

flags : 編譯時(shí)用的匹配模式，數(shù)字形式。

前三個(gè)為必選參數(shù)，后兩個(gè)為可選參數(shù)。

實(shí)例一：

importre

a,b=re.subn("A\w","Python","AbAbcAbcdAbcdeAbcdef") #替換匹配成功的指定位置字符串,并且返回替換次數(shù)，可以用兩個(gè)變量分別接受

print(a) #返回替換后的字符串

print(b) #返回替換次數(shù)

#PythonPythoncPythoncdPythoncdePythoncdef#5

(3)compile 函數(shù)

compile 函數(shù)用于編譯正則表達(dá)式，生成一個(gè)正則表達(dá)式（ Pattern ）對(duì)象，供 match() 和 search() 這兩個(gè)函數(shù)使用。

語(yǔ)法格式為：

re.compile(pattern[,flags])

參數(shù)：

pattern : 一個(gè)字符串形式的正則表達(dá)式

flags 可選，表示匹配模式，比如忽略大小寫(xiě)，多行模式等，具體參數(shù)為：

re.I 忽略大小寫(xiě)

re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依賴(lài)于當(dāng)前環(huán)境

re.M 多行模式

re.S 即為' . '并且包括換行符在內(nèi)的任意字符（' . '不包括換行符）

re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依賴(lài)于 Unicode 字符屬性數(shù)據(jù)庫(kù)

re.X 為了增加可讀性，忽略空格和' # '后面的注釋

實(shí)例一：

importre

pattern= re.compile(r'\w[-\w.+]*@([A-Za-z0-9][-A-Za-z0-9]+\.)+[A-Za-z]{2,14}')

str= '123456789@qq.com'm=pattern.search(str)print(m.group())#123456789@qq.com

實(shí)例二：

importre

pattern= re.compile(r'([a-z]+) ([a-z]+)', re.I) #re.I 表示忽略大小寫(xiě)

m = pattern.match('Hello World Wide Web')print(m) #匹配成功，返回一個(gè) Match 對(duì)象

print(m.group(0)) #返回匹配成功的整個(gè)子串

print(m.span(0)) #返回匹配成功的整個(gè)子串的索引

print(m.group(1)) #返回第一個(gè)分組匹配成功的子串

print(m.span(1)) #返回第一個(gè)分組匹配成功的子串的索引

print(m.group(2)) #返回第二個(gè)分組匹配成功的子串

print(m.span(2)) #返回第二個(gè)分組匹配成功的子串索引

print(m.groups()) #等價(jià)于 (m.group(1), m.group(2), ...)

print(m.group(3)) #不存在第三個(gè)分組

"""<_sre.SRE_Match object; span=(0, 11), match='Hello World'>

Traceback (most recent call last):

Hello World

(0, 11)

Hello

(0, 5)

World

(6, 11)

('Hello', 'World')

File "D:/projects/學(xué)習(xí)項(xiàng)目目錄/python相關(guān)/python 常用模塊/python-re/5. 檢索和替換.py", line 130, in

print(m.group(3)) # 不存在第三個(gè)分組

IndexError: no such group"""

(4) split 函數(shù)

split 方法按照能夠匹配的子串將字符串分割后返回列表，它的使用形式如下：

re.split(pattern, string[, maxsplit=0, flags=0])

參數(shù)：

pattern　　　匹配的正則表達(dá)式

string　　　　要匹配的字符串。

maxsplit　　分隔次數(shù)，maxsplit=1 分隔一次，默認(rèn)為 0，不限制次數(shù)。

flags　　　　標(biāo)志位，用于控制正則表達(dá)式的匹配方式，如：是否區(qū)分大小寫(xiě)，多行匹配等等。參見(jiàn)：正則表達(dá)式修飾符 - 可選標(biāo)志

實(shí)例一：

importre

string= "python,python2,python3"re_split= re.split("\W+",string) #匹配非數(shù)字字母下劃線并分割字符串

python_split = string.split(',') #python自帶的分割方法

print(re_split)print(python_split)#['python', 'python2', 'python3']#['python', 'python2', 'python3']

實(shí)例二：

importre

string= "python,python2,python3"re_split_1= re.split("(\W+)",string) #匹配非數(shù)字字母下劃線并分割字符串

re_split_2 = re.split('\W+', string, 1) #匹配非數(shù)字字母下劃線只分割一次

re_split_3 = re.split(' ', string, 1) #對(duì)于一個(gè)找不到匹配的字符串而言，split 不會(huì)對(duì)其作出分割

print(re_split_1)print(re_split_2)print(re_split_3)#['python', ',', 'python2', ',', 'python3']#['python', 'python2,python3']#['python,python2,python3']

總結(jié)

以上是生活随笔為你收集整理的菜鸟教程python正则表达式_python 正则表达式详解的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：烤瓷牙和种植牙的优缺点
下一篇： python批量读取文件名_python

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

python

菜鸟教程python正则表达式_python 正则表达式详解

總結(jié)