python正则表达式在线_python正则表达式
正則表達(dá)式
正則表達(dá)式,又稱(chēng)規(guī)則表達(dá)式。(英語(yǔ):Regular Expression,在代碼中常簡(jiǎn)寫(xiě)為regex、regexp或RE),計(jì)算機(jī)科學(xué)的一個(gè)概念。正則表達(dá)式通常被用來(lái)檢索、替換那些符合某個(gè)模式(規(guī)則)的文本。
作用
1.檢測(cè)某個(gè)字符串是否符合規(guī)則.比如:判斷手機(jī)號(hào),身份證號(hào)是否合法
2.提取網(wǎng)頁(yè)字符串中想要的數(shù)據(jù).比如:爬蟲(chóng)中,提取網(wǎng)站天氣,信息,股票代碼,星座運(yùn)勢(shì)等具體關(guān)鍵字
在線(xiàn)測(cè)試工具
正則表達(dá)式包含的元素種類(lèi)
正則表達(dá)式由一些 [普通字符] 和一些 [元字符] 組成:
(1)普通字符包括大小寫(xiě)字母和數(shù)字
(2)元字符具有特殊含義,大體種類(lèi)分為如下:
1.預(yù)定義字符集,字符組
2.量詞
3.邊界符
4.分組
匹配單個(gè)字符 => [元字符] 預(yù)定義字符集
匹配多個(gè)字符 => [元字符] 量詞符號(hào)
貪婪匹配:? ?默認(rèn)向更多次數(shù)匹配? (底層用的是回溯算法)
非貪婪匹配: 默認(rèn)向更少次數(shù)匹配 (量詞的后面加?號(hào))
(1)量詞( * ? + {} )加上問(wèn)號(hào)?表示非貪婪 惰性匹配
(2)例:.*?w 表示匹配任意長(zhǎng)度任意字符遇到一個(gè)w就立即停止
匹配開(kāi)頭結(jié)尾 => [元字符] 邊界符號(hào)
匹配分組 => [元字符] 分組符號(hào)
分組
1.正常分組 ()
1) 正常情況下用()圓括號(hào)進(jìn)行分組 可以用\1 反向引用第一個(gè)圓括號(hào)匹配的內(nèi)容。
2) (?:正則表達(dá)式) 表示取消優(yōu)先顯示的功能
2.命名分組
3) (?P正則表達(dá)式) 給這個(gè)組起一個(gè)名字
4) (?P=組名) 引用之前組的名字,把該組名匹配到的內(nèi)容放到當(dāng)前位置
正則表達(dá)式修飾符
正則相關(guān)函數(shù)
findall 匹配字符串中相應(yīng)內(nèi)容,返回列表 [用法: findall("正則表達(dá)式","要匹配的字符串")]
search 通過(guò)正則匹配出第一個(gè)對(duì)象返回,通過(guò)group取出對(duì)象中的值
match 驗(yàn)證用戶(hù)輸入內(nèi)容
split 切割
sub 替換
subn 替換
finditer 匹配字符串中相應(yīng)內(nèi)容,返回迭代器
compile 指定一個(gè)統(tǒng)一的匹配規(guī)則
練習(xí)
字符組練習(xí)
>>> importre>>> print(re.findall('a[abc]b','aab abb acb adb'))
['aab', 'abb', 'acb']>>> print(re.findall('a[0123456789]b','a1b a2b a3b acb ayb'))
['a1b', 'a2b', 'a3b']>>> print(re.findall('a[abcdefg]b','a1b a2b a3b acb ayb adb'))
['acb', 'adb']>>> print(re.findall('a[ABCDEFG]b','a1b a2b a3b aAb aDb aYb'))
['aAb', 'aDb']>>> print(re.findall('a[0-9a-zA-Z]b','a-b aab aAb aWb aqba1b'))
['aab', 'aAb', 'aWb', 'aqb', 'a1b']>>> print(re.findall('a[0-9][#/]b','a1/b a2b a29b a56b a456b'))
['a1/b']>>> print(re.findall('a[^-+/]b','a%b ccaabda&bd'))
['a%b', 'aab', 'a&b']
量詞練習(xí)
1) ? 匹配0個(gè)或者一個(gè)
>>> print(re.findall('a?b','abbzab abb aab'))
['ab', 'b', 'ab', 'ab', 'b', 'ab']
2) + 匹配一個(gè)或者多個(gè)
>>> print(re.findall('a+b','b ab aaaaaab abb'))
['ab', 'aaaaaab', 'ab']
3) * 匹配0個(gè)或者多個(gè)
>>> print(re.findall('a*b','b ab aaaaaab abbbbbbb'))
['b', 'ab', 'aaaaaab', 'ab', 'b', 'b', 'b', 'b', 'b', 'b']
4) {m,n} 匹配m個(gè)至n個(gè)
>>> print(re.findall('a{1,3}b','aaab ab aab abbb aaz aabb'))
['aaab', 'ab', 'aab', 'ab', 'aab']
貪婪匹配
>>> print(re.findall('a.*b','aab ab aaaaab a!!!@#$bz'))
['aab ab aaaaab a!!!@#$b']
非貪婪匹配
>>> print(re.findall('a.*?b','aab ab aaaaab a!!!@#$bz'))
['aab', 'ab', 'aaaaab', 'a!!!@#$b']
邊界符練習(xí)
>>> strvar = "abacad"
>>> print(re.findall('a.',strvar))
['ab', 'ac', 'ad']>>> print(re.findall('^a.',strvar))
['ab']>>> print(re.findall('a.$',strvar))
['ad']>>> print(re.findall('^a.$',strvar))
[]>>> print(re.findall('^a.*?$',strvar))
['abacad']>>> print(re.findall('^a.*?a$',strvar))
[]>>> print(re.findall('^a.*?d$',strvar))
['abacad']
>>> print(re.findall('^g.*?','giveme 1gfive gay'))
['giveme']>>> print(re.findall('five$','aassfive'))
['five']>>> print(re.findall('^giveme$','giveme'))
['giveme']>>> print(re.findall('^giveme$','giveme giveme'))
[]>>> print(re.findall('giveme','giveme giveme'))
['giveme', 'giveme']>>> print(re.findall('^g.*e','gimeme 1gfive gay'))
['gimeme 1gfive']
分組練習(xí)(括號(hào))
>>> print(re.findall('.*?_z','a_z b_z c_z'))
['a_z', 'b_z', 'c_z']>>> print(re.findall('(.*?)_z','a_z b_z c_z'))
['a', 'b', 'c']>>> print(re.findall('(?:.*?)_z','a_z b_z c_z'))
['a_z', 'b_z', 'c_z']
| 代表或 , a|b 匹配字符a 或者 匹配字符b . 把字符串長(zhǎng)的寫(xiě)在前面,字符串短的寫(xiě)在后面
1.?整數(shù)或者小數(shù):^[0-9]+([.][0-9]+){0,1}$
search函數(shù)
search函數(shù)只匹配到一個(gè)就返回,返回的是對(duì)象,可以讓分組的內(nèi)容和正常匹配的結(jié)果同時(shí)顯示
group獲取對(duì)象獲取到的值
>>> obj = re.search('171[0-9]{8}|135\d{8}','17188886666 13566668888')>>>obj<_sre.sre_match object span="(0," match="17188886666">
>>> res =obj.group()>>>res'17188886666'
groups顯示分組里所有內(nèi)容
>>> obj = re.search('(www)\.(baidu|google)\.(com)','www.baidu.com wwww.google.com')>>>obj<_sre.sre_match object span="(0," match="www.baidu.com">
>>> print(obj.group())
www.baidu.com>>> print(obj.groups())
('www', 'baidu', 'com')
總結(jié)
以上是生活随笔為你收集整理的python正则表达式在线_python正则表达式的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: python asyncio理解_我实在
- 下一篇: python自建模块导入_Python模