Python 使用正则表达式中的 /b 的时候出现了问题
在所有介紹正則表達(dá)式元字符的資料中,都會(huì)提到\b,表示單詞邊界的意思。在python里寫了一段小測(cè)試代碼測(cè)試一下\b:
#!/usr/bin/env pythonimport redef t1():pattern = re.compile("\bprint\b")search = pattern.search('aaa print 123 hello')if search:print search.group(0)else:print "NO"t1()運(yùn)行此腳本以后,控制臺(tái)華麗麗地輸出一個(gè)大大的"NO",瞬間懵逼了。咋回事,難道我理解能力太差。又換了好多種自認(rèn)為沒問題的方式,都華麗麗地跟預(yù)期不對(duì)頭。
經(jīng)過長(zhǎng)時(shí)間的google(百度你是查不出來滴騷年們),終于找到了問題所在。各位同學(xué)請(qǐng)先看代碼:
#!/usr/bin/env pythonimport redef t2():pattern = re.compile(r"\bprint\b")search = pattern.search('aaa print 123 hello')if search:print "YES"print search.group(0)else:print "NO"t2()各位看官看出區(qū)別來了么。沒錯(cuò),就"\bprint\b"前頭多了個(gè)"r"。為什么會(huì)醬紫呢。
這是python字符串與正則表達(dá)式最糟糕,沒有之一的沖突。在python字符串中,"b"是反斜杠字符,ASCII值是8。如果你沒有使用 raw 字符串時(shí),那么 Python 將會(huì)把 “\b” 轉(zhuǎn)換成一個(gè)回退符,你的 RE 將無法象你希望的那樣匹配它了。
所以同學(xué)們,在使用python做正則的時(shí)候,當(dāng)你想使用\b元字符的時(shí)候,一定得注意咯。怎么做,不用我再說了吧。
為了解決這個(gè)問題,花了大概得有一個(gè)半小時(shí)查資料。所以雖然時(shí)間已經(jīng)很晚了,還是趕緊記下來再睡覺,心里才踏實(shí)。
總結(jié)
以上是生活随笔為你收集整理的Python 使用正则表达式中的 /b 的时候出现了问题的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python r‘‘, b‘‘, u‘‘
- 下一篇: 【Python】青少年蓝桥杯_每日一题_