python正则group()的用法—正则提取括号内以及其他符号内内容
-
python正則提取括號內以及其他符號內內容,我以前學過一點點正則,但是學的不深,用的正則也是最笨的正則方法,只會group(0).
-
然而,我今天又看了下正則,發現正則的提取確實好用。無論爬蟲還是文本分析都很方便。可以 解決特定的需求。
-
舉個例子,在以前我提取dsgs(gad)gdagda的時候,正常有兩種方式:一個是字符串分割,分割幾次就能找到想要的內容一般,第二是正則,但是我的是假的正則,我以前的正則是先匹配(gad)字符串,然后再寫規則匹配gad的規則二次才能完成提取。但是如果字符串較大往往耗時費力,純粹的體力活動。并且。我以前無論啥正則,都說group(0).我一直奇怪為啥一直group(0)呢.
-
直到今天,我的疑惑才解開,才發現正則的強大之處。因為我今天要匹配處理的字符串的格式為:"2018-05-05 15:55:40 2班某某(1315426911)"這樣一個字符串,我想提取括號里面的內容。經過各方百度,終于找到合適的方法。我先把代碼和結果分享給大家:
輸出的結果為:
2018-05-05 15:55:40 2班某某(1315426911)
group(0): (1315426911)
group(1): (
group(2): 1315426911
group(3): )
group(0): (1315426911)
group(1): 1315426911
對于第一個pattern就是正常匹配,不做詳解。
對于第二個。就是把你想獲得的內容用()封裝起來。然后括號從左到右就是group(id)
第三個就不用說啦,因為只有一個括號,所以只有group(1).
值得注意的是注意真正的字符串括號"(“和”)"加斜杠轉義。如果不想轉義,還可以這么寫:pattern3=re.compile(r’[ ( ] (.*)[ ) ]’)。
同樣,在爬蟲或者遇到其他文本分析問題時候可以采用同樣方法。
其他的正則有很多大佬已經總結過,在這里就不說了(其實我也不會幾個??)。如果有錯誤,請指正!
- 如果對后端、爬蟲、數據結構算法等感性趣歡迎關注我的個人公眾號交流:bigsai
總結
以上是生活随笔為你收集整理的python正则group()的用法—正则提取括号内以及其他符号内内容的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Springboot整合redis(le
- 下一篇: python豆瓣爬虫爬取评论做成词云