python正则表达式匹配aabb_Python正则表达式拆分多个匹配项
我正在嘗試將包含2個(gè)不同字符的序列的字符串拆分為多個(gè)組.如果我們假設(shè)字符是a和b,則用于分組的純文本規(guī)則為:
>組包含0 a,后跟1 b
>后面的所有a都包含在下一組中,除非我們?cè)趩卧~末尾.
例如:處理測(cè)試后,目標(biāo)是分成預(yù)期的組.
tests = ['abab',
'ababab',
'aabab',
'aababa',
'aba',
'baba']
expected = [['ab','ab'],
['ab','ab','ab'],
['aab','ab'],
['aab','aba'],
['aba'],
['b','aba']]
我最近得到的是以下內(nèi)容:
import re
# filter() returns iterator not list in Python 3
def testing(s):
return list(filter(None, re.compile('(a*b+a*(?=$))').split(s)))
output = [testing(s) for s in tests]
output
[['ab', 'ab'], ['abab', 'ab'], ['aab', 'ab'], ['aab', 'aba'], ['aba']]
在1-2組上效果很好,但對(duì)于大于1-2的組效果不好,這意味著我的正則表達(dá)式需要改進(jìn).我應(yīng)該重新考慮這種方法嗎?我可能可以使用for循環(huán)來(lái)做一些蠻力的工作,但是希望能做些更優(yōu)雅的事情.
N.B .: This post使我相信.split()可能不是這里的解決方法,但是到目前為止,我已經(jīng)獲得了最好的結(jié)果.
總結(jié)
以上是生活随笔為你收集整理的python正则表达式匹配aabb_Python正则表达式拆分多个匹配项的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: not enough arguments
- 下一篇: python自动获取天气_用python