日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

《Python Cookbook 3rd》笔记(2.8):多行匹配模式

發布時間:2023/12/13 python 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 《Python Cookbook 3rd》笔记(2.8):多行匹配模式 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

多行匹配模式

問題

你正在試著使用正則表達式去匹配一大塊的文本,而你需要跨越多行去匹配。

解法

這個問題很典型的出現在當你用點 (.) 去匹配任意字符的時候,忘記了點 (.) 不能匹配換行符的事實。比如,假設你想試著去匹配 C 語言分割的注釋:

>>> comment = re.compile(r'/\*(.*?)\*/') >>> text1 = '/* this is a comment */' >>> text2 = '''/* this is a ... multiline comment */ ... ''' >>> >>> comment.findall(text1) [' this is a comment '] >>> comment.findall(text2) [] >>>

為了修正這個問題,你可以修改模式字符串,增加對換行的支持。比如:

>>> comment = re.compile(r'/\*((?:.j\n)*?)\*/') >>> comment.findall(text2) [' this is a\n multiline comment '] >>>

在這個模式中, (?:.|\n) 指定了一個非捕獲組 (也就是它定義了一個僅僅用來做匹配,而不能通過單獨捕獲或者編號的組)。

討論

re.compile() 函數接受一個標志參數叫 re.DOTALL ,在這里非常有用。它可以讓正則表達式中的點 (.) 匹配包括換行符在內的任意字符。比如:

>>> comment = re.compile(r'/\*(.*?)\*/', re.DOTALL) >>> comment.findall(text2) [' this is a\n multiline comment ']

對于簡單的情況使用 re.DOTALL 標記參數工作的很好,但是如果模式非常復雜或者是為了構造字符串令牌而將多個模式合并起來,這時候使用這個標記參數就可能出現一些問題。如果讓你選擇的話,最好還是定義自己的正則表達式模式,這樣它可以在不需要額外的標記參數下也能工作的很好。

總結

以上是生活随笔為你收集整理的《Python Cookbook 3rd》笔记(2.8):多行匹配模式的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。