正则匹配问号_爬虫之正则表达式
生活随笔
收集整理的這篇文章主要介紹了
正则匹配问号_爬虫之正则表达式
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
1什么是正則表達式
正則表達式,也稱規(guī)則表達式(Regular Expression,在代碼中常簡寫為RE)。
2為什么使用
用來匹配、替換一類具有相同規(guī)則字符串
3使用規(guī)則
3.1單字符:
3.2數(shù)量修飾:
3.3邊界:
3.4分組:
3.5貪婪模式與非貪婪模式
貪婪模式:.* (匹配>=0次) .+ (匹配>=1次)
非貪婪模式:.*? .+?(加問號就是非貪婪)
3.6 匹配
3.6.1 re.I-忽略大小寫
3.6.2 re.M-匹配多行
3.6.3 re.S-單行匹配
3.7 正則表達式函數(shù)
3.7.1 re.match()
3.7.2 re.search()
3.7.3 re.findall()
3.7.4 re.sub()
4 案例演示(爬取糗事百科圖片)
4.1 爬蟲思路:
① 確定網(wǎng)址
② 確定初始結(jié)束頁
③ 發(fā)送請求獲取內(nèi)容
④ 獲取圖片列表
⑤ 寫入文件并且下載單個圖片
4.2 案例代碼
總結(jié)
以上是生活随笔為你收集整理的正则匹配问号_爬虫之正则表达式的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 1月19日起!英雄联盟全场半价来袭 玩家
- 下一篇: 未备案域名临时跳过备案提示_做好了网页,