日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

我的第一个爬虫

發布時間:2025/3/15 编程问答 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 我的第一个爬虫 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
#!/usr/bin/env python
# _*_ coding:utf8 _*_
import requests
import re
#設置url地址
url = "https://zhidao.baidu.com/question/1929141799920161187.html"

#用requests.get方法請求數據
response = requests.get(url)
#將頁面的數據制定編碼設置為gbk方式。
response.encoding = 'gbk'
#定義html用作接收response的返回結果(原網頁的html代碼)
html = response.text
#通過正則表達式對網頁的html代碼進行過濾。
a = re.findall(r'引用買大叔的怪年糕的回答:.*?月涌大江流',html,re.S)[0]
#數據清洗 將a中的<br />標簽進行過濾 如果匹配的字符串中有元字符則需要添加\進行轉義例如:() 則需要寫成a.replace('\(\)','')
b = a.replace('<br />','')
#通過正則表達式進行再過濾。 \d表示以數字開頭 該句為以數字開頭以句號結尾
c = re.findall(r'\d.*?。',a)
#循環將其輸出
for i in c:
print(i)


輸出結果:

C:\Users\Administrator\AppData\Local\Programs\Python\Python36\python.exe H:/python/qingqiou.py
1、風蕭蕭兮易水寒,壯士一去兮不復返。
2、一身轉戰三千里,一劍曾擋百萬師。
3、我本楚狂人,鳳歌笑孔丘。
4、醉里挑燈看劍,夢回吹角連營。
5、莫遣只輪回???#xff0c;仍留一箭在天山。
6、君不見,高陽酒徒起草中,長揖山東隆準公。
7、獨倚危樓,不信人間別有愁。
8、寧做真小人,不做偽君子。
9、東風吹醒英雄夢,笑對青山萬重天。
10、馬車幽靈影,瀟灑一郎君。
11、一門七進士,父子三探花。
12、君子死知己,提劍出燕京。

Process finished with exit code 0


?

?









轉載于:https://www.cnblogs.com/shiguangliangchunshanbo/p/9535153.html

總結

以上是生活随笔為你收集整理的我的第一个爬虫的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。