日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python之简单爬虫(爬取豆瓣出版社)

發布時間:2024/1/23 python 58 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python之简单爬虫(爬取豆瓣出版社) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

環境準備:
1.python 3.0+
2.豆瓣出版社網址 https://read.douban.com/provider/all

ok,開始我們的實驗
1.打開瀏覽器,輸入網址,右擊網頁,查看網頁源碼,這里我用的是谷歌瀏覽器

2.看上圖我們發現許多出版社名稱,接下來我們查找一個出版社名稱,例如重慶大學
觀察下圖我們發現它們都在一個div標簽內,且class=”name” ,所以,我們開始編寫代碼

3.代碼

import urllib.request import re import os url = "https://read.douban.com/provider/all" #獲取url pat = '<div class="name">(.*?)</div>' #匹配規則 data = urllib.request.urlopen(url).read().decode("utf-8") #讀取網頁的內容并解碼 relut = re.compile(pat).findall(data) #會返回一個列表 file = open(r"C:\Users\123\豆瓣出版社.txt", "w", encoding="utf-8") #這里我定義了一個自己的存儲路徑,大家可以根據自己的路徑修改 for i in relut:file.write(i) #將出版社名稱寫入文件file.write("\n") #表示換行

4.最后在你的存儲目錄下打開文件就可以查看內容了!

超強干貨來襲 云風專訪:近40年碼齡,通宵達旦的技術人生

總結

以上是生活随笔為你收集整理的python之简单爬虫(爬取豆瓣出版社)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。