當前位置：首頁 >

三、入门爬虫，爬取豆瓣电影

發布時間：2024/10/8 52 豆豆

生活随笔收集整理的這篇文章主要介紹了三、入门爬虫，爬取豆瓣电影小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

上次爬取了百度圖片，是分析解決ajax的json的響應的，對于一些網站的常見的翻頁，是這次主要內容。

明確目標

爬取的是豆瓣電影，并保存到csv格式中

爬取豆瓣是非常的簡單，因為沒有任何反爬的機制

爬取的url ：https://movie.douban.com/explore

分析網站

和上次一樣的套路

爬取全代碼

# -*- coding：utf-8 -*- # time ：2019/4/8 13:00 # author: 毛利import requests import json headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36" }# utf-8 我們需要另一種編碼 utf-8-sig 選擇這個編碼 utf-8-sig def douban_spider(tag,nums,sort):

總結

以上是生活随笔為你收集整理的三、入门爬虫，爬取豆瓣电影的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：一、NLTK工具包使用
下一篇：三十六、Scrapy 中的复写默认管道和

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

三、入门爬虫，爬取豆瓣电影

明確目標

分析網站

總結