日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python爬取知乎热搜_python爬取知乎

發(fā)布時間:2024/3/13 python 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python爬取知乎热搜_python爬取知乎 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

大小: 1.59M

文件類型: .zip

金幣: 1

下載: 0 次

發(fā)布日期: 2021-01-30

資源簡介

此項目的功能是爬取知乎用戶信息以及人際拓撲關(guān)系,爬蟲框架使用scrapy,數(shù)據(jù)存儲使用mongo,下載這些數(shù)據(jù)感覺也沒什么用,就當為大家學(xué)習(xí)scrapy提供一個例子吧。

## 使用方法

### 本地運行

爬蟲程序依賴mongo和rabbitmq,因此這兩個服務(wù)必須正常運行和配置。為了加快下載效率,圖片下載是異步任務(wù),因此在啟動爬蟲進程執(zhí)行需要啟動異步worker,啟動方式是進入zhihu_spider/zhihu目錄后執(zhí)行下面命令:

資源截圖

代碼片段和文件信息

#?-*-?coding=utf8?-*-

from?scrapy?import?cmdline

cmdline.execute(“scrapy?crawl?zhihu“.split())

屬性????????????大小?????日期????時間???名稱

-----------?---------??----------?-----??----

目錄???????????0??2016-03-20?14:42??zhihu_spider-master\

文件??????????30??2016-03-20?14:42??zhihu_spider-master\.gitignore

文件????????3056??2016-03-20?14:42??zhihu_spider-master\README.md

目錄???????????0??2016-03-20?14:42??zhihu_spider-master\doc\

文件??????753450??2016-03-20?14:42??zhihu_spider-master\doc\image.png

文件??????532877??2016-03-20?14:42??zhihu_spider-master\doc\people.png

文件??????413151??2016-03-20?14:42??zhihu_spider-master\doc\relation.png

文件??????126198??2016-03-20?14:42??zhihu_spider-master\doc\主頁.png

文件??????111628??2016-03-20?14:42??zhihu_spider-master\doc\代碼.png

文件????????3386??2016-03-20?14:42??zhihu_spider-master\doc\流程圖.graffle

文件???????97151??2016-03-20?14:42??zhihu_spider-master\doc\流程圖.png

文件?????????232??2016-03-20?14:42??zhihu_spider-master\docker-compose.yml

文件??????????60??2016-03-20?14:42??zhihu_spider-master\requirements.txt

目錄???????????0??2016-03-20?14:42??zhihu_spider-master\zhihu\

文件??????????96??2016-03-20?14:42??zhihu_spider-master\zhihu\main.py

文件?????????254??2016-03-20?14:42??zhihu_spider-master\zhihu\scrapy.cfg

目錄???????????0??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\

文件???????????0??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\__init__.py

文件?????????686??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\constants.py

文件????????1092??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\items.py

文件????????2536??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\pipelines.py

文件????????3654??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\settings.py

目錄???????????0??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\spiders\

文件?????????161??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\spiders\__init__.py

文件????????7657??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\spiders\profile.py

目錄???????????0??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\tools\

文件??????????44??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\tools\__init__.py

文件?????????696??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\tools\async.py

總結(jié)

以上是生活随笔為你收集整理的python爬取知乎热搜_python爬取知乎的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。