Python爬去知乎上问题下所有图片
生活随笔
收集整理的這篇文章主要介紹了
Python爬去知乎上问题下所有图片
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
from zhihu_oauth import ZhihuClient
from zhihu_oauth.exception import NeedCaptchaExceptionclient = ZhihuClient()try:client.login('email_or_phone', 'password')print(u"登陸成功!")
except NeedCaptchaException:# 保存驗證碼并提示輸入,重新登錄with open('a.gif', 'wb') as f:f.write(client.get_captcha())captcha = input('please input captcha:')client.login('+8613872273541', 'z289784552', captcha)print(u"登陸成功!")
client.save_token('token.pkl') 獲取Token from __future__ import print_function # 使用python3的print方法
from zhihu_oauth import ZhihuClient
import re
import os
import urllib.requestclient = ZhihuClient()
# 登錄
client.load_token('token.pkl') # 加載token文件
id = 46508954 # https://www.zhihu.com/question/24400664(長得好看是一種怎么樣的體驗)
question = client.question(id)
print(u"問題:",question.title)
print(u"回答數量:",question.answer_count)
os.mkdir(question.title + u"(圖片)")
path = question.title + u"(圖片)"
index = 1 # 圖片序號
for answer in question.answers:content = answer.content # 回答內容re_compile = re.compile(r'<img src="(https://pic\d\.zhimg\.com/.*?\.(jpg|png))".*?>')img_lists = re.findall(re_compile, content)if (img_lists):for img in img_lists:img_url = img[0] # 圖片urlurllib.request.urlretrieve(img_url, path + u"/%d.jpg" % index)print(u"成功保存第%d張圖片" % index)index += 1 加載Token并讀取數據
?
轉載于:https://www.cnblogs.com/wuyujie/p/9441927.html
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的Python爬去知乎上问题下所有图片的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python实现自动化打印
- 下一篇: 大幅面多相机高精度定位及测量解决方案