python抓取微信文件_python 如何爬取微信公众号里的图片?
首先,你要知道.read處理出來的是什么東西
我們能讀取服務器響應的內容。再次以 GitHub 時間線為例:
>>> import requests
>>> r = requests.get('https://github.com/timeline.json')
>>> r.text
u'[{"repository":{"open_issues":0,"url":"https://github.com/...
Requests 會自動解碼來自服務器的內容。大多數 unicode 字符集都能被無縫地解碼。
返回的是解碼過的數據,自然不是直接寫入二進制文件中.
常見的方法時:
在罕見的情況下,你可能想獲取來自服務器的原始套接字響應,那么你可以訪問 r.raw。 如果你確實想這么干,那請你確保在初始請求中設置了 stream=True。具體你可以這么做:
>>> r = requests.get('https://github.com/timeline.json', stream=True)
>>> r.raw
>>> r.raw.read(10)
'\x1f\x8b\x08\x00\x00\x00\x00\x00\x00\x03'
但一般情況下,你應該以下面的模式將文本流保存到文件:
with open(filename, 'wb') as fd:
for chunk in r.iter_content(chunk_size=1024):
fd.write(chunk)
使用 Response.iter_content 將會處理大量你直接使用 Response.raw 不得不處理的。 當流下載時,上面是優先推薦的獲取內容方式。
總結
以上是生活随笔為你收集整理的python抓取微信文件_python 如何爬取微信公众号里的图片?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微信群机器人自动管理系统源码
- 下一篇: python爬虫实现爬取网页主页信息(h