Python解决爬虫中文返回乱码问题
生活随笔
收集整理的這篇文章主要介紹了
Python解决爬虫中文返回乱码问题
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
ISO-9959-1的問題
?直接上干貨
import re import requestsnew_url = "http://www.anquan.us/static/drops/papers-17213.html" res = requests.get(url=new_url).content.decode('utf-8') print (res)""" if res.encoding == 'ISO-8859-1':encodings = requests.utils.get_encodings_from_content(res.text)if encodings:encoding = encodings[0]else:encoding = res.apparent_encoding else:encoding = res.encoding encode_content = res.content.decode(encoding, 'replace').encode('utf-8', 'replace').decode('utf-8') """ #print(encode_content) #print(res.encoding) #print(res.apparent_encoding) #print(requests.utils.get_encodings_from_content(res.text))?
總結
以上是生活随笔為你收集整理的Python解决爬虫中文返回乱码问题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: twisted系列教程十六–twiste
- 下一篇: Python 配置文件之ConfigPa