python

python3.x+requests 爬取网站遇到中文乱码的解决方案

發(fā)布時間：2025/3/15 python 41 豆豆

生活随笔收集整理的這篇文章主要介紹了 python3.x+requests 爬取网站遇到中文乱码的解决方案小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

正常情況下，遇見問題上google找答案能甩百度100條街，但是這個問題是個例外······人家老外就沒有亂碼的問題。言歸正傳，首先建議大家看一下python3.x+requests 爬取網(wǎng)站遇到中文亂碼的解決方案。里面詳細介紹。如果懶得看，看一下我的精簡版也是可以的。

“Requests會自動解碼來自服務器的內(nèi)容。Requests遵循RFC標準，編碼使用ISO-8859-1 ?！?/strong>

這下就明白了吧，utf-8的網(wǎng)站，你用ISO-8859-1楞解，不亂碼才怪。

解決：先參看上文鏈接，無效在繼續(xù)看本文。

我是試了一下連接中方法不好用才出此下策（瞎搗鼓的）。
import requests
url = 'https://www.admin5.com/article/20130130/486822.shtml' req = requests.get(url)print(req.encoding)
可以看到req的編碼的確是ISO-8859-1。因此想到了一個簡單粗暴的辦法（管你什么編碼，只要不是utf8，統(tǒng)統(tǒng)改過來）：
req.encoding='utf-8'
然后再print，結(jié)果就變成了utf-8了。腰不酸了，腿不疼了，中文也不亂嗎了。

因為我沒有系統(tǒng)的學過，只是臨時要用，所以都是野套路，路過的行家里手莫笑話，有什么正統(tǒng)套路歡迎指教。

轉(zhuǎn)載于:https://www.cnblogs.com/jiangnanyanyuchen/p/9389481.html

總結(jié)

以上是生活随笔為你收集整理的python3.x+requests 爬取网站遇到中文乱码的解决方案的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

网站

解决方案

中文

乱码

歡迎分享！

轉(zhuǎn)載請說明來源于"生活随笔"，并保留原作者的名字。

本文地址：python3.x+requests 爬取网站遇到中文乱码的

上一篇：【游记】CCHO TY国初划水记

下一篇： Python基础：函数的介绍及应用

最新發(fā)布

python编码规范腾讯_Python PEP8 编码规范中文版

c语言 python rsa库_Python遇到性能瓶颈怎么办？

python中map函数运行原理_Python中map函数的解释和可视化

python读取网站_科学网—python 获取网址 - 林清莹的博文

gitpythonapi_GitPython 使用基础

熱門推薦

干货来袭！3天0基础Python实战项目快速学会人工智能必学数学基础全套（含源码）（第3天）概率分析篇：条件概率、全概率与贝叶斯公式

Python ISBN号概述，校验位计算，10位-13位转换，验证，连字符，及常用库isbnid,isbnlib,isbntools的使用

问卷星自动填写python selenium脚本（2021vim版，亲测有效，看这一篇就够了）

python写闲鱼脚本_自动化篇 - 躺着收钱！闲鱼自动发货机器人来啦~

Python中安装moveit_commander,顺带解决rospy模块未安装问题

標簽云

连接数据库

程序语言

单元格

微信游戏

蓝牙耳机

软件安装

双系统

游戏开发者

设计理念

计算机资源

区钟落潭

抄表系统

补订

fpmmm

卐卍

会亏光吗

反壟斷枷鎖

urlopen

被人称为

AMI

ImagesSprite

fpmmm_zabbix

联发是

无线通讯

rudiment

域名申请

没关好

十赌九输

企業面臨新

热锅凉油

沪股通一

有锂矿吗

这一节

xrkmonitor

有锁已

朱宏

MAXIMO

安卓跨

搞懂云

misia

买股多

这个话题