當(dāng)前位置:
首頁 >
python 编码问题
發(fā)布時間:2025/5/22
62
豆豆
生活随笔
收集整理的這篇文章主要介紹了
python 编码问题
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
為什么80%的碼農(nóng)都做不了架構(gòu)師?>>> ??
今天在ubuntu 上用python 采集產(chǎn)品信息,采集了 5個小時,完成了15000條信息的保存(html文件形式),跟著用python 寫腳本導(dǎo)入數(shù)據(jù)庫,發(fā)現(xiàn)打開的html中文亂碼:
python
<!-- lang: python --> #coding=utf-8import osimport MySQLdbpath="./os/"arr=os.listdir(path)html=open(path+arr[0],"r").read()print html發(fā)現(xiàn)亂碼 后來
然后用vim的 set fileencodeing查看html的編碼 發(fā)現(xiàn)時latin1的編碼格式
嘗試
print html.decode("latin1").encode("utf-8")發(fā)現(xiàn)還是亂碼 奇怪了 后來花了幾個小時時間查資料沒結(jié)果 后來鬼使神差的用
print html.decode("gb2312").encode("utf-8")發(fā)現(xiàn)正常了
后來發(fā)現(xiàn) 采集的網(wǎng)站 charset=gb2312"/> 希望對大家有幫助
轉(zhuǎn)載于:https://my.oschina.net/neo600/blog/88337
總結(jié)
以上是生活随笔為你收集整理的python 编码问题的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PostgreSQL的 array_to
- 下一篇: python多线程编程: 条件变量同步