python 编码问题
生活随笔
收集整理的這篇文章主要介紹了
python 编码问题
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
為什么80%的碼農都做不了架構師?>>> ??
今天在ubuntu 上用python 采集產品信息,采集了 5個小時,完成了15000條信息的保存(html文件形式),跟著用python 寫腳本導入數據庫,發現打開的html中文亂碼:
python
<!-- lang: python --> #coding=utf-8import osimport MySQLdbpath="./os/"arr=os.listdir(path)html=open(path+arr[0],"r").read()print html發現亂碼 后來
然后用vim的 set fileencodeing查看html的編碼 發現時latin1的編碼格式
嘗試
print html.decode("latin1").encode("utf-8")發現還是亂碼 奇怪了 后來花了幾個小時時間查資料沒結果 后來鬼使神差的用
print html.decode("gb2312").encode("utf-8")發現正常了
后來發現 采集的網站 charset=gb2312"/> 希望對大家有幫助
轉載于:https://my.oschina.net/neo600/blog/88337
總結
以上是生活随笔為你收集整理的python 编码问题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PostgreSQL的 array_to
- 下一篇: python多线程编程: 条件变量同步