python2中文字符串遍历乱码_完美解决Python2操作中文名文件乱码的问题
Python2默認是不支持中文的,一般我們在程序的開頭加上#-*-coding:utf-8-*-來解決這個問題,但是在我用open()方法打開文件時,中文名字卻顯示成了亂碼。
我先給大家說說Python中的編碼問題,Python中的字符串的大概分為為str和Unicode兩種形式,其中str常用的編碼類型為utf-8,gb2312,gbk等等,Python使用Unicode作為編碼的基礎類型。str記錄的是字節數組,只是某種編碼的存儲格式,終于輸出到文件或是打印出來是什么格式,完全取決于其解碼的編碼將他解碼成什么樣子;Unicode是一種類似于符號集的抽象編碼,它只規定了符號的二進制代碼,卻沒有規定這個二進制代碼該如何存儲,也就是它只是一種內部表示,不能直接保存,所以存儲時需要規定一種存儲形式,比如utf-8等。
Python中有編碼轉換的函數有:
decode(char_set) 實現char_set解碼成Unicodeencode(char_set) 實現Unicode編碼成char_set
查看Python文檔會發現:
open(filename, 'w')這個方法中,filename這個參數必須是Unicode編碼的參數。
我之前加上#-*-coding:utf-8-*-將編碼設置為utf-8,當調用這個方法往里傳參數時,需要將這個變量filename解碼成Unicode。
比如filename='中文.txt',使用open()時,這樣寫open(filename.decode('utf-8'), 'w'),這樣創建的中文文件名就沒有亂碼問題了。
以上就是小編為大家帶來的完美解決Python2操作中文名文件亂碼的問題全部內容了,希望大家多多支持服務器之家~
總結
以上是生活随笔為你收集整理的python2中文字符串遍历乱码_完美解决Python2操作中文名文件乱码的问题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Shiro表结构设计
- 下一篇: 代码整洁之道 python_代码整洁之道