python随机生成中文字符串_利用python3随机生成中文字符的实现方法
前言
運行環境在Python3.6下,Python2的解決方案網上有很多.,想學習python2實現的朋友們可以參考這篇文章://www.jb51.net/article/34884.htm,下面來一起看看詳細的介紹吧。
第一種方法:Unicode碼
在unicode碼中,漢字的范圍是(0x4E00, 9FBF)
import random
def Unicode():
val = random.randint(0x4e00, 0x9fbf)
return chr(val)
這個方法比較簡單,但是有個小問題,unicode碼中收錄了2萬多個漢字,包含很多生僻的繁體字.
第二種方法:GBK2312
gbk2312對字符的編碼采用兩個字節相組合,第一個字節的范圍是0xB0-0xF7, 第二個字節的范圍是0xA1-0xFE.
對GBK2312編碼方式詳細的解釋請參看GBK2312編碼
import random
def GBK2312():
head = random.randint(0xb0, 0xf7)
body = random.randint(0xa1, 0xfe)
val = f'{head:x}{body:x}'
str = bytes.fromhex(val).decode('gb2312')
return str
GBK2312收錄了6千多常用漢字.兩種方法的取舍就看需求了.
下面來給大家詳細介紹下關于Python基礎知識之encode和decode函數的相關內容,通過下面的簡單介紹,對大家理解上面的實現方法具有一定的參考價值,下面來一起看看吧。
ptyhon encode和decode函數
Python2.x中默認的編碼的基礎類型是unicode編碼的類型,在Python3.x才轉化為基于unicode的字符串。
那么我們在Python2.x的學習中就會遇到各種各樣的編碼問題,encode和decode函數就是很好的幫我們解決這樣問題的工具。
下面的程序中有詳細的介紹和例子!~
在Python2.x中:
u = u'中文' #顯示指定unicode類型對象u
str = u.encode('gb2312') #以gb2312編碼對unicode對像進行編碼
str1 = u.encode('gbk') #以gbk編碼對unicode對像進行編碼
str2 = u.encode('utf-8') #以utf-8編碼對unicode對像進行編碼
u1 = str.decode('gb2312')#以gb2312編碼對字符串str進行解碼,以獲取unicode
u2 = str.decode('utf-8')#如果以utf-8的編碼對str進行解碼得到的結果,將無法還原原來的unicode類型
在Python3.x中:
u = '中文' #指定字符串類型對象u
str = u.encode('gb2312') #以gb2312編碼對u進行編碼,獲得bytes類型對象str
u1 = str.decode('gb2312')#以gb2312編碼對字符串str進行解碼,獲得字符串類型對象u1
u2 = str.decode('utf-8')#如果以utf-8的編碼對str進行解碼得到的結果,將無法還原原來的字符串內容
但是我們在讀取、寫入文件的時候就要注意以文件的格式來判斷用什么方式來操作了,txt文件默認都是utf-8當然你也可以自己設定編碼格式。
我們在對txt文件進行操作時,最好都將編碼格式轉化為utf-8來方便操作吧!~
總結
以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。
總結
以上是生活随笔為你收集整理的python随机生成中文字符串_利用python3随机生成中文字符的实现方法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 个人博客系统的设计与实现_一个 Go 开
- 下一篇: python 第一行输入n表示一天中有多