GBK编码
2019獨角獸企業重金招聘Python工程師標準>>>
在軟件開發過程中,尤其是涉及到數據庫的項目,通常都會遇到字符編碼的問題。
其中,中文字符集編碼常用的有GB2312和GBK,以及萬國碼UTF8,另外還有GB18030。
ASCII碼每個字符占一個字節;GB2312是GBK的子集,兩個字符集都是每個字符占兩個字節;GB18030是GBK的取代版本,每個字符占一個、兩個或四個字節;UFT8是萬國碼,每個字符占一個、兩個或三個字節。
?
下圖是GBK字符編碼表。
圖是265*256的矩陣,表示兩個字節可以表示的所有字符。水平方向表示高字節,從左至右為0000~FF00;垂直方向表示低字節,從上到下為0000~00FF。
?
左側0區:0000~007F,ASCII碼區。
右下色塊區:8140~FEFE(需剔除a區817F~FE7F),GBK編碼區。
?
GBK編碼分三部分。
一、漢字區
2區:B0A1~F7FE,GBK/2,GB2312漢字區,GB2312漢字6763個。
GB13000.1擴充漢字區
3區:8140~A0FE,GBK/3,GB13000.1中的CJK漢字6080個。
4區:AA40~FEA0,GBK/4,CJK漢字和增補的漢字8160個。
二、圖形符號區
1區:A1A1~A9FE,GBK/1,GB2312非漢字符號區。除GB2312的符號外,還有10個小寫羅馬數字和GB12345增補的符號。計符號717個。
5區:A840~A9A0,GBK/5,GB13000.1擴充非漢字區。包含BIG-5 非漢字符號、結構符和漢字“〇”。計符號166個。
三、用戶自定義區
A區:AAA1~AFFE,碼位564個。
B區:F8A1~FEFE,碼位658個。
C區:A140~A7A0,碼位672個。
轉載于:https://my.oschina.net/u/209067/blog/1581977
總結
- 上一篇: unity基础(1)——unity编辑器
- 下一篇: 为什么程序员发现不了自己的BUG