GB2312汉字编码
生活随笔
收集整理的這篇文章主要介紹了
GB2312汉字编码
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
近日在學(xué)習(xí)ICTCLAS中文分詞系統(tǒng),看到關(guān)于詞典組織部分:將詞典 分成6768個(gè)大數(shù)據(jù)快,不是很明白所以查找了《信息交換用漢字編碼字符集》,現(xiàn)將自己看到的結(jié)果整理如 下: (1)GB2312 共收錄6763個(gè)漢字和非漢字圖形字符682個(gè). (2)采用區(qū)位碼進(jìn)行漢字分類(lèi)(94區(qū)×94位) (3)如何分區(qū): 01-09區(qū)為特殊符號(hào)。 16-55區(qū)為一級(jí)漢字,按拼音排序。 56-87區(qū)為二級(jí)漢字,按部首/筆畫(huà)排序。 10-15區(qū)及88-94區(qū)則未有編碼。 (4)字節(jié)結(jié)構(gòu) 大家都知道一個(gè)漢字有由個(gè)字節(jié)組成 第一個(gè)字節(jié)(高位節(jié))是:0xA1-0xF7(把01-87區(qū)的區(qū)號(hào)加上0xA0)第二個(gè)字節(jié)(低位節(jié)):0xA1-0xFE(把01-94加 上 0xA0) 如:啊=0xB0(第一個(gè)字節(jié)(16+0XA0))0xA1(第二個(gè)字節(jié)0xA0+1) 參考鏈接:http://zh.wikipedia.org/wiki/GB_2312
總結(jié)
以上是生活随笔為你收集整理的GB2312汉字编码的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 并网逆变器PQ控制。 逆变器采用两电平逆
- 下一篇: CAJViewer 8.1 Window