當前位置:
首頁 >
GB2312汉字编码
發布時間:2024/1/1
61
豆豆
生活随笔
收集整理的這篇文章主要介紹了
GB2312汉字编码
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
近日在學習ICTCLAS中文分詞系統,看到關于詞典組織部分:將詞典 分成6768個大數據快,不是很明白所以查找了《信息交換用漢字編碼字符集》,現將自己看到的結果整理如 下: (1)GB2312 共收錄6763個漢字和非漢字圖形字符682個. (2)采用區位碼進行漢字分類(94區×94位) (3)如何分區: 01-09區為特殊符號。 16-55區為一級漢字,按拼音排序。 56-87區為二級漢字,按部首/筆畫排序。 10-15區及88-94區則未有編碼。 (4)字節結構 大家都知道一個漢字有由個字節組成 第一個字節(高位節)是:0xA1-0xF7(把01-87區的區號加上0xA0)第二個字節(低位節):0xA1-0xFE(把01-94加 上 0xA0) 如:啊=0xB0(第一個字節(16+0XA0))0xA1(第二個字節0xA0+1) 參考鏈接:http://zh.wikipedia.org/wiki/GB_2312
總結
以上是生活随笔為你收集整理的GB2312汉字编码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 并网逆变器PQ控制。 逆变器采用两电平逆
- 下一篇: 什么是U盘量产工具?