日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

GB2312汉字编码

發布時間:2024/1/1 61 豆豆
生活随笔 收集整理的這篇文章主要介紹了 GB2312汉字编码 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

  近日在學習ICTCLAS中文分詞系統,看到關于詞典組織部分:將詞典    分成6768個大數據快,不是很明白所以查找了《信息交換用漢字編碼字符集》,現將自己看到的結果整理如  下: (1)GB2312 共收錄6763個漢字和非漢字圖形字符682個. (2)采用區位碼進行漢字分類(94區×94位) (3)如何分區: 01-09區為特殊符號。  16-55區為一級漢字,按拼音排序。  56-87區為二級漢字,按部首筆畫排序。  10-15區及88-94區則未有編碼。  (4)字節結構  大家都知道一個漢字有由個字節組成  第一個字節(高位節)是:0xA1-0xF7(把01-87區的區號加上0xA0)第二個字節(低位節):0xA1-0xFE(把01-94加  上 0xA0)  如:啊=0xB0(第一個字節(16+0XA0))0xA1(第二個字節0xA0+1) 參考鏈接:http://zh.wikipedia.org/wiki/GB_2312

 


總結

以上是生活随笔為你收集整理的GB2312汉字编码的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。