汉字编码历史
Qt君最近在處理字符亂碼的問題,順便看了下關(guān)于漢字字符編碼的歷史,總結(jié)分享給大家。
??早期美國計(jì)算機(jī)顯示字符采用數(shù)字映射字母的方式,感覺挺好用,在60年代就做出了ASCII編碼,從0-127共128個(gè)字符(包含不可見字符)。
??眼巴巴地看著美國又是用計(jì)算機(jī)技術(shù)助力登月,又發(fā)展民用科技。于是我們國家在80年代大力發(fā)展計(jì)算機(jī)技術(shù),可是出現(xiàn)的問題是,漢字顯示不了。不行,我們要和世界接軌,于是GB2312編碼橫空出世,囊括了六千多個(gè)常用漢字。
??隨著信息化的發(fā)展,GB2312似乎也不滿足日常使用了,特別是生僻字。由于漢字編碼的限制身份證顯示不了生僻字,需要特殊處理,有的人甚至是改名字。于是在90年代在GB2312的基礎(chǔ)上擴(kuò)展到兩萬多個(gè)漢字的字符編碼GBK。
??不得不說中華文化博大精深,兩萬多個(gè)漢字似乎也是不夠用,繼續(xù)發(fā)展?jié)h字編碼。GB2312編碼進(jìn)化為GB18030編碼,擴(kuò)展到了七萬多文字,還包含了少數(shù)少民族文字。
??歷史的車輪不斷前進(jìn),文化相互融合與碰撞。由于各國都自制字符編碼,沒有統(tǒng)一標(biāo)準(zhǔn),不同的系統(tǒng)中顯示各國文字互相亂碼,你眼看我眼,大家對(duì)著亂碼撓頭。
??不行,我們要統(tǒng)一起來,于是一個(gè)叫ISO的國際標(biāo)準(zhǔn)化組織制定Unicode編碼。隨著Unicode編碼規(guī)范的建立,其實(shí)現(xiàn)方式有UTF-8,UTF-16,UTF-32。由于UTF-8采用變長的編碼方式實(shí)現(xiàn),其節(jié)省空間,兼容ASCII標(biāo)準(zhǔn)的優(yōu)點(diǎn), 在互聯(lián)網(wǎng)上使用最廣的一種Unicode的實(shí)現(xiàn)方式。
總結(jié)
- 上一篇: NPC五电平逆变器。 并网逆变器PQ控制
- 下一篇: 并不想吹牛皮,但!为了把Github博客