文本编码解释
一張圖解釋字符集
舉例說明什么是編碼:
UTF-8編碼
等長編碼對于英文來說浪費空間,所以出現了變長編碼UTF系列,如UTF8,UTF16,UTF32。
UTF8的編碼對象是整個Unicode字符集,所以可以表示所有國家的語言而不會亂碼,所以叫“萬國碼”。所以網絡傳輸文本一般使用UTF-8編碼,如網頁,這樣可以在不同的電腦上看到相同的文本而不亂碼。
GB2312編碼
但是UTF8還是對于英文來說,還是單個字節,但是對于其他語言編碼還是多個字節,占用空間仍然較大。
如果只針對中文進行編碼,被編碼文字只有幾萬字,那么會節省很多空間。常用的簡體中文編碼有GBK/GB2312,GB表示國家標準。雖然節省的存儲空間,但是前提是需要知道文本的語言是什么。所以只在中文環境下使用。
- 完
總結
- 上一篇: 对分查找的最多次数_「剑指offer题解
- 下一篇: 《线性代数的几何意义》笔记(1)