當前位置:
首頁 >
编码表【理解】
發布時間:2024/4/13
68
豆豆
-
什么是字符集
是一個系統支持的所有字符的集合,包括各國家文字、標點符號、圖形符號、數字等
l計算機要準確的存儲和識別各種字符集符號,就需要進行字符編碼,一套字符集必然至少有一套字符編碼。常見字符集有ASCII字符集、GBXXX字符集、Unicode字符集等
-
常見的字符集
-
ASCII字符集:
lASCII:是基于拉丁字母的一套電腦編碼系統,用于顯示現代英語,主要包括控制字符(回車鍵、退格、換行鍵等)和可顯示字符(英文大小寫字符、阿拉伯數字和西文符號)
基本的ASCII字符集,使用7位表示一個字符,共128字符。ASCII的擴展字符集使用8位表示一個字符,共256字符,方便支持歐洲常用字符。是一個系統支持的所有字符的集合,包括各國家文字、標點符號、圖形符號、數字等
-
GBXXX字符集:
GBK:最常用的中文碼表。是在GB2312標準基礎上的擴展規范,使用了雙字節編碼方案,共收錄了21003個漢字,完全兼容GB2312標準,同時支持繁體漢字以及日韓漢字等
-
Unicode字符集:
UTF-8編碼:可以用來表示Unicode標準中任意字符,它是電子郵件、網頁及其他存儲或傳送文字的應用 中,優先采用的編碼。互聯網工程工作小組(IETF)要求所有互聯網協議都必須支持UTF-8編碼。它使用一至四個字節為每個字符編碼
編碼規則:
128個US-ASCII字符,只需一個字節編碼
拉丁文等字符,需要二個字節編碼
大部分常用字(含中文),使用三個字節編碼
其他極少使用的Unicode輔助字符,使用四字節編碼
-
總結
- 上一篇: 为什么会出现字符流
- 下一篇: 字符串中的编码解码问题