日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【转】刨根究底字符编码之十五——UTF-32编码方式

發布時間:2023/12/10 编程问答 44 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【转】刨根究底字符编码之十五——UTF-32编码方式 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1.

UTF-32在UTF目前常用的三種編碼方式(UTF-8、UTF-16、UTF-32)中,是最為簡單的一種編碼方式。UTF-32編碼方式不使用任何編碼算法將Unicode字符碼點值(即編號字符集CCS中的字符編號)轉換為碼元序列,而是將每個Unicode字符碼點值直接表示為一個32位的碼元序列。

因此,目前UTF-32是一種固定寬度(也稱為等寬、等長或定長)碼元序列的Unicode字符編碼方式。

2.

UTF-32中的碼元由32位組成。UTF-32使用的32位碼元足夠大,目前Unicode字符集中所收錄的每個字符的碼點值都可直接映射為單個碼元。

換言之,UTF-32使用一個32位的碼元序列來表示Unicode字符(嚴格地說,是單個32位的碼元,并沒有形成兩個或兩個以上碼元所組成的碼元序列,除非未來Unicode碼點值擴展到64位,這樣才可能出現由兩個32位的碼元所組成的序列)。

因此,即使是ASCII字符,同樣需要占用32位(即四個字節)。這在三大UTF編碼方式中無疑是最為浪費存儲空間的;不過,由于UTF-32是定長編碼(UTF-8和UTF-16都是變長編碼),因此在文本處理速度上又是三大UTF編碼方式中最快的。

(笨笨阿林原創文章,轉載請注明出處)

3.

由于UTF-32直接以四個字節的碼元來表示碼點值,這樣按目前的情況來看,UCS-4或Unicode增補平面SP中的所有碼點值就都可以完全直接表示,而無需像UTF-16那樣使用復雜的代理算法來間接表示。

當然,如前所述,Unicode字符集是一個在不斷增加字符的開放字符集,如果未來Unicode字符集的字符編號(即碼點值)超過了四個字節,則UTF-32可能也需要像UTF-16一樣使用某種特殊編碼算法來間接表示。不過,按目前情況來看,真到了那一天,UTF-32編碼方式可能也已經完全淘汰了。

4.

與UTF-16類似,作為邏輯意義上的UTF-32碼元序列,由于歷史的原因,在映射為物理意義上的字節序列時,也分為UTF-32BE大端序、UTF-32LE小端序兩種編碼模式,因此UTF-32也同樣需要使用BOM。

比如,“ABC”這三個字符的UTF-32碼元序列為:00 00 00 41 00 00 00 42 00 00 00 43;其對應的各種字節序列如下:

每個UTF-32碼元的值與Unicode碼點的值完全相同,但其字節序列因字節序的不同而表現為有相同也有不同。

5.

由于UTF-32在三大UTF編碼方式中,既不是最早推出的編碼方式(最早推出的是UTF-16),也不是最優設計的編碼方式(公認為最優設計的是UTF-8),因此在實踐中使用得最少,目前幾乎已處于淘汰狀態。

(笨笨阿林原創文章,轉載請注明出處)

總結

以上是生活随笔為你收集整理的【转】刨根究底字符编码之十五——UTF-32编码方式的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。