日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 综合教程 >内容正文

综合教程

utf-8是什么编码?

發(fā)布時(shí)間:2023/12/15 综合教程 26 生活家
生活随笔 收集整理的這篇文章主要介紹了 utf-8是什么编码? 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

UTF-8(8位元,Universal Character Set/Unicode Transformation Format)是針對(duì)Unicode的一種可變長(zhǎng)度字符編碼。它可以用來(lái)表示Unicode標(biāo)準(zhǔn)中的任何字符,而且其編碼中的第一個(gè)字節(jié)仍與ASCII相容,使得原來(lái)處理ASCII字符的軟件無(wú)須或只進(jìn)行少部份修改后,便可繼續(xù)使用。因此,它逐漸成為電子郵件、網(wǎng)頁(yè)及其他存儲(chǔ)或傳送文字的應(yīng)用中,優(yōu)先采用的編碼。

基本特征

UCS字符U+0000到U+007F(ASCII)被編碼為字節(jié)0×00到0x7F(ASCIⅡ兼容)。這意味著只包含7位ASCIl字符的文件在ASCIⅡ和UTF-8兩種編碼方式下是一樣的。

所有大于0x007F的UCS字符被編碼為一個(gè)有多個(gè)字節(jié)的串,每個(gè)字節(jié)都有標(biāo)記位集。因此,ASCIl字節(jié)(0x00-0x7F)不可能作為任何其他字符的一部分。表示非ASCIl字符的多字節(jié)串的第一個(gè)字節(jié)總是在0xC0到0XFD的范圍里,并指出這個(gè)字符包含多少個(gè)字節(jié)。多字節(jié)串的其余字節(jié)都在0x80到0xBF范圍里。這使得重新同步非常容易,并使編碼無(wú)國(guó)界,且很少受丟失字節(jié)的影響。

UTF-8編碼字符理論上可以最多到6個(gè)字節(jié)長(zhǎng),然而16位BMP字符最多只用到3字節(jié)長(zhǎng),Bigendian UCS-4字節(jié)串的排列順序是預(yù)定的,字節(jié)0xFE和OxFF在UTF-8編碼中從未用到。

編碼字節(jié)數(shù)

UTF-8使用1~4字節(jié)為每個(gè)字符編碼:

·一個(gè)US-ASCIl字符只需1字節(jié)編碼(Unicode范圍由U+0000~U+007F)。

·帶有變音符號(hào)的拉丁文、希臘文、西里爾字母、亞美尼亞語(yǔ)、希伯來(lái)文、阿拉伯文、敘利亞文等字母則需要2字節(jié)編碼(Unicode范圍由U+0080~U+07FF)。

·其他語(yǔ)言的字符(包括中日韓文字、東南亞文字、中東文字等)包含了大部分常用字,使用3字節(jié)編碼。

·其他極少使用的語(yǔ)言字符使用4字節(jié)編碼。

UTF-8編碼規(guī)則:

如果只有一個(gè)字節(jié)則其最高二進(jìn)制位為0;如果是多字節(jié),其第一個(gè)字節(jié)從最高位開(kāi)始,連續(xù)的二進(jìn)制位值為1的個(gè)數(shù)決定了其編碼的字節(jié)數(shù),其余各字節(jié)均以10開(kāi)頭。

以上就是utf-8是什么編碼?的詳細(xì)內(nèi)容,更多請(qǐng)關(guān)注風(fēng)君子博客其它相關(guān)文章!

總結(jié)

以上是生活随笔為你收集整理的utf-8是什么编码?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。