ue字符编码_用ultraedit实现编码转换
BOM
這里涉及到一個(gè)BOM(Byte Order Mark)
的概念.簡(jiǎn)單的講,在Unicode標(biāo)準(zhǔn)中,為了標(biāo)示文本文件的編碼類型,可以在文本文件的開始插入幾個(gè)特殊的byte,通過這幾個(gè)特殊的byte,應(yīng)用
程序就可以鑒別文本文件使用的是那種編碼了.那幾個(gè)特殊的byte也被稱之為BOM(參考:http://unicode.org/faq/utf_bom.html ).
對(duì)于Unicode,幾種編碼的BOM如下:
UTF-32, big-endian 文件的前4個(gè)byte是:00 00 FE FF
UTF-32, little-endian文件的前4個(gè)byte是:FF FE 00 00
UTF-16, big-endian文件的前2個(gè)byte是:FE FF
UTF-16, little-endian文件的前2個(gè)byte是:FF FE
UTF-8文件的前3個(gè)byte是:EF BB BF
UTF-7的規(guī)律特殊一點(diǎn),不是前幾個(gè)byte,而是所有的byte轉(zhuǎn)換為十進(jìn)制都小于127.
使用UltraEdit打開一個(gè)文本文件,可以不用關(guān)心其編碼.(Notepad創(chuàng)建的文件的默認(rèn)編碼還是當(dāng)前code page設(shè)定的編碼,在簡(jiǎn)體中文環(huán)境下是 CP936, 即GBK)
設(shè)定UltraEdit當(dāng)前的code page: 選擇 "View -> Set Code Page", 然后選擇你需要的code page. 這樣后面執(zhí)行的編碼轉(zhuǎn)換操作都是根據(jù)這里設(shè)定的code page進(jìn)行的.
選擇 "Edit -> Hex Function -> Hex Edit" 進(jìn)入Hex編輯模式,這樣你可以輸入任意你需要的16進(jìn)制數(shù)字,例如 4E02(Unicode) 或者 8140(GBK) ( "丂" )
轉(zhuǎn)換: 根據(jù)你當(dāng)前的文件的編碼,選擇 "File -> Conversions -> Unicode to
A
總結(jié)
以上是生活随笔為你收集整理的ue字符编码_用ultraedit实现编码转换的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: S-LIME阅读笔记(有实验代码)
- 下一篇: Katana中设置全局变量