當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

ANSI是什么编码？

發(fā)布時(shí)間：2023/12/14 编程问答 37 豆豆

生活随笔收集整理的這篇文章主要介紹了 ANSI是什么编码？小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

用Notepad++創(chuàng)建一個(gè)文本文件text.txt，其默認(rèn)編碼格式為ANSI（乍看之下，還以為是ASCII呢），輸入漢字居然不是亂碼：

保存為test.txt，發(fā)送給你美國(guó)的同事Bob。他也用Notepad++，不幸的是，卻發(fā)現(xiàn)你的文件內(nèi)容是這樣的：

也許你會(huì)認(rèn)為：你用的是中文系統(tǒng)，能正常顯示中文；他用的是英文系統(tǒng)，不能顯示中文！

這么想，好像很有道理呢！

但是再細(xì)想一下：一個(gè)系統(tǒng)顯示亂碼，說(shuō)明它不支持這種編碼格式（或者解碼方式不對(duì)）。難道英文系統(tǒng)不支持ANSI？難道ANSI是一種中文編碼？

如果你身邊有一個(gè)韓文系統(tǒng)，也裝一個(gè)Notepad++，默認(rèn)還是ANSI編碼，你可以輸入“???”，發(fā)現(xiàn)也能正常顯示：

但是你要輸入“漢字”可能就會(huì)發(fā)現(xiàn)是亂碼了...

通過(guò)這個(gè)反例，就可以說(shuō)明ANSI不是一種中文編碼。那么，ANSI到底是什么編碼？

用十六進(jìn)制編輯器打開內(nèi)容為“漢字”的test.txt文件：

你會(huì)發(fā)現(xiàn)：其中baba和d7d6正好是“漢”和“字”兩個(gè)字的GBK編碼值。

同樣，用十六進(jìn)制編輯器打開內(nèi)容為“???”的test.txt文件：

你會(huì)發(fā)現(xiàn)：其中c7d1、b1b9和beee正好是“?”、“?”和“?”三個(gè)字符的EUC-KR編碼值。

由此可以看出：其實(shí)ANSI并不是某一種特定的字符編碼，而是在不同的系統(tǒng)中，ANSI表示不同的編碼。你的美國(guó)同事Bob的系統(tǒng)中ANSI編碼其實(shí)是ASCII編碼（ASCII編碼不能表示漢字，所以漢字為亂碼），而你的系統(tǒng)中（“漢字”正常顯示）ANSI編碼其實(shí)是GBK編碼，而韓文系統(tǒng)中（“???”正常顯示）ANSI編碼其實(shí)是EUC-KR編碼。

話說(shuō)計(jì)算機(jī)是由美國(guó)佬搞出來(lái)的嘛，他們覺(jué)得一個(gè)字節(jié)（可以表示256個(gè)編碼）表示英語(yǔ)世界里所有的字母、數(shù)字和常用特殊符號(hào)已經(jīng)綽綽有余了（其實(shí)ASCII只用了前127個(gè)編碼）。后來(lái)歐洲人不干了，法國(guó)人說(shuō)：我需要在小寫字母加上變音符號(hào)（如：é），德國(guó)人說(shuō)：我也要加幾個(gè)字母（? ?、? ?、ü ü、?）。于是，歐洲人就將ASCII 沒(méi)用完的編碼（128-255）為自己特有的符號(hào)編碼（后來(lái)稱之為“擴(kuò)展字符集”）。等到我們中國(guó)人開始使用計(jì)算機(jī) 的時(shí)候，尼瑪，256個(gè)編碼哪夠？我泱泱大中華，漢字起碼也得N多萬(wàn)吧，就連小學(xué)生都得要求掌握兩三千字。國(guó)標(biāo) 局最后拍板：一個(gè)字節(jié)不夠，那我們就用多個(gè)字節(jié)來(lái)為漢字編碼吧，但是，國(guó)情那么窮，字節(jié)那么貴，三個(gè)字節(jié)傷不起，那就用倆字節(jié)吧，先給常用的幾千漢字編個(gè)碼，等以后國(guó)家強(qiáng)盛了人民富裕了，咱再擴(kuò)展唄---于是GB2312 就產(chǎn)生了。臺(tái)灣同胞一看，尼瑪，全是簡(jiǎn)體字，還讓不讓我們寫繁體字的活了，于是臺(tái)灣同胞也自己弄了個(gè)繁體字編碼---大五碼（Big-5）。同時(shí)，其它國(guó)家也在為自己的文字編碼。最后，微軟苦逼了：顧客就是上帝啊，你們的編碼我都得滿足啊，這樣吧，賣給美國(guó)國(guó)內(nèi)的系統(tǒng)默認(rèn)就用ASCII編碼吧，賣給中國(guó)人的系統(tǒng)默認(rèn)就用GBK編碼吧，賣給韓國(guó)人的系統(tǒng)默認(rèn)就用EUC-KR編碼，...但是為了避免你們誤會(huì)我賣給你們的系統(tǒng)功能有差異，我就統(tǒng)一把你們的默認(rèn)編碼都顯示成ANSI吧。---本故事純屬虛構(gòu)，但“ANSI編碼”確實(shí)只存在于Windows系統(tǒng)。

那么Windows系統(tǒng)是如何區(qū)分ANSI背后的真實(shí)編碼的呢？

微軟用一個(gè)叫“Windows code pages”（在命令行下執(zhí)行chcp命令可以查看當(dāng)前code page的值）的值來(lái)判斷系統(tǒng)默認(rèn)編碼，比如：簡(jiǎn)體中文的code page值為936（它表示GBK編碼，win95之前表示GB2312，詳見(jiàn)：Microsoft Windows' Code Page 936），繁體中文的code page值為950（表示Big-5編碼）。

我們能否通過(guò)修改Windows code pages的值來(lái)改變“ANSI編碼”呢？

命令提示符下，我們可以通過(guò)chcp命令來(lái)修改當(dāng)前終端的active code page，例如：
(1) 執(zhí)行：chcp 437，code page改為437，當(dāng)前終端的默認(rèn)編碼就為ASCII編碼了（漢字就成亂碼了）；
(2) 執(zhí)行：chcp 936，code page改為936，當(dāng)前終端的默認(rèn)編碼就為GBK編碼了（漢字又能正常顯示了）。
上面的操作只在當(dāng)前終端起作用，并不會(huì)影響系統(tǒng)默認(rèn)的“ANSI編碼”。（更改命令行默認(rèn)codepage參看：設(shè)置cmd的codepage的方法）。

Windows下code page是根據(jù)當(dāng)前系統(tǒng)區(qū)域（locale）來(lái)設(shè)置的，要想修改系統(tǒng)默認(rèn)的“ANSI編碼”，我們可以通過(guò)修改系統(tǒng)區(qū)域來(lái)實(shí)現(xiàn)（“控制面板” =>“時(shí)鐘、語(yǔ)言和區(qū)域”=>“區(qū)域和語(yǔ)言”=>“管理”=>“更改系統(tǒng)區(qū)域設(shè)置...”）：

圖中的系統(tǒng)locale為簡(jiǎn)體中文，意味著當(dāng)前“ANSI編碼”實(shí)際是GBK編碼。當(dāng)你把它改成Korean(Korea)時(shí)，“ANSI編碼”實(shí)際是EUC-KR編碼，“???”就能正常顯示了；當(dāng)你把它改成English(US)時(shí)，“ANSI編碼”實(shí)際是ASCII編碼，“漢字”和“???”都成亂碼了。（改了之后需要重啟系統(tǒng)的。。。）

說(shuō)明：locale是國(guó)際化與本地化中重要的概念，本文不深入講解該內(nèi)容。

你上面說(shuō)的都是windows的情形吧，Linux呢？

將前述內(nèi)容為“漢字”的文件test.txt拷貝至Linux下，用Emacs打開：

也是亂碼！原因也是locale的問(wèn)題：

更改locale后再打開：

總結(jié)

以上是生活随笔為你收集整理的ANSI是什么编码？的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

ANSI

上一篇： Quartus II 13.0 最全的安
下一篇：自动阅读脚本

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

ANSI是什么编码？

總結(jié)