gvim同时处理中日韩文
From: http://xbeta.info/gvim-unicode.htm
一、兩項(xiàng)要點(diǎn)
gvim處理多國(guó)文字(unicode)有兩項(xiàng)要點(diǎn):一是編碼環(huán)境:set enc=utf-8;二是正確的字體,比如要正確顯示韓文可選擇GulimChe、DotumChe字體。
上圖中9-12行字符未能正常顯示(同樣的字體,notepad可以正確顯示更多)。對(duì)應(yīng)的設(shè)定為:
set lm=none
set enc=utf-8
let $LANG=’en’
set ambiwidth=double
set guifont=DotumChe:h12:cANSI
二、備注
0.
多數(shù)情況下,我用gvim處理中文,因此,默認(rèn)enc是prc而非utf-8。臨時(shí)有需要往往改enc,相對(duì)不太關(guān)注fenc。[參見(jiàn)]
1.測(cè)試文本
日語(yǔ)(にほんご、にっぽんご)朝鮮語(yǔ)(???)或稱韓國(guó)語(yǔ)(???)
代碼 字符標(biāo)準(zhǔn)名稱 顯示
A 大寫(xiě)拉丁字母”A” A
? 小寫(xiě)拉丁字母”Sharp S” ?
t 小寫(xiě)拉丁字母”Thorn” t
Δ 大寫(xiě)希臘字母”Delta” Δ
Й 大寫(xiě)斯拉夫字母”Short I” Й
? 希伯來(lái)字母”Qof” ?
? 阿拉伯字母 “Meem” ?
? 泰文數(shù)字 7 ?
? 埃塞俄比亞音節(jié)文字”Qha” ?
あ 日語(yǔ)平假名 “A” あ
ア 日語(yǔ)片假名 “A” ア
葉 簡(jiǎn)體漢字 “葉” 葉
葉 正體漢字 “葉” 葉
? 韓國(guó)音節(jié)文字 “Yeob” ?
2.
中文簡(jiǎn)體Win XP下,不設(shè)定encoding時(shí),相當(dāng)于cp936: simplified Chinese (Windows only),支持別名prc, chinese。也就是說(shuō),中文簡(jiǎn)體Win XP下,不設(shè)定enc與
se enc=prc
se enc=cp936
se enc=chinese
是等同的。
3.
此環(huán)境下,保存txt相當(dāng)于notepad.exe的ansi。
4.
enc=prc下,處理unicode字符能力當(dāng)然比較弱:默認(rèn)開(kāi)一個(gè)新文件復(fù)制韓文過(guò)來(lái),它根本不認(rèn)識(shí);打開(kāi)一個(gè)utf-8編碼多語(yǔ)言的文件,也可能轉(zhuǎn)換出錯(cuò)。
5.
所以,處理unicode字符時(shí),一定要(臨時(shí))設(shè)為enc=utf-8
6.
直接切換到enc=utf-8,GVIM界面會(huì)顯示亂碼,韓文仍無(wú)法顯示。前者是GVIM調(diào)用資源的問(wèn)題,后者是當(dāng)前字體不支持韓文(多數(shù)中文字體都支持日文)。
這時(shí),雖顯示異常,但不影響實(shí)際使用。比如,你仍可以復(fù)制/粘貼。
7.
如果看起來(lái)不舒服,則可以更改顯示字體為韓文(代價(jià)是中文丑陋)。
se guifont=* 選擇 GulimChe或DotumChe,字符集選韓文(不選似乎也可以)。
8.
曾有一段時(shí)間,我傾向于選擇utf-8,讓它成為gvim的enc、文本文件的保存格式、html的編碼格式。
但這種“高”標(biāo)準(zhǔn)化對(duì)其他程序并不友好。比如:TC中ctrl+q或F3顯示txt文件,進(jìn)行文件內(nèi)容比較。另外,對(duì)中文而言u(píng)tf-8編碼體積是原默認(rèn)編碼的1.5倍,如果是一篇長(zhǎng)網(wǎng)頁(yè),差異還是難以忽視的。
因此,后來(lái)我又改回了ansi/gb-2312,除非遇到問(wèn)題,才選擇utf-8。
9.
對(duì)開(kāi)發(fā)者或應(yīng)用而言,應(yīng)支持高標(biāo)準(zhǔn);對(duì)用戶或數(shù)據(jù)而言,采用低標(biāo)準(zhǔn)更為有利。此合于老子“知其雄,守其雌”之道。(完)
總結(jié)
以上是生活随笔為你收集整理的gvim同时处理中日韩文的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: fgetcsv()函数
- 下一篇: TCP文件传输