C++的中英文字符串表示(string,wstring),使用wcout.imbue(std::locale("chs"));本地化解析编码
在C++中字符串類的string的模板原型是basic_string
template<class_Elem,classtraits=char_traits<_Elem>,class_Ax=allocator<_Elem>>
classbasic_string{};
第一個參數_Elem表示類型。第二個參數traits的缺省值使用char_traits類型,定義了類型和字符操作的函數,如比較、等價、分配等。第三個參數_Ax的默認值是allocator類,表示了內存模式,不同的內存結構將操作指針的不同行為,例如棧、堆或段內存模式等。
在C++標準里定義了兩個字符串string和wstring
typedefbasic_string<char>string;
typedefbasic_string<wchar_t>wstring;
前者string是常用類型,可以看作char[],其實這正是與string定義中的_Elem=char相一致。而wstring,使用的是wchar_t類型,這是寬字符,用于滿足非ASCII字符的要求,例如Unicode編碼,中文,日文,韓文什么的。對于wchar_t類型,實際上C++中都用與char函數相對應的wchar_t的函數,因為他們都是從同一個模板類似于上面的方式定義的。因此也有wcout, wcin, werr等函數。
實際上string也可以使用中文,但是它將一個漢字寫在2個char中。而如果將一個漢字看作一個單位wchar_t的話,那么在wstring中就只占用一個單元,其它的非英文文字和編碼也是如此。這樣才真正的滿足字符串操作的要求,尤其是國際化等工作。
看一下下面的程序,就會理解兩者的差別。
#include<iostream>
#include<string>
usingnamespacestd;
#definetab" "
intmain()
{
localedef;
cout<<def.name()<<endl;
localecurrent=cout.getloc();
cout<<current.name()<<endl;
floatval=1234.56;
cout<<val<<endl;
//chagetofrench/france
cout.imbue(locale("chs"));
current=cout.getloc();
cout<<current.name()<<endl;
cout<<val<<endl;
//上面是說明locale的用法,下面才是本例的內容,因為其中用到了imbue函數
cout<<"*********************************"<<endl;
//為了保證本地化輸出(文字/時間/貨幣等),chs表示中國,wcout必須使用本地化解析編碼
wcout.imbue(std::locale("chs"));
//string英文,正確顛倒位置,顯示第二個字符正確
stringstr1("ABCabc");
stringstr11(str1.rbegin(),str1.rend());
cout<<"UK s1 :"<<str1<<tab<<str1[1]<<tab<<str11<<endl;
//wstring英文,正確顛倒位置,顯示第二個字符正確
wstringstr2=L"ABCabc";
wstringstr22(str2.rbegin(),str2.rend());
wcout<<"UK ws4 :"<<str2<<tab<<str2[1]<<tab<<str22<<endl;
//string中文,顛倒后,變成亂碼,第二個字符讀取也錯誤
stringstr3("你好么?");
stringstr33(str3.rbegin(),str3.rend());
cout<<"CHN s3 :"<<str3<<tab<<str3[1]<<tab<<str33<<endl;
//正確的打印第二個字符的方法
cout<<"CHN s3 :RIGHT "<<str3[2]<<str3[3]<<endl;
//中文,正確顛倒位置,顯示第二個字符正確
wstringstr4=L"你好么?";
wstringstr44(str4.rbegin(),str4.rend());
wcout<<"CHN ws4 :"<<str4<<tab<<str4[1]<<tab<<str44<<endl;
wstringstr5(str1.begin(),str1.end());//只有char類型的string時才可以如此構造
wstringstr55(str5.rbegin(),str5.rend());
wcout<<"CHN ws5 :"<<str5<<tab<<str5[1]<<tab<<str55<<endl;
wstringstr6(str3.begin(),str3.end());//如此構造將失敗!!!!
wstringstr66(str6.rbegin(),str6.rend());
wcout<<"CHN ws6 :"<<str6<<tab<<str6[1]<<tab<<str66<<endl;
return0;
}
結果如下:
上面顯示了本地化的作用,是在數字中每三位加一個逗號,其實對時間/文字等都是用影響的。
下面的輸出說明了,如何正確使用string和wstring的方法。第三個因為使用string來表示漢字,出現了一些錯誤。最后一行也是錯誤,導致了輸出也受到了影響,沒有空格與回車。(最后兩個就不要管中英文了,僅僅說明一下中文構造方法是錯誤的)
《掌握標準C++類》在第十二章《語言支持》中專門講C++的國際化和本地化問題,C++提供了I18N的標準處理,軟件開發者可以參考。
C++標準庫還是非常博大精深的,功能比較齊全的。繼續學習。
http://www.cnblogs.com/xiaoyz/archive/2008/10/11/1308860.html
總結
以上是生活随笔為你收集整理的C++的中英文字符串表示(string,wstring),使用wcout.imbue(std::locale("chs"));本地化解析编码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: RMB符号的几种显示方式。
- 下一篇: mongo服务启动异常:exiting