日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > c/c++ >内容正文

c/c++

vc驿站视频教程笔记2 ansi 和 unicode

發布時間:2024/3/7 c/c++ 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 vc驿站视频教程笔记2 ansi 和 unicode 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

---------------------------------------------------------------------------
VC 驛站
WwW.CcTry.CoM
多抽出一分鐘時間來學習,讓你的生命更加精彩!
C、C++、VC++ 各種學習資源,免費教程,期待您的加入!
動畫教程只是起到技術交流的作用,請大家不用利用此方法做非法用途.
由此動畫造成的任何后果和動畫作者及本站無關.
----------------------------------------------------------------------------------------
大家好,我是Syc
今天給大家做的教程是:
vc++基礎班[2]---Ansi與Unicode
----------------------------------------------------------------------------------------
①、Ansi與Unicode簡要說明及各自的優缺點:
他們是兩種字符的編碼格式,Ansi=窄字節,Unicode=寬字節,Ansi用char格式表示一個字符,占用一個字節的存儲空間,最多表示255個字符,
表示英文還可以,但對于中文、日文、韓文等語言來說就不夠用了,所以如果你的程序是Ansi編碼的話,
那么你寫的中文語言的程序拿到日文、韓文等系統上面就會出現亂碼。所以有了Unicode,用二個字節去表示一個字符,格式是 unsigned short,被定義成 wchar_t 格式
這樣就可以表示世界上絕大多數的語言了!但有利就有弊,缺點呢?就是空間占用翻倍了,網絡傳輸的數據量也增大了……

◆ vc++ 6.0 默認為Ansi編碼,vs2005、vs2008、vs2010 等默認都是Unicode編碼,當然可以進行工程的設置從而進行編碼的轉換,見演示!

◆ 就我個人觀點:還是建議大家使用Unicode寬字節的編碼格式,具體見下面:

◆ 系統提供了兩種類型的 API 函數,見:user32.dll 中的 MessageBox 函數,其實 MessageBox 他只是一個宏,他對應的兩個版本的函數分別為:MessageBoxA 和 MessageBoxW,你在使用的時候系統會根據是否定義了_UNICODE 宏來進行判斷該使用哪個版本的函數!如果你的工程沒有定義_UNICODE 宏,那么就使用窄字節的 MessageBoxA,如果定義了,那么就使用寬字節的 MessageBoxW,具體在vs2008中,右鍵找定義,見演示!

◆ 網摘:Windows 2000 及其以后的 Xp、2003、Vista、Win7 等系統都是使用Unicode從頭進行開發的,如果調用任何一個Windows API 函數并給它傳遞一個 ANSI 字符串,那么系統首先要將字符串轉換成Unicode,然后將Unicode字符串傳遞給操作系統。如果希望函數返回ANSI字符串,系統就會先將Unicode字符串轉換成ANSI字符串,然后將結果返回給你的應用程序。進行這些字符串的轉換需要占用系統的時間和內存。通過從頭開始用Unicode來開發應用程序,就能夠使你的應用程序更加高效的運行!

==================================================================

②、不同編碼格式下的字符串處理及相互轉化:

◆ 大家在編程時經常遇到的數據類型:
● Ansi:
char、char * 、const char *
CHAR、(PCHAR、PSTR、LPSTR)、LPCSTR

● Unicode:
wchar_t、wchar_t * 、const wchar_t *
WCHAR、(PWCHAR、PWSTR、LPWSTR)、LPCWSTR

● T 通用類型:
TCHAR、(TCHAR * 、PTCHAR、PTSTR、LPTSTR)、LPCTSTR

以上,其中:P代表指針的意思,STR代表字符串的意思,L是長指針的意思,在WIN32平臺下可以忽略,C代表const常量的意思,W代表wide寬字節的意思,T大家可以理解為通用類型的意思,
就是可以根據工程中是否定義_UNICODE 宏,分別定義成不同的類型,比如:TCHAR 類型,如果工程中定義了_UNICODE 宏,那么他最終被定義成 wchar_t 類型,
如果工程中沒有定義_UNICODE 宏,那么 TCHAR 被最終定義成 char 類型。

〓※※※〓 其方便性就是修改了工程的編碼格式之后不用修改代碼,所以還是建議大家在編寫程序的時候使用通用類型!

@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@

◆ 字符串類型的對象的定義:
● Ansi:char *pAnsiStr = "hello";
● Unicode:wchar_t *pUnicodeStr = L"hello";
● 通用類型:TCHAR *pTStr = _T("hello"); 或者 TCHAR *pTStr = _TEXT("hello");
● 動態申請內存:TCHAR *pszBuf = new TCHAR[100];

其中,_TEXT 和 _T 是一樣的,定義如下:
#define _T(x) __T(x)
#define _TEXT(x) __T(x)

來看看 __T 的最終定義:
#ifdef _UNICODE
#define __T(x) L##x
#else
#define __T(x) x
#endif

其中,##為連接起來的意思。

@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@

◆ 常用的字符串處理函數,具體信息見MSDN:
字符串長度:
● Ansi:strlen(char *str);
● Unicode:wcslen(wchar_t *str);
● 通用函數:_tcslen(TCHAR *str);

● Ansi:int atoi(const char *str);
● Unicode:int _wtoi(const wchar_t *str);
● 通用函數:_tstoi(const TCHAR *str);

字符串拷貝:
● Ansi:strcpy(char *strDestination, const char *strSource);
● Unicode:wcscpy(wchar_t *strDestination, const wchar_t *strSource);
● 通用函數:_tcscpy(TCHAR *strDestination, const TCHAR *strSource);

以上函數不安全,在vs2003等以上版本的編譯器中會有warnning警告提示,以下為安全函數(vc++6.0不支持):
● Ansi:strcpy_s(char *strDestination, size_t numberOfElements, const char *strSource);
● Unicode:wcscpy_s(wchar_t *strDestination, size_t numberOfElements, const wchar_t *strSource);
● 通用函數:_tcscpy_s(TCHAR *strDestination, size_t numberOfElements, const TCHAR *strSource);

numberOfElements
Size of the destination string buffer. 目的緩沖區的大小,以字節為單位,不是字符!

size_t unsigned integer,在MSDN中的解釋:Result of sizeof operator,也就是說 size_t 是 unsigned integer 即無符號整數。那為什么會有size_t這個類型呢?
因為不同平臺的操作系統(32/64)中 int/long 等類型所占的字節并不一樣,而 size_t 在不同的平臺下有不同的定義。有點類似于TCHAR類型:
#ifndef _SIZE_T_DEFINED
#ifdef _WIN64
typedef unsigned __int64 size_t; //8個字節,64位
#else
typedef _W64 unsigned int size_t; //4個字節,32位
#endif
#define _SIZE_T_DEFINED
#endif

@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@

◆ Ansi 與 Unicode 字符串類型的互相轉換:
上面給大家介紹的都是窄字節就是窄字節,寬字節就是寬字節,那么下面就給大家介紹下他們兩個之間的轉換。
在程序中還是不建議大家來回來去的進行字符串編碼之間的轉換,要么就都使用Ansi,要么就都使用Unicode,
但是往往有些函數只提供了窄字節版本(比如:GetProcAddress)或者只提供寬字節版本(比如:CommandLineToArgvW),
這個時候就要進行字符串編碼格式的轉換了。

但是,不是所有的都需要轉換,有一些是不需要轉換的,比如 socket 中的 send 或者 recv 函數!

● 轉換用到的最根本的 API 函數:
WideCharToMultiByte 實現寬字節轉換到窄字節
MultiByteToWideChar 實現窄字節轉換到寬字節

WideCharToMultiByte 的代碼頁用來標記與新轉換的字符串相關的代碼頁;
MultiByteToWideChar 的代碼頁用來標記與一個多字節字符串相關的代碼頁,

[1]、常用的代碼頁有 CP_ACP 和 CP_UTF8 兩個:
使用 CP_ACP 代碼頁就實現了 ANSI 與 Unicode 之間的轉換;--- 我們所用的!
使用 CP_UTF8 代碼頁就實現了 UTF-8 與 Unicode 之間的轉換。

[2]、dwFlags 參數允許我們進行額外的控制,但是,一般情況下都不使用這個標志,直接傳遞 0 就行了。

[3]、lpDefaultChar和pfUsedDefaultChar:只有當WideCharToMultiByte函數遇到一個寬字節字符,而該字符在uCodePage參數標識的代碼頁中并沒有它的表示法時,WideCharToMultiByte函數才使用這兩個參數。如果寬字節字符不能被轉換,該函數便使用lpDefaultChar參數指向的字符。如果該參數是NULL(這是大多數情況下的參數值),那么該函數使用系統的默認字符。該默認字符通常是個問號。這對于文件名來說是危險的,因為問號是個通配符。pfUsedDefaultChar參數指向一個布爾變量,如果Unicode字符串中至少有一個字符不能轉換成等價多字節字符,那么函數就將該變量置為TRUE。如果所有字符均被成功地轉換,那么該函數就將該變量置為FALSE。當函數返回以便檢查寬字節字符串是否被成功地轉換后,可以測試該變量。

● 兩個轉換函數的使用:
● A2W、W2A、T2A、T2W 宏的使用:


③、CString常用操作講解

------------------------------------- End -------------------------------------------

轉載于:https://www.cnblogs.com/linksgo2011/p/3321195.html

總結

以上是生活随笔為你收集整理的vc驿站视频教程笔记2 ansi 和 unicode的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。