當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

宽字节

發布時間：2025/3/21 编程问答 17 豆豆

生活随笔收集整理的這篇文章主要介紹了宽字节小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

轉載請注明出處：http://blog.csdn.net/qq_26093511/article/category/6752927

例子：
?wchar_t *chinese_str = L"韋gif";
? unsigned int *p = (wchar_t *)chinese_str;
? int i;

? printf("Uniocde: \n");
? printf("韋gif :共 %d 個寬字節wchar_t\n",wcslen(chinese_str));
? for (i = 0; i < wcslen(chinese_str); i++)
? {
? printf("0x%x ", p[i]);
? }
? printf("\n");

輸出：
Uniocde:?
韋gif:共 4 個寬字節wchar_t
0x97e6 0x67 0x69 0x66?

由上面測試代碼可知，wchar_t是一個可以表示字符集中的任意一個字符的足夠寬的變量類型，即一個寬字符可以表示一個中文，也可以表示一個英文。
chinese_str[0] 是“韋”，
chinese_str[1] 是“g”，
chinese_str[2] 是“i”,
chinese_str[3] 是“f”。
具體使用可參考：
http://blog.csdn.net/qq_26093511/article/details/59126467

http://blog.csdn.net/qq_26093511/article/details/60332795

下面的測試代碼可以區分寬字符Unicode與GBK的中英文區別
#include <stdio.h>
#include <string.h>
#include <math.h>
#include <wchar.h>
void main()
{

?wchar_t *chinese_str = L"韋gif";
?unsigned int *p = (wchar_t *)chinese_str;
?int i;

?printf("Uniocde: \n");
?printf("韋gif :共 %d 個寬字節wchar_t\n",wcslen(chinese_str));
?for (i = 0; i < wcslen(chinese_str); i++)
?{
? printf("0x%04x ", p[i]);
?}
?printf("\n");
?
?
?
?unsigned char *chinese_utf_8 = "韋gif";
?unsigned char *p2 = chinese_utf_8;

?printf("GBK: \n");
?printf("韋gif :共 %d 個字節\n",strlen(chinese_utf_8));
?for (i = 0; i < strlen(chinese_utf_8); i++)
?{
? printf("0x%x ", p2[i]);
?}
?printf("\n");
}

注意：在linux下，創建的文本代碼，默認是UTF-8格式的！本文的代碼是在linux下創建。

下面是編譯及運行結果：
gcc -o test test.c -finput-charset=UTF-8 -fexec-charset=GBK

?./test?
Uniocde:?
Τgif :�� 4 ��?�wchar_t
0x97e6 0x0067 0x0069 0x0066?
GBK:?
Τgif :�� 5 ��?�
0xce 0xa4 0x67 0x69 0x66?

由運行代碼知，GBK是兩個字節來表示一個漢字，一個字節來表示英文。
而寬字符則是兩個字節來表示任意一個字符！

我們可以使用寬字節來描述中英文，這樣的話就省去了判斷中英字符的操作。

若有描述錯誤，請指出，謝謝！

轉載于:https://www.cnblogs.com/alan666/p/8311968.html

總結

以上是生活随笔為你收集整理的宽字节的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

字节

上一篇：在Javascript中声明时用var
下一篇：技术的演进