struc,union,class的内存对齐方式
首先思考一個(gè)問(wèn)題:int,short,char的struct,這幾個(gè)數(shù)應(yīng)該怎么放,內(nèi)存最小
strct ts
{
?int a;
?short b;
?char c;
};
這樣放最小,為8,這樣放置,只會(huì)在內(nèi)存中的最后浪費(fèi)一個(gè)字節(jié)
short ,int ,char 這樣順序也是為8
轉(zhuǎn)自:http://blog.21ic.com/user1/6199/archives/2009/65542.html
1、 sizeof應(yīng)用在結(jié)構(gòu)上的情況
請(qǐng)看下面的結(jié)構(gòu):
struct MyStruct
{
double dda1;
char dda;
int type
};
對(duì)結(jié)構(gòu)MyStruct采用sizeof會(huì)出現(xiàn)什么結(jié)果呢?sizeof(MyStruct)為多少呢?也許你會(huì)這樣求:
sizeof(MyStruct)=sizeof(double) sizeof(char) sizeof(int)=13
但是當(dāng)在VC中測(cè)試上面結(jié)構(gòu)的大小時(shí),你會(huì)發(fā)現(xiàn)sizeof(MyStruct)為16。你知道為什么在VC中會(huì)得出這樣一個(gè)結(jié)果嗎?
其 實(shí),這是VC對(duì)變量存儲(chǔ)的一個(gè)特殊處理。為了提高CPU的存儲(chǔ)速度,VC對(duì)一些變量的起始地址做了”對(duì)齊”處理。在默認(rèn)情況下,VC規(guī)定各成員變量存放的 起始地址相對(duì)于結(jié)構(gòu)的起始地址的偏移量必須為該變量的類型所占用的字節(jié)數(shù)的倍數(shù)。然后,總長(zhǎng)度必須是成員類型中的最大長(zhǎng)度的倍數(shù).下面列出常用類型的對(duì)齊方式(vc6.0,32位系統(tǒng))。
上面闡述的不嚴(yán)密,每個(gè)特定平臺(tái)的編譯器都有一個(gè)默認(rèn)的對(duì)齊系數(shù),gcc中是4,VC中是8,
#pragma pack(n)來(lái)設(shè)定變量以n字節(jié)對(duì)齊方式。n字節(jié)對(duì)齊就是說(shuō)變量存放的起始地址的偏移量有兩種情況:第一、如果n大于等于該變量所占用的字節(jié)數(shù),那么偏 移量必須滿足是該變量的整數(shù)倍的對(duì)齊方式,第二、如果n小于該變量的類型所占用的字節(jié)數(shù),那么偏移量為n的倍數(shù),不用滿足默認(rèn)的對(duì)齊方式。結(jié)構(gòu)的總大小也有個(gè)約束條 件,分下面兩種情況:如果n大于所有成員變量類型所占用的字節(jié)數(shù),那么結(jié)構(gòu)的總大小必須為占用空間最大的變量占用的空間數(shù)的倍數(shù);否則必須為n的倍數(shù)。
在gcc中(不過(guò),還得看環(huán)境,我用的是64位的linux,結(jié)果也是24)
struct siz {
char v1;//長(zhǎng)度1<4,按1對(duì)齊,0%1=0,起始相對(duì)位置=0;存放區(qū)間[0]
long long v2;//長(zhǎng)度8>4,按4對(duì)齊,4%4=0,起始相對(duì)位置=4;存放區(qū)間[4,11]
short v3;//長(zhǎng)度2<4,按2對(duì)齊,12%2=0,起始相對(duì)位置=12;存放區(qū)間[12,13]
int v4;//長(zhǎng)度4=4,按4對(duì)齊,16%4=0,起始相對(duì)位置=16;存放區(qū)間[16,19]
};
整個(gè)結(jié)構(gòu)體成員對(duì)齊后所占的區(qū)間為[0,19],占20個(gè)字節(jié),接著結(jié)構(gòu)體本身對(duì)齊,成員中最長(zhǎng)的是8,n等于4,所以結(jié)構(gòu)體本身按4對(duì)齊(即對(duì)齊系數(shù))。20%4=0,所以占20個(gè)字節(jié)
在vc中,占24字節(jié)
類型
對(duì)齊方式(變量存放的起始地址相對(duì)于結(jié)構(gòu)的起始地址的偏移量)
Char
偏移量必須為sizeof(char)即1的倍數(shù)
int
偏移量必須為sizeof(int)即4的倍數(shù)
float
偏移量必須為sizeof(float)即4的倍數(shù)
double
偏移量必須為sizeof(double)即8的倍數(shù)
Short
偏移量必須為sizeof(short)即2的倍數(shù)
各 成員變量在存放的時(shí)候根據(jù)在結(jié)構(gòu)中出現(xiàn)的順序依次申請(qǐng)空間,同時(shí)按照上面的對(duì)齊方式調(diào)整位置,空缺的字節(jié)VC會(huì)自動(dòng)填充。同時(shí)VC為了確保結(jié)構(gòu)的大小為結(jié) 構(gòu)的字節(jié)邊界數(shù)(即該結(jié)構(gòu)中占用最大空間的類型所占用的字節(jié)數(shù))的倍數(shù),所以在為最后一個(gè)成員變量申請(qǐng)空間后,還會(huì)根據(jù)需要自動(dòng)填充空缺的字節(jié)。
下面用前面的例子來(lái)說(shuō)明VC到底怎么樣來(lái)存放結(jié)構(gòu)的。
struct MyStruct
{
double dda1;
char dda;
int type
};
為 上面的結(jié)構(gòu)分配空間的時(shí)候,VC根據(jù)成員變量出現(xiàn)的順序和對(duì)齊方式,先為第一個(gè)成員dda1分配空間,其起始地址跟結(jié)構(gòu)的起始地址相同(剛好偏移量0剛好 為sizeof(double)的倍數(shù)),該成員變量占用sizeof(double)=8個(gè)字節(jié);接下來(lái)為第二個(gè)成員dda分配空間,這時(shí)下一個(gè)可以分 配的地址對(duì)于結(jié)構(gòu)的起始地址的偏移量為8,是sizeof(char)的倍數(shù),所以把dda存放在偏移量為8的地方滿足對(duì)齊方式,該成員變量占用 sizeof(char)=1個(gè)字節(jié);接下來(lái)為第三個(gè)成員type分配空間,這時(shí)下一個(gè)可以分配的地址對(duì)于結(jié)構(gòu)的起始地址的偏移量為9,不是sizeof (int)=4的倍數(shù),為了滿足對(duì)齊方式對(duì)偏移量的約束問(wèn)題,VC自動(dòng)填充3個(gè)字節(jié)(這三個(gè)字節(jié)沒(méi)有放什么東西),這時(shí)下一個(gè)可以分配的地址對(duì)于結(jié)構(gòu)的起 始地址的偏移量為12,剛好是sizeof(int)=4的倍數(shù),所以把type存放在偏移量為12的地方,該成員變量占用sizeof(int)=4個(gè) 字節(jié);這時(shí)整個(gè)結(jié)構(gòu)的成員變量已經(jīng)都分配了空間,總的占用的空間大小為:8 1 3 4=16,剛好為結(jié)構(gòu)的字節(jié)邊界數(shù)(即結(jié)構(gòu)中占用最大空間的類型所占用的字節(jié)數(shù)sizeof(double)=8)的倍數(shù),所以沒(méi)有空缺的字節(jié)需要填充。 所以整個(gè)結(jié)構(gòu)的大小為:sizeof(MyStruct)=8 1 3 4=16,其中有3個(gè)字節(jié)是VC自動(dòng)填充的,沒(méi)有放任何有意義的東西。
字串3
下面再舉個(gè)例子,交換一下上面的MyStruct的成員變量的位置,使它變成下面的情況:
struct MyStruct
{
char dda;
double dda1;
int type
};
這個(gè)結(jié)構(gòu)占用的空間為多大呢?在VC6.0環(huán)境下,可以得到sizeof(MyStruc)為24。結(jié)合上面提到的分配空間的一些原則,分析下VC怎么樣為上面的結(jié)構(gòu)分配空間的。(簡(jiǎn)單說(shuō)明)
struct MyStruct
{
char dda;//偏移量為0,滿足對(duì)齊方式,dda占用1個(gè)字節(jié);
double dda1;//下一個(gè)可用的地址的偏移量為1,不是sizeof(double)=8
//的倍數(shù),需要補(bǔ)足7個(gè)字節(jié)才能使偏移量變?yōu)?(滿足對(duì)齊
//方式),因此VC自動(dòng)填充7個(gè)字節(jié),dda1存放在偏移量為8
//的地址上,它占用8個(gè)字節(jié)。
int type;//下一個(gè)可用的地址的偏移量為16,是sizeof(int)=4的倍
//數(shù),滿足int的對(duì)齊方式,所以不需要VC自動(dòng)填充,type存
//放在偏移量為16的地址上,它占用4個(gè)字節(jié)。
};//所有成員變量都分配了空間,空間總的大小為1 7 8 4=20,不是結(jié)構(gòu)
//的節(jié)邊界數(shù)(即結(jié)構(gòu)中占用最大空間的類型所占用的字節(jié)數(shù)sizeof 字串2
//(double)=8)的倍數(shù),所以需要填充4個(gè)字節(jié),以滿足結(jié)構(gòu)的大小為
//sizeof(double)=8的倍數(shù)。
所以該結(jié)構(gòu)總的大小為:sizeof(MyStruc)為1 7 8 4 4=24。其中總的有7 4=11個(gè)字節(jié)是VC自動(dòng)填充的,沒(méi)有放任何有意義的東西。
VC對(duì)結(jié)構(gòu)的存儲(chǔ)的特殊處理確實(shí)提高CPU存儲(chǔ)變量的速度,但是有時(shí)候也帶來(lái)了一些麻煩,我們也屏蔽掉變量默認(rèn)的對(duì)齊方式,自己可以設(shè)定變量的對(duì)齊方式。
VC 中提供了#pragma pack(n)來(lái)設(shè)定變量以n字節(jié)對(duì)齊方式。n字節(jié)對(duì)齊就是說(shuō)變量存放的起始地址的偏移量有兩種情況:第一、如果n大于等于該變量所占用的字節(jié)數(shù),那么偏 移量必須滿足默認(rèn)的對(duì)齊方式,第二、如果n小于該變量的類型所占用的字節(jié)數(shù),那么偏移量為n的倍數(shù),不用滿足默認(rèn)的對(duì)齊方式。結(jié)構(gòu)的總大小也有個(gè)約束條 件,分下面兩種情況:如果n大于所有成員變量類型所占用的字節(jié)數(shù),那么結(jié)構(gòu)的總大小必須為占用空間最大的變量占用的空間數(shù)的倍數(shù);
否則必須為n的倍數(shù)。下面舉例說(shuō)明其用法。
#pragma pack(push) //保存對(duì)齊狀態(tài)
#pragma pack(4)//設(shè)定為4字節(jié)對(duì)齊
struct test
{
char m1;
double m4;
字串3
int m3;
};
#pragma pack(pop)//恢復(fù)對(duì)齊狀態(tài)
以 上結(jié)構(gòu)的大小為16,下面分析其存儲(chǔ)情況,首先為m1分配空間,其偏移量為0,滿足我們自己設(shè)定的對(duì)齊方式(4字節(jié)對(duì)齊),m1占用1個(gè)字節(jié)。接著開(kāi)始為 m4分配空間,這時(shí)其偏移量為1,需要補(bǔ)足3個(gè)字節(jié),這樣使偏移量滿足為n=4的倍數(shù)(因?yàn)閟izeof(double)大于n),m4占用8個(gè)字節(jié)。接 著為m3分配空間,這時(shí)其偏移量為12,滿足為4的倍數(shù),m3占用4個(gè)字節(jié)。這時(shí)已經(jīng)為所有成員變量分配了空間,共分配了16個(gè)字節(jié),滿足為n的倍數(shù)。如 果把上面的#pragma pack(4)改為#pragma pack(16),那么我們可以得到結(jié)構(gòu)的大小為24。
——————————————————————————————————————————————
缺省的對(duì)齊方式。
在結(jié)構(gòu)中,編譯器為結(jié)構(gòu)的每個(gè)成員按其自然對(duì)界(alignment)條件分配空間;各個(gè)成員按照它們被聲明的順序在內(nèi)存中順序存儲(chǔ),第一個(gè)成員的地址和整個(gè)結(jié)構(gòu)的地址相同。在缺省情況下,C編譯器為每一個(gè)變量或是數(shù)據(jù)單元按其自然對(duì)界條件分配空間。
例如,下面的結(jié)構(gòu)各成員空間分配情況。
struct test {
char x1;
short x2;
float x3;
char x4;
};
結(jié)構(gòu)的第一個(gè)成員x1,其偏移地址為0,占據(jù)了第1個(gè)字節(jié)。第二個(gè)成員x2為short類型,其起始地址必須2字節(jié)對(duì)界,因此,編譯器在x2和x1之間填充了一個(gè)空字節(jié)。結(jié)構(gòu)的第三個(gè)成員x3和第四個(gè)成員x4恰好落在其自然對(duì)界地址上,在它們前面不需要額外的填充字節(jié)。在test結(jié)構(gòu)中,成員x3要求4字節(jié)對(duì)界,是該結(jié)構(gòu)所有成員中要求的最大對(duì)界單元,因而test結(jié)構(gòu)的自然對(duì)界條件為4字節(jié),編譯器在成員x4后面填充了3個(gè)空字節(jié)。整個(gè)結(jié)構(gòu)所占據(jù)空間為12字節(jié)。
字節(jié)對(duì)齊的細(xì)節(jié)和編譯器實(shí)現(xiàn)相關(guān),但一般而言,滿足三個(gè)準(zhǔn)則:
1) 結(jié)構(gòu)體變量的首地址能夠被其最寬基本類型成員的大小所整除;
2) 結(jié)構(gòu)體每個(gè)成員相對(duì)于結(jié)構(gòu)體首地址的偏移量(offset)都是成員大小的整數(shù)倍,如有需要編譯器會(huì)在成員之間加上填充字節(jié)(internal adding);
3) 結(jié)構(gòu)體的總大小為結(jié)構(gòu)體最寬基本類型成員大小的整數(shù)倍,如有需要編譯器會(huì)在最末一個(gè)成員之后加上填充字節(jié)(trailing padding)。
注意的是:
基本類型是指前面提到的像char、short、int、float、double這樣的內(nèi)置數(shù)據(jù)類型,這里所說(shuō)的”數(shù)據(jù)寬度”就是指其sizeof的大小。由于結(jié)構(gòu)體的成員可以是復(fù)合類型,比如另外一個(gè)結(jié)構(gòu)體,所以在尋找最寬基本類型成員時(shí),應(yīng)當(dāng)包括復(fù)合類型成員的子成員,而不是把復(fù)合成員看成是一個(gè)整體。但在確定復(fù)合類型成員的偏移位置時(shí)則是將復(fù)合類型作為整體看待。
更改C編譯器的缺省分配策略
一般地,可以通過(guò)下面的方法改變?nèi)笔〉膶?duì)界條件:
? 使用偽指令#pragma pack ([n])
#pragma pack ([n])偽指令允許你選擇編譯器為數(shù)據(jù)分配空間所采取的對(duì)界策略。
例如,在使用了#pragma pack (1)偽指令后,test結(jié)構(gòu)各成員的空間分配情況就是按照一個(gè)字節(jié)對(duì)齊了,格式如下:
#pragma pack(push) //保存對(duì)齊狀態(tài)
#pragma pack(1)
//定義你的結(jié)構(gòu)
//…………
#pragma pack(pop)
class的方法與struct一樣
但是還有更復(fù)雜的情況:http://hi.baidu.com/phps/blog/item/f03eb93ee12f49fa838b1365.html
當(dāng)在C中定義了一個(gè)結(jié)構(gòu)類型時(shí),它的大小是否等于各字段(field)大小之和?編譯器將如何在內(nèi)存中放置這些字段?ANSI?C對(duì)結(jié)構(gòu)體的內(nèi)存布局有什么要求?而我們的程序又能否依賴這種布局?這些問(wèn)題或許對(duì)不少朋友來(lái)說(shuō)還有點(diǎn)模糊,那么本文就試著探究它們背后的秘密。
????首先,至少有一點(diǎn)可以肯定,那就是ANSI?C保證結(jié)構(gòu)體中各字段在內(nèi)存中出現(xiàn)的位置是隨它們的聲明順序依次遞增的,并且第一個(gè)字段的首地址等于整個(gè)結(jié)構(gòu)體實(shí)例的首地址。比如有這樣一個(gè)結(jié)構(gòu)體:
??
??struct?vector{int?x,y,z;}?s;
??int?*p,*q,*r;
??struct?vector?*ps;
??
??p?=?&s.x;
??q?=?&s.y;
??r?=?&s.z;
??ps?=?&s;
??assert(p?<?q);
??assert(p?<?r);
??assert(q?<?r);
??assert((int*)ps?==?p);
??//?上述斷言一定不會(huì)失敗
????這時(shí),有朋友可能會(huì)問(wèn):"標(biāo)準(zhǔn)是否規(guī)定相鄰字段在內(nèi)存中也相鄰?"。?唔,對(duì)不起,ANSI?C沒(méi)有做出保證,你的程序在任何時(shí)候都不應(yīng)該依賴這個(gè)假設(shè)。那這是否意味著我們永遠(yuǎn)無(wú)法勾勒出一幅更清晰更精確的結(jié)構(gòu)體內(nèi)存布局圖?哦,當(dāng)然不是。不過(guò)先讓我們從這個(gè)問(wèn)題中暫時(shí)抽身,關(guān)注一下另一個(gè)重要問(wèn)題————內(nèi)存對(duì)齊。
????許多實(shí)際的計(jì)算機(jī)系統(tǒng)對(duì)基本類型數(shù)據(jù)在內(nèi)存中存放的位置有限制,它們會(huì)要求這些數(shù)據(jù)的首地址的值是某個(gè)數(shù)k(通常它為4或8)的倍數(shù),這就是所謂的內(nèi)存對(duì)齊,而這個(gè)k則被稱為該數(shù)據(jù)類型的對(duì)齊模數(shù)(alignment?modulus)。當(dāng)一種類型S的對(duì)齊模數(shù)與另一種類型T的對(duì)齊模數(shù)的比值是大于1的整數(shù),我們就稱類型S的對(duì)齊要求比T強(qiáng)(嚴(yán)格),而稱T比S弱(寬松)。這種強(qiáng)制的要求一來(lái)簡(jiǎn)化了處理器與內(nèi)存之間傳輸系統(tǒng)的設(shè)計(jì),二來(lái)可以提升讀取數(shù)據(jù)的速度。比如這么一種處理器,它每次讀寫(xiě)內(nèi)存的時(shí)候都從某個(gè)8倍數(shù)的地址開(kāi)始,一次讀出或?qū)懭?個(gè)字節(jié)的數(shù)據(jù),假如軟件能保證double類型的數(shù)據(jù)都從8倍數(shù)地址開(kāi)始,那么讀或?qū)懸粋€(gè)double類型數(shù)據(jù)就只需要一次內(nèi)存操作。否則,我們就可能需要兩次內(nèi)存操作才能完成這個(gè)動(dòng)作,因?yàn)閿?shù)據(jù)或許恰好橫跨在兩個(gè)符合對(duì)齊要求的8字節(jié)內(nèi)存塊上。某些處理器在數(shù)據(jù)不滿足對(duì)齊要求的情況下可能會(huì)出錯(cuò),但是Intel的IA32架構(gòu)的處理器則不管數(shù)據(jù)是否對(duì)齊都能正確工作。不過(guò)Intel奉勸大家,如果想提升性能,那么所有的程序數(shù)據(jù)都應(yīng)該盡可能地對(duì)齊。Win32平臺(tái)下的微軟C編譯器(cl.exe?for?80x86)在默認(rèn)情況下采用如下的對(duì)齊規(guī)則:?任何基本數(shù)據(jù)類型T的對(duì)齊模數(shù)就是T的大小,即sizeof(T)。比如對(duì)于double類型(8字節(jié)),就要求該類型數(shù)據(jù)的地址總是8的倍數(shù),而char類型數(shù)據(jù)(1字節(jié))則可以從任何一個(gè)地址開(kāi)始。Linux下的GCC奉行的是另外一套規(guī)則(在資料中查得,并未驗(yàn)證,如錯(cuò)誤請(qǐng)指正):任何2字節(jié)大小(包括單字節(jié)嗎?)的數(shù)據(jù)類型(比如short)的對(duì)齊模數(shù)是2,而其它所有超過(guò)2字節(jié)的數(shù)據(jù)類型(比如long,double)都以4為對(duì)齊模數(shù)。
????現(xiàn)在回到我們關(guān)心的struct上來(lái)。ANSI?C規(guī)定一種結(jié)構(gòu)類型的大小是它所有字段的大小以及字段之間或字段尾部的填充區(qū)大小之和。嗯?填充區(qū)?對(duì),這就是為了使結(jié)構(gòu)體字段滿足內(nèi)存對(duì)齊要求而額外分配給結(jié)構(gòu)體的空間。那么結(jié)構(gòu)體本身有什么對(duì)齊要求嗎?有的,ANSI?C標(biāo)準(zhǔn)規(guī)定結(jié)構(gòu)體類型的對(duì)齊要求不能比它所有字段中要求最嚴(yán)格的那個(gè)寬松,可以更嚴(yán)格(但此非強(qiáng)制要求,VC7.1就僅僅是讓它們一樣嚴(yán)格)。我們來(lái)看一個(gè)例子(以下所有試驗(yàn)的環(huán)境是Intel?Celeron?2.4G?+?WIN2000?PRO?+?vc7.1,內(nèi)存對(duì)齊編譯選項(xiàng)是"默認(rèn)",即不指定/Zp與/pack選項(xiàng)):
??typedef?struct?ms1
??{
?????char?a;
?????int?b;
??}?MS1;
????假設(shè)MS1按如下方式內(nèi)存布局(本文所有示意圖中的內(nèi)存地址從左至右遞增):
???????_____________________________
???????|???????|???????????????????|
???????|???a???|????????b??????????|
???????|???????|???????????????????|
???????+---------------------------+
?Bytes:????1?????????????4
????因?yàn)镸S1中有最強(qiáng)對(duì)齊要求的是b字段(int),所以根據(jù)編譯器的對(duì)齊規(guī)則以及ANSI?C標(biāo)準(zhǔn),MS1對(duì)象的首地址一定是4(int類型的對(duì)齊模數(shù))的倍數(shù)。那么上述內(nèi)存布局中的b字段能滿足int類型的對(duì)齊要求嗎?嗯,當(dāng)然不能。如果你是編譯器,你會(huì)如何巧妙安排來(lái)滿足CPU的癖好呢?呵呵,經(jīng)過(guò)1毫秒的艱苦思考,你一定得出了如下的方案:
???????_______________________________________
???????|???????|\\\\\\\\\\\|?????????????????|
???????|???a???|\\padding\\|???????b?????????|
???????|???????|\\\\\\\\\\\|?????????????????|
???????+-------------------------------------+
?Bytes:????1?????????3?????????????4
????這個(gè)方案在a與b之間多分配了3個(gè)填充(padding)字節(jié),這樣當(dāng)整個(gè)struct對(duì)象首地址滿足4字節(jié)的對(duì)齊要求時(shí),b字段也一定能滿足int型的4字節(jié)對(duì)齊規(guī)定。那么sizeof(MS1)顯然就應(yīng)該是8,而b字段相對(duì)于結(jié)構(gòu)體首地址的偏移就是4。非常好理解,對(duì)嗎?現(xiàn)在我們把MS1中的字段交換一下順序:
??typedef?struct?ms2
??{
?????int?a;
?????char?b;
??}?MS2;
????或許你認(rèn)為MS2比MS1的情況要簡(jiǎn)單,它的布局應(yīng)該就是
???????_______________________
???????|?????????????|???????|
???????|?????a???????|???b???|
???????|?????????????|???????|
???????+---------------------+
?Bytes:??????4???????????1?
????因?yàn)镸S2對(duì)象同樣要滿足4字節(jié)對(duì)齊規(guī)定,而此時(shí)a的地址與結(jié)構(gòu)體的首地址相等,所以它一定也是4字節(jié)對(duì)齊。嗯,分析得有道理,可是卻不全面。讓我們來(lái)考慮一下定義一個(gè)MS2類型的數(shù)組會(huì)出現(xiàn)什么問(wèn)題。C標(biāo)準(zhǔn)保證,任何類型(包括自定義結(jié)構(gòu)類型)的數(shù)組所占空間的大小一定等于一個(gè)單獨(dú)的該類型數(shù)據(jù)的大小乘以數(shù)組元素的個(gè)數(shù)。換句話說(shuō),數(shù)組各元素之間不會(huì)有空隙。按照上面的方案,一個(gè)MS2數(shù)組array的布局就是:
|<-????array[1]?????->|<-????array[2]?????->|<-?array[3]?.....
__________________________________________________________
|?????????????|???????|??????????????|??????|
|?????a???????|???b???|??????a???????|???b??|.............
|?????????????|???????|??????????????|??????|
+----------------------------------------------------------
Bytes:??4?????????1??????????4???????????1
?
???????___________________________________
???????|?????????????|???????|\\\\\\\\\\\|
???????|?????a???????|???b???|\\padding\\|
???????|?????????????|???????|\\\\\\\\\\\|
???????+---------------------------------+
?Bytes:??????4???????????1?????????3
????現(xiàn)在無(wú)論是定義一個(gè)單獨(dú)的MS2變量還是MS2數(shù)組,均能保證所有元素的所有字段都滿足對(duì)齊規(guī)定。那么sizeof(MS2)仍然是8,而a的偏移為0,b的偏移是4。
????好的,現(xiàn)在你已經(jīng)掌握了結(jié)構(gòu)體內(nèi)存布局的基本準(zhǔn)則,嘗試分析一個(gè)稍微復(fù)雜點(diǎn)的類型吧。
??typedef?struct?ms3
??{
?????char?a;
?????short?b;
?????double?c;
??}?MS3;
????我想你一定能得出如下正確的布局圖:
?????????
????????padding??
???????????|
??????_____v_________________________________
??????|???|\|?????|\\\\\\\\\|???????????????|
??????|?a?|\|??b??|\padding\|???????c???????|
??????|???|\|?????|\\\\\\\\\|???????????????|
??????+-------------------------------------+
Bytes:??1??1???2???????4????????????8
???????????
????sizeof(short)等于2,b字段應(yīng)從偶數(shù)地址開(kāi)始,所以a的后面填充一個(gè)字節(jié),而sizeof(double)等于8,c字段要從8倍數(shù)地址開(kāi)始,前面的a、b字段加上填充字節(jié)已經(jīng)有4?bytes,所以b后面再填充4個(gè)字節(jié)就可以保證c字段的對(duì)齊要求了。sizeof(MS3)等于16,b的偏移是2,c的偏移是8。接著看看結(jié)構(gòu)體中字段還是結(jié)構(gòu)類型的情況:
??typedef?struct?ms4
??{
?????char?a;
?????MS3?b;
??}?MS4;
????MS3中內(nèi)存要求最嚴(yán)格的字段是c,那么MS3類型數(shù)據(jù)的對(duì)齊模數(shù)就與double的一致(為8),a字段后面應(yīng)填充7個(gè)字節(jié),因此MS4的布局應(yīng)該是:
???????_______________________________________
???????|???????|\\\\\\\\\\\|?????????????????|
???????|???a???|\\padding\\|???????b?????????|
???????|???????|\\\\\\\\\\\|?????????????????|
???????+-------------------------------------+
?Bytes:????1?????????7?????????????16
????顯然,sizeof(MS4)等于24,b的偏移等于8。
關(guān)于union:http://bliuqing.iteye.com/blog/387047
union u {double a;int b; }; union u2 {char a[13];int b; }; union u3 {char a[13];char b; }; cout<<sizeof(u)<<endl; // 8 cout<<sizeof(u2)<<endl; // 16 cout<<sizeof(u3)<<endl; // 13都知道union的大小取決于它所有的成員中,占用空間最大的一個(gè)成員的大小。所以對(duì)于u來(lái)說(shuō),大小就是最大的double類型成員a了,所以sizeof(u)=sizeof(double)=8。但是對(duì)于u2和u3,最大的空間都是char[13]類型的數(shù)組,為什么u3的大小是13,而u2是16呢?關(guān)鍵在于u2中的成員int b。由于int類型成員的存在,使u2的對(duì)齊方式變成4,也就是說(shuō),u2的大小必須在4的對(duì)界上,所以占用的空間變成了16(最接近13的對(duì)界)。?
結(jié)論:復(fù)合數(shù)據(jù)類型,如union,struct,class的對(duì)齊方式為成員中對(duì)齊方式最大的成員的對(duì)齊方式。?
順便提一下CPU對(duì)界問(wèn)題,32的C++采用8位對(duì)界來(lái)提高運(yùn)行速度,所以編譯器會(huì)盡量把數(shù)據(jù)放在它的對(duì)界上以提高內(nèi)存命中率。對(duì)界是可以更改的,使用#pragma pack(x)宏可以改變編譯器的對(duì)界方式,默認(rèn)是8。C++固有類型的對(duì)界取編譯器對(duì)界方式與自身大小中較小的一個(gè)。例如,指定編譯器按2對(duì)界,int類型的大小是4,則int的對(duì)界為2和4中較小的2。在默認(rèn)的對(duì)界方式下,因?yàn)閹缀跛械臄?shù)據(jù)類型都不大于默認(rèn)的對(duì)界方式8(除了long double),所以所有的固有類型的對(duì)界方式可以認(rèn)為就是類型自身的大小。更改一下上面的程序:
#pragma pack(2) union u2 {char a[13];int b; }; union u3 {char a[13];char b; }; #pragma pack(8) cout<<sizeof(u2)<<endl; // 14 cout<<sizeof(u3)<<endl; // 13
由于手動(dòng)更改對(duì)界方式為2,所以int的對(duì)界也變成了2,u2的對(duì)界取成員中最大的對(duì)界,也是2了,所以此時(shí)sizeof(u2)=14。?
結(jié)論:C++固有類型的對(duì)界取編譯器對(duì)界方式與自身大小中較小的一個(gè)。?
9、struct的sizeof問(wèn)題?
因?yàn)閷?duì)齊問(wèn)題使結(jié)構(gòu)體的sizeof變得比較復(fù)雜,看下面的例子:(默認(rèn)對(duì)齊方式下)?
struct s1 {char a;double b;int c;char d; }; struct s2 {char a;char b;int c;double d; }; cout<<sizeof(s1)<<endl; // 24 cout<<sizeof(s2)<<endl; // 16
同樣是兩個(gè)char類型,一個(gè)int類型,一個(gè)double類型,但是因?yàn)閷?duì)界問(wèn)題,導(dǎo)致他們的大小不同。計(jì)算結(jié)構(gòu)體大小可以采用元素?cái)[放法,我舉例子說(shuō)明一下:首先,CPU判斷結(jié)構(gòu)體的對(duì)界,根據(jù)上一節(jié)的結(jié)論,s1和s2的對(duì)界都取最大的元素類型,也就是double類型的對(duì)界8。然后開(kāi)始擺放每個(gè)元素。?
對(duì)于s1,首先把a(bǔ)放到8的對(duì)界,假定是0,此時(shí)下一個(gè)空閑的地址是1,但是下一個(gè)元素d是double類型,要放到8的對(duì)界上,離1最接近的地址是8了,所以d被放在了8,此時(shí)下一個(gè)空閑地址變成了16,下一個(gè)元素c的對(duì)界是4,16可以滿足,所以c放在了16,此時(shí)下一個(gè)空閑地址變成了20,下一個(gè)元素d需要對(duì)界1,也正好落在對(duì)界上,所以d放在了20,結(jié)構(gòu)體在地址21處結(jié)束。由于s1的大小需要是8的倍數(shù),所以21-23的空間被保留,s1的大小變成了24。?
對(duì)于s2,首先把a(bǔ)放到8的對(duì)界,假定是0,此時(shí)下一個(gè)空閑地址是1,下一個(gè)元素的對(duì)界也是1,所以b擺放在1,下一個(gè)空閑地址變成了2;下一個(gè)元素c的對(duì)界是4,所以取離2最近的地址4擺放c,下一個(gè)空閑地址變成了8,下一個(gè)元素d的對(duì)界是8,所以d擺放在8,所有元素?cái)[放完畢,結(jié)構(gòu)體在15處結(jié)束,占用總空間為16,正好是8的倍數(shù)。?
這里有個(gè)陷阱,對(duì)于結(jié)構(gòu)體中的結(jié)構(gòu)體成員,不要認(rèn)為它的對(duì)齊方式就是他的大小,看下面的例子:?
struct s1 {char a[8]; }; struct s2 {double d; }; struct s3 {s1 s;char a; }; struct s4 {s2 s;char a; }; cout<<sizeof(s1)<<endl; // 8 cout<<sizeof(s2)<<endl; // 8 cout<<sizeof(s3)<<endl; // 9 cout<<sizeof(s4)<<endl; // 16;
s1和s2大小雖然都是8,但是s1的對(duì)齊方式是1,s2是8(double),所以在s3和s4中才有這樣的差異。?
所以,在自己定義結(jié)構(gòu)體的時(shí)候,如果空間緊張的話,最好考慮對(duì)齊因素來(lái)排列結(jié)構(gòu)體里的元素。
struct {int n;char s[10];union {int a[5];char b;double c; } u_a; } b; /* printf("%d\n", sizeof(b.n));//4printf("%d\n", sizeof(b.s));//10printf("%d\n", sizeof(b.u_a));//24printf("%d\n", sizeof(b));//40*/
總結(jié)
以上是生活随笔為你收集整理的struc,union,class的内存对齐方式的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Keep-Alive模式
- 下一篇: 线程与进程的异同