【C语言】字节对齐问题(以32位系统为例)
1.?什么是對齊?
現(xiàn)代計算機中內(nèi)存空間都是按照字節(jié)(byte)劃分的,從理論上講似乎對任何類型的變量的訪問可以從任何地址開始,但實際情況是在訪問特定變量的時候經(jīng)常在特定的內(nèi)存地址訪問,這就需要各類型數(shù)據(jù)按照一定的規(guī)則在空間上排列,而不是順序地一個接一個地排放,這就是對齊。
2.?計算機為什么要對齊?
各個硬件平臺對存儲空間的處理上有很大的不同。一些平臺對某些特定類型的數(shù)據(jù)只能從某些特定地址開始存取,其他平臺可能沒有這種情況。但是最常見的是,如果不按照適合其平臺的要求對數(shù)據(jù)存放進行對齊,會在存取效率上帶來損失。比如有些平臺每次讀都是從偶地址開始,一個int型(假設(shè)為 32位)如果存放在偶地址開始的地方,那么一個讀周期就可以讀出,而如果存放在奇地址開始的地方,就可能會需要2個讀周期,并對兩次讀出的結(jié)果的高低字節(jié)進行拼湊才能得到該int數(shù)據(jù),顯然在讀取效率上下降很多。這也是空間和時間的博弈。在網(wǎng)絡(luò)程序中,掌握這個概念可是很重要的:如果在不同平臺之間(比如在Windows 和Linux之間)傳遞2進制流(比如結(jié)構(gòu)體),那么在這兩個平臺間必須要定義相同的對齊方式,不然莫名其妙地出了一些錯,可是很難排查的。
3. 一個對齊的例子
通常,我們寫程序的時候,不需要考慮對齊問題,編譯器會替我們選擇適合目標(biāo)平臺的對齊策略。當(dāng)然,我們也可以通知給編譯器傳遞預(yù)編譯指令而改變對指定數(shù)據(jù)的對齊方法,比如寫入預(yù)編譯指令#pragma pack(2),即告訴編譯器按兩字節(jié)對齊。
但是,正因為我們一般不需要關(guān)心這個問題,所以,如果編輯器對數(shù)據(jù)存放做了對齊,而我們不了解的話,常常會對一些問題感到迷惑。最常見的就是struct數(shù)據(jù)結(jié)構(gòu)的sizeof結(jié)果,比如以下程序:
#include <stdio.h>void main(){struct A{char a;short b;int c;};printf( "size of struct A = %d \n", sizeof(struct A) );}輸出結(jié)果為:8字節(jié)。
如果我們將結(jié)構(gòu)體中的變量聲明位置稍加改動(并不改變變量本身),請再看以下程序:
#include <stdio.h>void main(){struct A{short b;int c;char a;};printf( "size of struct A = %d \n", sizeof(struct A) );}輸出結(jié)果為:12字節(jié)。
問題出來了,他們都是同一個結(jié)構(gòu)體,為什么占用的內(nèi)存大小不同呢?為此,我們需要對對齊算法有所了解。
4.?對齊算法
由于各個平臺和編譯器的不同,現(xiàn)以32位,vc++6.0系統(tǒng)為例,來討論編譯器對struct數(shù)據(jù)結(jié)構(gòu)中的各成員如何進行對齊的。
首先,我們給出四個概念:
1)數(shù)據(jù)類型自身的對齊值:就是基本數(shù)據(jù)類型的自身對齊值,比如char類型的自身對齊值為1字節(jié),int類型的自身對齊值為4字節(jié)。
2)指定對齊值:預(yù)編譯命令#pragma pack (value)指定的對齊值value。
3)結(jié)構(gòu)體或者類的自身對齊值:其成員中自身對齊值最大的那個值,比如以上的struct A的對齊值為4。
4)數(shù)據(jù)成員、結(jié)構(gòu)體和類的有效對齊值:自身對齊值和指定對齊值中較小的那個值。
設(shè)結(jié)構(gòu)體如下定義:
struct A{char a;short b;int c; };a是char型數(shù)據(jù),占用1字節(jié)內(nèi)存;short型數(shù)據(jù),占用2字節(jié)內(nèi)存;int型數(shù)據(jù),占用4字節(jié)內(nèi)存。因此,結(jié)構(gòu)體A的自身對齊值為4。于是,a和b要組成4個字節(jié),以便與c的4個字節(jié)對齊。而a只有1個字節(jié),a與b之間便空了一個字節(jié)。我們知道,結(jié)構(gòu)體類型數(shù)據(jù)是按順序存儲結(jié)構(gòu)一個接一個向后排列的,于是其存儲方式為:
其中空白方格無數(shù)據(jù),是浪費的內(nèi)存空間,共占用8字節(jié)內(nèi)存。
實際上,為了更加明顯地表示“對齊”,我們可以將以上結(jié)構(gòu)想象為以下的行排列:
?
對于另一個結(jié)構(gòu)體定義:
struct A{short b;int c;char a;};其內(nèi)存存儲方式為:
同樣把它想象成行排列:
可見,浪費的空間更多。
其實,除了結(jié)構(gòu)體之外,整個程序在給每個變量進行內(nèi)存分配時都會遵循對齊機制,也都會產(chǎn)生內(nèi)存空間的浪費。但我們要知道,這種浪費是值得的,因為它換來的是效率的提高。
以上分析都是建立在程序默認(rèn)的對齊值基礎(chǔ)之上的,我們可以通過添加預(yù)定義命令#pragma pack(value)來對對齊值進行自定義,比如#pragma pack(1),對齊值變?yōu)?,此時內(nèi)存緊湊,不會出現(xiàn)內(nèi)存浪費,但效率降低了。效率之所以降低,是因為:如果存在更大字節(jié)數(shù)的變量時(比1大),比如int類型,需要進行多次讀周期才能將一個int數(shù)據(jù)拼湊起來。
參考資料:
[1]?http://blog.sina.com.cn/s/blog_715de2f50100pgs3.html
[2]?http://baike.baidu.com/view/1523557.htm?fr=aladdin
總結(jié)
以上是生活随笔為你收集整理的【C语言】字节对齐问题(以32位系统为例)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MPI编程的常用接口速查
- 下一篇: dnf会修改跨区服务器吗,dnf新跨区系