c 结构体中的变长数组
在Linux系統(tǒng)里,/usr/include/linux/if_pppox.h里面有這樣一個(gè)結(jié)構(gòu):
struct?pppoe_tag?{
????__u16?tag_type;
????__u16?tag_len;
????char?tag_data[0];
}?__attribute?((packed));
?
最后一個(gè)成員為可變長(zhǎng)的數(shù)組,對(duì)于TLV(Type-Length-Value)形式的結(jié)構(gòu),或者其他需要變長(zhǎng)度的結(jié)構(gòu)體,用這種方式定義最好。使用起來非常方便,創(chuàng)建時(shí),malloc一段結(jié)構(gòu)體大小加上可變長(zhǎng)數(shù)據(jù)長(zhǎng)度的空間給它,可變長(zhǎng)部分可按數(shù)組的方式訪問,釋放時(shí),直接把整個(gè)結(jié)構(gòu)體free掉就可以了。例子如下:
struct?pppoe_tag?*sample_tag;
__u16?sample_tag_len?= 10;
sample_tag?= (struct?pppoe_tag?*)malloc(sizeof(struct?pppoe_tag)+sizeof(char)*sample_tag_len);
sample_tag->tag_type?= 0xffff;
sample_tag->tag_len?=?sample_tag_len;
sample_tag->tag_data[0]=....
?
...
釋放時(shí),
free(sample_tag)
是否可以用?char *tag_data?代替呢?其實(shí)它和?char *tag_data?是有很大的區(qū)別,為了說明這個(gè)問題,我寫了以下的程序:
例:test_size.c
10??struct?tag1
20??{
30??????int?a;
40??????int?b;
50??}__attribute?((packed));
60
70??struct?tag2
80??{
90??????int?a;
100?????int?b;
110?????char?*c;
120??}__attribute?((packed));
130
140??struct?tag3
150??{
160??????int?a;
170??????int?b;
180??????char?c[0];
190??}__attribute?((packed));
200
210??struct?tag4
220??{
230??????int?a;
240??????int?b;
250??????char?c[1];
260??}__attribute?((packed));
270
280??int?main()
290??{
300??????struct?tag2?l_tag2;
310??????struct?tag3?l_tag3;
320??????struct?tag4?l_tag4;
330
340??????memset(&l_tag2,0,sizeof(struct?tag2));
350??????memset(&l_tag3,0,sizeof(struct?tag3));
360??????memset(&l_tag4,0,sizeof(struct?tag4));
370
380??????printf("size of tag1 = %d\n",sizeof(struct?tag1));
390??????printf("size of tag2 = %d\n",sizeof(struct?tag2));
400??????printf("size of tag3 = %d\n",sizeof(struct?tag3));
410
420??????printf("l_tag2 = %p,&l_tag2.c = %p,l_tag2.c = %p\n",&l_tag2,&l_tag2.c,l_tag2.c);
430??????printf("l_tag3 = %p,l_tag3.c = %p\n",&l_tag3,l_tag3.c);
440??????printf("l_tag4 = %p,l_tag4.c = %p\n",&l_tag4,l_tag4.c);
450??????exit(0);
460??}
?
__attribute?((packed))?是為了強(qiáng)制不進(jìn)行字節(jié)對(duì)齊,這樣比較容易說明問題。
程序的運(yùn)行結(jié)果如下:
size?of?tag1?= 8
size?of?tag2?= 12
size?of?tag3?= 8
size?of?tag4?= 9
l_tag2?= 0xbffffad0,&l_tag2.c?= 0xbffffad8,l_tag2.c?= (nil)
l_tag3?= 0xbffffac8,l_tag3.c?= 0xbffffad0
l_tag4?= 0xbffffabc,l_tag4.c?= 0xbffffac4
?
從上面程序和運(yùn)行結(jié)果可以看出:tag1本身包括兩個(gè)位整數(shù),所以占了8個(gè)字節(jié)的空間。tag2包括了兩個(gè)位的整數(shù),外加一個(gè)char?*的指針,所以占了12個(gè)字節(jié)。tag3才是真正看出char?c[0]和char?*c的區(qū)別,char?c[0]中的c并不是指針,是一個(gè)偏移量,這個(gè)偏移量指向的是a、b后面緊接著的空間,所以它其實(shí)并不占用任何空間。tag4更加補(bǔ)充說明了這一點(diǎn)。所以,上面的struct?pppoe_tag的最后一個(gè)成員如果用char?*tag_data定義,除了會(huì)占用多個(gè)字節(jié)的指針變量外,用起來會(huì)比較不方便:方法一,創(chuàng)建時(shí),可以首先為struct?pppoe_tag分配一塊內(nèi)存,再為tag_data分配內(nèi)存,這樣在釋放時(shí),要首先釋放tag_data占用的內(nèi)存,再釋放pppoe_tag占用的內(nèi)存;方法二,創(chuàng)建時(shí),直接為struct?pppoe_tag分配一塊struct?pppoe_tag大小加上tag_data的內(nèi)存,從例一的行可以看出,tag_data的內(nèi)容要進(jìn)行初始化,要讓tag_data指向strct?pppoe_tag后面的內(nèi)存。
struct?pppoe_tag?{
????__u16?tag_type;
????__u16?tag_len;
????char?*tag_data;
}?__attribute?((packed));
?
struct?pppoe_tag?*sample_tag;
__u16?sample_tag_len?= 10;
方法一:
sample_tag?= (struct?pppoe_tag?*)malloc(sizeof(struct?pppoe_tag));
sample_tag->tag_len?=?sample_tag_len;
sample_tag->tag_data?=?malloc(sizeof(char)*sample_tag_len);
sample_tag->tag_data[0]=...
釋放時(shí):
free(sample_tag->tag_data);
free(sample_tag);
?
方法二:
sample_tag?= (struct?pppoe_tag?*)malloc(sizeof(struct?pppoe_tag)+sizeof(char)*sample_tag_len);
sample_tag->tag_len?=?sample_tag_len;
sample_tag->tag_data?= ((char?*)sample_tag)+sizeof(struct?pppoe_tag);
sample_tag->tag_data[0]=...
釋放時(shí):
free(sample_tag);
所以無論使用那種方法,都沒有char?tag_data[0]這樣的定義來得方便。
?
講了這么多,其實(shí)本質(zhì)上涉及到的是一個(gè)C語言里面的數(shù)組和指針的區(qū)別問題。char?a[1]里面的a和char?*b的b相同嗎?《Programming?Abstractions?in?C》(Roberts,?E.S.,機(jī)械工業(yè)出版社,.6)頁里面說:“arr?is?defined?to?be?identical?to?&arr[0]”。也就是說,char?a[1]里面的a實(shí)際是一個(gè)常量,等于&a[0]。而char?*b是有一個(gè)實(shí)實(shí)在在的指針變量b存在。所以,a=b是不允許的,而b=a是允許的。兩種變量都支持下標(biāo)式的訪問,那么對(duì)于a[0]和b[0]本質(zhì)上是否有區(qū)別?我們可以通過一個(gè)例子來說明。
?
例二:
10??#include?<stdio.h>
20??#include?<stdlib.h>
30
40??int?main()
50??{
60??????char?a[10];
70??????char?*b;
80
90??????a[2]=0xfe;
100?????b[2]=0xfe;
110?????exit(0);
120??}
?
編譯后,用objdump可以看到它的匯編:
080483f0 <main>:
80483f0:???????55??????????????????????push???%ebp
80483f1:???????89?e5???????????????????mov????%esp,%ebp
80483f3:???????83?ec?18????????????????sub????$0x18,%esp
80483f6:???????c6?45?f6?fe?????????????movb???$0xfe,0xfffffff6(%ebp)
80483fa:???????8b?45?f0????????????????mov????0xfffffff0(%ebp),%eax
80483fd:???????83?c0?02????????????????add????$0x2,%eax
8048400:???????c6?00?fe????????????????movb???$0xfe,(%eax)
8048403:???????83?c4?f4????????????????add????$0xfffffff4,%esp
8048406:???????6a?00???????????????????push???$0x0
8048408:???????e8?f3?fe?ff?ff??????????call???8048300 <_init+0x68>
804840d:???????83?c4?10????????????????add????$0x10,%esp
8048410:???????c9??????????????????????leave
8048411:???????c3??????????????????????ret
8048412:???????8d?b4?26 00 00 00 00????lea????0x0(%esi,1),%esi
8048419:???????8d?bc?27 00 00 00 00????lea????0x0(%edi,1),%edi
?
可以看出,a[2]=xfe是直接尋址,直接將xfe寫入&a[0]+2的地址,而b[2]=0xfe是間接尋址,先將b的內(nèi)容(地址)拿出來,加,再xfe寫入計(jì)算出來的地址。所以a[0]和b[0]本質(zhì)上是不同的。但當(dāng)數(shù)組作為參數(shù)時(shí),和指針就沒有區(qū)別了。
int?do1(char?a[],int?len);
int?do2(char?*a,int?len);
這兩個(gè)函數(shù)中的a并無任何區(qū)別。都是實(shí)實(shí)在在存在的指針變量。
?
順便再說一下,對(duì)于struct pppoe_tag的最后一個(gè)成員的定義是char tag_data[0],某些編譯器不支持長(zhǎng)度為0的數(shù)組的定義,在這種情況下,只能將它定義成char tag_data[1],使用方法相同。
轉(zhuǎn)載于:https://www.cnblogs.com/wangjian8888/p/7610049.html
總結(jié)
以上是生活随笔為你收集整理的c 结构体中的变长数组的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: JavaScript上传图片方式
- 下一篇: 17.3.12---urlparse模块