C++,用了许久发现我对你的了解还真的不够,至少可以这样来评价自己的了解:刚刚接触皮毛!所以我打算把C++在系统的复习,或者说重新学习一下。一下我的测试代码都是在VC++ 6.0和32位操作系统下做的测试,参考《C++国际标准1998》和《inside the c++ object model》。
一,由sizeof()函数引发的故事:
用sizeof()来计算一个空类的大小,代码如下:
class ClassSize
{
public:
protected:
private:
};
int main()
{
int x = sizeof(ClassSize);
cout<<"The result :"<<x<<endl;
return 0;
}
这个计算结果是什么?这个问题留给大家去试验.
1,基本数据类型的sizeof
cout<<sizeof(char)<<endl; 结果是1
cout<<sizeof(int)<<endl; 结果是4
cout<<sizeof(unsigned int)<<endl; 结果是4
cout<<sizeof(long int)<<endl; 结果是4
cout<<sizeof(short int)<<endl; 结果是2
cout<<sizeof(float)<<endl; 结果是4
cout<<sizeof(double)<<endl; 结果是8
这个估计是个程序员都能回答出来,但这里列举出来时.
2,指针变量的sizeof
char *pc ="abc";
sizeof( pc ); // 结果为4
sizeof(*pc); // 结果为1
int *pi;
sizeof( pi ); //结果为4
sizeof(*pi); //结果为4
char **ppc = &pc;
sizeof( ppc ); // 结果为4
sizeof( *ppc ); // 结果为4
sizeof( **ppc ); // 结果为1
void (*pf)();// 函数指针
sizeof( pf );// 结果为4
sizeof( pc ),sizeof( pi ),sizeof( ppc ),sizeof( pf ),指针的大小就是4个字节;sizeof(*pc),指针指向的内容即字符串的首地址,当然是1个字节了;sizeof(*pi),×××4个字节;sizeof( *ppc ),sizeof( **ppc )就有点文字游戏的意味了.
3,数组的sizeof
数组的sizeof值等于数组所占用的内存字节数,如:
char str[] = "abc";
int a2[3];
sizeof( a1 ); // 结果为4,字符 末尾还存在一个NULL终止符
sizeof( a2 ); // 结果为3*4=12(依赖于int)
写到这里,提一问,下面的c3,c4值应该是多少呢
void func(char a3[3])
{
int c3 = sizeof( a3 ); // c3 == 3?4
}
void func2(char a4[])
{
int c4 = sizeof( a4 ); // c4 == 4
}
也许当你试图回答c4的值时已经意识到c3答错了,是的,c3!=3。这里函数参数a3已不再是数组类型,而是蜕变成指针,相当于char* a3,为什么仔细想想就不难明白,我们调用函数func时,程序会在栈上分配一个大小为3的数组吗?不会!数组是“传址”的,调用者只需将实参的地址传递过去,所以a3自然为指针类型(char*),c3的值也就为4。
4,结构体的sizeof
struct MyStruct
{
double dda;
char strdda;
int nType;
};//结果为16
为上面的结构分配空间的时候,VC根据成员变量出现的顺序和对齐方式,先为第一个成员dda分配空间,其起始地址跟结构的起始地址相同(刚好偏移量0刚好为sizeof(double)的倍数),该成员变量占用sizeof(double)=8个字节;接下来为第二个成员strdda分配空间,这时下一个可以分配的地址对于结构的起始地址的偏移量为8,是sizeof(char)的倍数,所以把strdda存放在偏移量为8的地方满足对齐方式,该成员变量占用sizeof(char)=1个字节;接下来为第三个成员nType分配空间,这时下一个可以分配的地址对于结构的起始地址的偏移量为9,不是sizeof(int)=4的倍数,为了满足对齐方式对偏移量的约束问题,VC自动填充3个字节(这三个字节没有放什么东),这时下一个可以分配的地址对于结构的起始地址的偏移量为12,刚好是sizeof(int)=4的倍数,所以把nType存放在偏移量为12的地方,该成员变量占用sizeof(int)=4个字节;这时整个结构的成员变量已经都分配了空间,总的占用的空间大小为:8+1+3+4=16,刚好为结构的字节边界数(即结构中占用最大空间的类型所占用的字节数sizeof(double)=8)的倍数,所以没有空缺的字节需要填充。所以整个结构的大小为:sizeof(MyStruct)=8+1+3+4=16,其中有3个字节是VC自动填充的,没有放任何有意义的东西。下面这个结构呢?留给读者自己去测试吧:
struct MyStruct
{
double dda;
char strdda;
int type;
char add;
};
5,含位域结构体的sizeof
struct data
{
char f1 : 3;
char f2 : 4;
char f3 : 5;
};
其内存布局为:
|_f1__|___f2__|_|____f3___|_____|
|_|_ |_|_|_ |_|_|_|_|_|_| _| _|_|_ |_|
0 3 7 8 13 16
位域类型为char,第1个字节仅能容纳下f1和f2,所以f2被压缩到第1个字节中,而f3只能从下一个字节开始。因此sizeof(data)的结果为2。
6,含有联合体的结构体的sizeof
struct stru1
{
char *ptr,ch; //有指针变成4+4
union A //后面跟了A定义了一个类型,不占内存,而后面不跟A,是声明了结构体的一个成员,占内存,
{
short a,b;
unsigned int c:2, d:1;
};
struct stru1* next; //指针占4
};//这样是8+4=12个字节
struct stru1
{
char *ptr,ch;
union //联合体是结构体的成员,占内存,并且最大类型是unsigned int,占4
{
short a,b;
unsigned int c:2, d:1;
};
struct stru1* next;
};//这样是8+4+4=16个字节
看着有点迷糊吧,不要着急,我们慢慢来分析.首先我们再温习一下什么是联合:联合表示几个变量公用一个内存位置, 在不同的时间保存不同的数据类型 和不同长度的变量;当一个联合被说明时, 编译程序自动地产生一个变量, 其长度为联合中最大的变量长度。这下或许你有点明白了,不过我们再来看看下面的例子,你就会深刻理解了:
union abc
{
int i;
char mm;
};
用上面说明的联合定义一个名为lgc的联合变量, 可写成: union abc lgc,现在编译器就为lgc分配了4个字节的内存,因为最大为int.如果你觉得还不明白,那你去试试把第一个结构体改为:
struct stru1
{
char *ptr,ch;
union A
{
short a,b;
unsigned int c:2, d:1;
};
union A x;
struct stru1* next;
};//这样是8+4+4=16个字节
7,结构体体含有结构体的sizeof
struct stru1
{
char c;
int i;
};
struct stru2
{
char c1;
stru1 s;
char c2;
};
cout<<sizeof(stru2); //stru2=16
stru1的最宽简单成员的类型为int,stru2在考虑最宽简单类型成员时是将S1“打散”看的,所以S3的最宽简单类型也为int,这样,通过S3定义的变量,其存储空间首地址需要被4整除,整个sizeof(S3)的值也应该被4整除。c1的偏移量为0,s的偏移量呢这时s是一个整体,它作为结构体变量也满足前面三个准则,所以其大小为8,偏移量为4,c1与s之间便需要3个填充字节,而c2与s之间就不需要了,所以c2的偏移量为12,算上c2的大小为13,13是不能被4整除的,这样末尾还得补上3个填充字节。最后得到sizeof(stru2)的值为16
8,带有#pragma pack的sizeof
它是用来调整结构体对齐方式的,不同编译器名称和用法略有不同,VC6中通过#pragma pack实现,也可以直接修改/Zp编译开关。#pragma pack的基本用法为:#pragma pack( n ),n为字节对齐数,其取值为1、2、4、8、16,默认是8,如果这个值比结构体成员的sizeof值小,那么该成员的偏移量应该以此值为准,即是说,结构体成员的偏移量应该取二者的最小值,再看示例:
#pragma pack(push) // 将当前pack设置压栈保存
#pragma pack(2)// 必须在结构体定义之前使用
struct stru1
{
char c;
int i;
};
struct stru2
{
char c1;
stru1 s;
char c2
};
#pragma pack(pop) // 恢复先前的pack设置
计算sizeof(S1)时,min(2, sizeof(i))的值为2,所以i的偏移量为2,加上sizeof(i)等于6,能够被2整除,所以整个S1的大小为6。同样,对于sizeof(S3),s的偏移量为2,c2的偏移量为8,加上sizeof(c2)等于9,不能被2整除,添加一个填充字节,所以sizeof(S3)等于10。
9,空结构体或者空类的sizeof
struct S5 { };
sizeof( S5 ); // 结果为1
class c1{ };
sizeof( c1); // 结果为1
为什么?随便就推荐一本书吧:inside the c++ object model,读者自己去找答案吧,绝对有帮助.
10,类的sizeof
最后回到我们开始的地方,类的sizeof值等于类中成员变量所占用的内存字节数。如:
class A
{
public:
int b;
float c;
char d;
};
int main(void)
{
A object;
cout << "sizeof(object) is " << sizeof(object) << endl;
return 0 ;
}
输出结果为12(我的机器上sizeof(float)值为4,字节对其前面已经讲过)。不过需要注意的是,如果类中存在静态成员变量,结果又会是什么样子呢?
class A
{
public:
static int a;
int b;
float c;
char d;
};
int main()
{
A object;
cout << "sizeof(object) is " << sizeof(object) << endl;
return 0 ;
}
结果仍然是12.因为在程序编译期间,就已经为static变量在静态存储区域分配了内存空间,并且这块内存在程序的整个运行期间都存在。而每次声明了类A的一个对象的时候,为该对象在堆上,根据对象的大小分配内存。如果类A中包含成员函数,那么又会是怎样的情况呢?看下面的例子:
class A
{
public:
static int a;
int b;
float c;
char d;
int add(int x,int y)
{
return x+y;
}
};
int main()
{
A object;
cout << "sizeof(object) is " << sizeof(object) << endl;
b = object.add(3,4);
cout << "sizeof(object) is " << sizeof(object) << endl;
return 0 ;
}
结果仍为12.因为只有非静态类成员变量在新生成一个object的时候才需要自己的副本。所以每个非静态成员变量在生成新object需要内存,而function是不需要的。