sizeof()那点儿事儿

转载

hackfreer 2010-12-10 12:39:05 博主文章分类：[C&C++]编码

C++，用了许久发现我对你的了解还真的不够，至少可以这样来评价自己的了解：刚刚接触皮毛!所以我打算把C++在系统的复习，或者说重新学习一下。一下我的测试代码都是在VC++ 6.0和32位操作系统下做的测试，参考《C++国际标准1998》和《inside the c++ object model》。
   一,由sizeof()函数引发的故事:
   用sizeof()来计算一个空类的大小,代码如下:
class ClassSize
{
   public:
   protected:
   private:
};

int main()
{
   int x = sizeof(ClassSize);
   cout<<"The result :"<<x<<endl;
   return 0;
}
这个计算结果是什么?这个问题留给大家去试验.
   1，基本数据类型的sizeof
cout<<sizeof(char)<<endl;                     结果是1
cout<<sizeof(int)<<endl;                        结果是4
cout<<sizeof(unsigned int)<<endl; 结果是4
cout<<sizeof(long int)<<endl;                结果是4
cout<<sizeof(short int)<<endl;               结果是2
cout<<sizeof(float)<<endl;                     结果是4
cout<<sizeof(double)<<endl;                 结果是8
这个估计是个程序员都能回答出来,但这里列举出来时.
   2，指针变量的sizeof
char *pc ="abc";
sizeof( pc ); // 结果为4
sizeof(*pc);     // 结果为1

int *pi;
sizeof( pi ); //结果为4
sizeof(*pi); //结果为4

char **ppc = &pc;
sizeof( ppc ); // 结果为4
sizeof( *ppc ); // 结果为4
sizeof( **ppc ); // 结果为1

void (*pf)();// 函数指针
sizeof( pf );// 结果为4
sizeof( pc ),sizeof( pi ),sizeof( ppc ),sizeof( pf ),指针的大小就是4个字节;sizeof(*pc),指针指向的内容即字符串的首地址,当然是1个字节了;sizeof(*pi),×××4个字节;sizeof( *ppc ),sizeof( **ppc )就有点文字游戏的意味了.
3，数组的sizeof
数组的sizeof值等于数组所占用的内存字节数，如：
char str[] = "abc";
int a2[3];
sizeof( a1 ); // 结果为4，字符末尾还存在一个NULL终止符
sizeof( a2 ); // 结果为3*4=12（依赖于int）

写到这里，提一问，下面的c3，c4值应该是多少呢
void func(char a3[3])
{
int c3 = sizeof( a3 ); // c3 == 3?4
}
void func2(char a4[])
{
int c4 = sizeof( a4 ); // c4 == 4
}
也许当你试图回答c4的值时已经意识到c3答错了，是的，c3!=3。这里函数参数a3已不再是数组类型，而是蜕变成指针，相当于char* a3，为什么仔细想想就不难明白，我们调用函数func时，程序会在栈上分配一个大小为3的数组吗?不会！数组是“传址”的，调用者只需将实参的地址传递过去，所以a3自然为指针类型（char*），c3的值也就为4。
   4，结构体的sizeof
struct MyStruct
{
            double dda;
          char strdda;
            int nType;
};//结果为16
    为上面的结构分配空间的时候，VC根据成员变量出现的顺序和对齐方式，先为第一个成员dda分配空间，其起始地址跟结构的起始地址相同（刚好偏移量0刚好为sizeof(double)的倍数），该成员变量占用sizeof(double)=8个字节；接下来为第二个成员strdda分配空间，这时下一个可以分配的地址对于结构的起始地址的偏移量为8，是sizeof(char)的倍数，所以把strdda存放在偏移量为8的地方满足对齐方式，该成员变量占用sizeof(char)=1个字节；接下来为第三个成员nType分配空间，这时下一个可以分配的地址对于结构的起始地址的偏移量为9，不是sizeof(int)=4的倍数，为了满足对齐方式对偏移量的约束问题，VC自动填充3个字节（这三个字节没有放什么东），这时下一个可以分配的地址对于结构的起始地址的偏移量为12，刚好是sizeof(int)=4的倍数，所以把nType存放在偏移量为12的地方，该成员变量占用sizeof(int)=4个字节；这时整个结构的成员变量已经都分配了空间，总的占用的空间大小为：8+1+3+4=16，刚好为结构的字节边界数（即结构中占用最大空间的类型所占用的字节数sizeof(double)=8）的倍数，所以没有空缺的字节需要填充。所以整个结构的大小为：sizeof(MyStruct)=8+1+3+4=16，其中有3个字节是VC自动填充的，没有放任何有意义的东西。下面这个结构呢?留给读者自己去测试吧:
struct MyStruct
{
             double dda;
          char strdda;
           int type;
          char add;
};
   5，含位域结构体的sizeof

struct data
{
char f1 : 3;
char f2 : 4;
char f3 : 5;
};
其内存布局为：
|_f1__|___f2__|_|____f3___|_____|
|_|_ |_|_|_ |_|_|_|_|_|_| _| _|_|_ |_|
0 3 7 8 13 16

位域类型为char，第1个字节仅能容纳下f1和f2，所以f2被压缩到第1个字节中，而f3只能从下一个字节开始。因此sizeof(data)的结果为2。

6，含有联合体的结构体的sizeof
struct stru1
{
           char *ptr,ch;                   //有指针变成4＋4
           union A            //后面跟了A定义了一个类型,不占内存，而后面不跟A,是声明了结构体的一个成员,占内存,
          {
              short a,b;
              unsigned int c:2, d:1;
           };
           struct stru1* next;                //指针占4
};//这样是8＋4＝12个字节

struct stru1
{
           char *ptr,ch;
           union              //联合体是结构体的成员，占内存，并且最大类型是unsigned int，占4
          {
               short a,b;
               unsigned int c:2, d:1;
           };
           struct stru1* next;
};//这样是8＋4＋4＝16个字节
看着有点迷糊吧,不要着急,我们慢慢来分析.首先我们再温习一下什么是联合:联合表示几个变量公用一个内存位置, 在不同的时间保存不同的数据类型和不同长度的变量;当一个联合被说明时, 编译程序自动地产生一个变量, 其长度为联合中最大的变量长度。这下或许你有点明白了,不过我们再来看看下面的例子,你就会深刻理解了:
union abc
{
      int i;
      char mm;
   };
用上面说明的联合定义一个名为lgc的联合变量, 可写成: union abc lgc,现在编译器就为lgc分配了4个字节的内存,因为最大为int.如果你觉得还不明白,那你去试试把第一个结构体改为:
struct stru1
{
           char *ptr,ch;
           union A
          {
              short a,b;
              unsigned int c:2, d:1;
           };
    union A x;
           struct stru1* next;
};//这样是8＋4+4＝16个字节
   7，结构体体含有结构体的sizeof

struct stru1
   {
      char c;
      int i;
   };
struct stru2
    {
     char c1;
     stru1 s;
     char c2;
     };
cout<<sizeof(stru2);      //stru2=16

stru1的最宽简单成员的类型为int，stru2在考虑最宽简单类型成员时是将S1“打散”看的，所以S3的最宽简单类型也为int，这样，通过S3定义的变量，其存储空间首地址需要被4整除，整个sizeof(S3)的值也应该被4整除。c1的偏移量为0，s的偏移量呢这时s是一个整体，它作为结构体变量也满足前面三个准则，所以其大小为8，偏移量为4，c1与s之间便需要3个填充字节，而c2与s之间就不需要了，所以c2的偏移量为12，算上c2的大小为13，13是不能被4整除的，这样末尾还得补上3个填充字节。最后得到sizeof(stru2)的值为16
8，带有#pragma pack的sizeof

它是用来调整结构体对齐方式的，不同编译器名称和用法略有不同，VC6中通过#pragma pack实现，也可以直接修改/Zp编译开关。#pragma pack的基本用法为：#pragma pack( n )，n为字节对齐数，其取值为1、2、4、8、16，默认是8，如果这个值比结构体成员的sizeof值小，那么该成员的偏移量应该以此值为准，即是说，结构体成员的偏移量应该取二者的最小值，再看示例：
#pragma pack(push) // 将当前pack设置压栈保存
#pragma pack(2)// 必须在结构体定义之前使用
struct stru1
{
char c;
int i;
};
struct stru2
{
char c1;
stru1 s;
char c2
};
#pragma pack(pop) // 恢复先前的pack设置
计算sizeof(S1)时，min(2, sizeof(i))的值为2，所以i的偏移量为2，加上sizeof(i)等于6，能够被2整除，所以整个S1的大小为6。同样，对于sizeof(S3)，s的偏移量为2，c2的偏移量为8，加上sizeof(c2)等于9，不能被2整除，添加一个填充字节，所以sizeof(S3)等于10。

9，空结构体或者空类的sizeof

struct S5 { };
sizeof( S5 ); // 结果为1
class c1{ };
sizeof( c1); // 结果为1
为什么?随便就推荐一本书吧:inside the c++ object model,读者自己去找答案吧,绝对有帮助.

10，类的sizeof
最后回到我们开始的地方,类的sizeof值等于类中成员变量所占用的内存字节数。如：

class A
{
public:
          int b;
          float c;
          char d;
};

int main(void)
{
A object;
cout << "sizeof(object) is " << sizeof(object) << endl;
return 0 ;
}

输出结果为12（我的机器上sizeof(float)值为4，字节对其前面已经讲过）。不过需要注意的是，如果类中存在静态成员变量，结果又会是什么样子呢？
class A
{
public:
          static int a;
          int b;
          float c;
          char d;
};

int main()
{
A object;
cout << "sizeof(object) is " << sizeof(object) << endl;
return 0 ;
}

结果仍然是12.因为在程序编译期间，就已经为static变量在静态存储区域分配了内存空间，并且这块内存在程序的整个运行期间都存在。而每次声明了类A的一个对象的时候，为该对象在堆上，根据对象的大小分配内存。如果类A中包含成员函数，那么又会是怎样的情况呢？看下面的例子:

class A
{
public:
          static int a;
          int b;
          float c;
          char d;
          int add(int x,int y)
          {
            return x+y;
          }
};

int main()
{
A object;
cout << "sizeof(object) is " << sizeof(object) << endl;
b = object.add(3,4);
cout << "sizeof(object) is " << sizeof(object) << endl;
return 0 ;
}

结果仍为12.因为只有非静态类成员变量在新生成一个object的时候才需要自己的副本。所以每个非静态成员变量在生成新object需要内存，而function是不需要的。