📄 关于 sizeof() 的一些思考.txt

📁 一些学C的忠告以及有小程序可学习。应该是终生受用的。
💻 TXT
📖 第 1 页 / 共 2 页
字号:
上一页 12
  int c3 = sizeof( a3 ); // c3 ==
}
void foo4(char a4[])
{
  int c4 = sizeof( a4 ); // c4 ==
}

*********************************************************

也许当你试图回答c4的值时已经意识到c3答错了，是的，c3!=3。

这里函数参数a3已不再是数组类型，而是蜕变成指针。相当于char* a3，为什么仔细想想就不难明白。

我们调用函数foo1时，程序会在栈上分配一个大小为3的数组吗？不会！

数组是“传址”的，调用者只需将实参的地址传递过去，所以a3自然为指针类型（char*），c3的值也就为4。


9. 结构体的sizeof

这是初学者问得最多的一个问题，所以这里有必要多费点笔墨。让我们先看一个结构体：

struct S1
{
  char c;
  int i;
};

问sizeof(s1)等于多少？

聪明的你开始思考了，char占1个字节，int占4个字节，那么加起来就应该是5。

是这样吗？

你在你机器上试过了吗？

也许你是对的，但很可能你是错的！

VC6中按默认设置得到的结果为8。

Why？为什么受伤的总是我？

请不要沮丧，我们来好好琢磨一下sizeof的定义 —— sizeof的结果等于对象或者类型所占的内存字节数。好吧，那就让我们来看看S1的内存分配情况：

S1 s1 = { 'a', 0xFFFFFFFF };

定义上面的变量后，加上断点，运行程序，观察s1所在的内存，你发现了什么？

以我的VC6.0为例，s1的地址为0x0012FF78，其数据内容如下：

0012FF78: 61 CC CC CC FF FF FF FF

发现了什么？怎么中间夹杂了3个字节的CC？

看看MSDN上的说明：

When applied to a structure type or variable, sizeof returns the actual size, which may include padding bytes inserted for 

alignment.

原来如此，这就是传说中的字节对齐啊！一个重要的话题出现了。

为什么需要字节对齐？

计算机组成原理教导我们，这样有助于加快计算机的取数速度，否则就得多花指令周期了。

为此，编译器默认会对结构体进行处理（实际上其它地方的数据变量也是如此），让宽度为2的基本数据类型（short等）都位于能被2整除的地址上，让宽度为4的基本数据类型（int等）都位于能被4整除的地址上。以此类推，这样，两个数中间就可能需要加入填充字节，所以整个结构体的sizeof值就增长了。

让我们交换一下S1中char与int的位置：

struct S2
{
  int i;
  char c;
};

看看sizeof(S2)的结果为多少？怎么还是8。

再看看内存，原来成员c后面仍然有3个填充字节。

这又是为什么啊？别着急，下面总结规律。

  字节对齐的细节和编译器实现相关，但一般而言，满足三个准则：
  1) 结构体变量的首地址能够被其最宽基本类型成员的大小所整除；
  2) 结构体每个成员相对于结构体首地址的偏移量（offset）都是成员大小的整数倍，如有需要编译器会在成员之间加上填充字节（internal adding）；
  3) 结构体的总大小为结构体最宽基本类型成员大小的整数倍，如有需要编译器会在最末一个成员之后加上填充字节（trailing padding）。

  对于上面的准则，有几点需要说明：

1) 前面不是说结构体成员的地址是其大小的整数倍，怎么又说到偏移量了呢？

因为有了第1点存在，所以我们就可以只考虑成员的偏移量，这样思考起来简单。想想为什么。

结构体某个成员相对于结构体首地址的偏移量可以通过宏offsetof()来获得，这个宏也在stddef.h中定义，如下：

#define offsetof(s,m) (size_t)&(((s *)0)->m)

例如，想要获得S2中c的偏移量，方法为

size_t pos = offsetof(S2, c);// pos等于4


2) 基本类型是指前面提到的像char、short、int、float、double这样的内置数据类型。这里所说的“数据宽度”就是指其sizeof的大小。由于结构体的成员可以是复合类型，比如另外一个结构体，所以在寻找最宽基本类型成员时，应当包括复合类型成员的子成员，而不是把复合成员看成是一个整体。但在确定复合类型成员的偏移位置时则是将复合类型作为整体看待。

这里叙述起来有点拗口，思考起来也有点挠头，还是让我们看看例子吧（具体数值仍以VC6为例，以后不再说明）：

struct S3
{
  char c1;
  S1 s;
  char c2;
};

S1的最宽简单成员的类型为int，S3在考虑最宽简单类型成员时是将S1“打散”看的，所以S3的最宽简单类型为int。这样，通过S3定义的变量，其存储空间首地址需要被4整除，整个sizeof(S3)的值也应该被4整除。

c1的偏移量为0，s的偏移量呢？这时s是一个整体，它作为结构体变量也满足前面三个准则，所以其大小为8，偏移量为4，c1与s之间便需要3个填充字节，而c2与s之间就不需要了，所以c2的偏移量为12，算上c2的大小为13，13是不能被4整除的，这样末尾还得补上3个填充字节。最后得到sizeof(S3)的值为16。


  通过上面的叙述，我们可以得到一个公式：
  结构体的大小等于最后一个成员的偏移量加上其大小再加上末尾的填充字节数目，即：

sizeof( struct ) = offsetof( last item ) + sizeof( last item ) + sizeof( trailing padding )



10.类的sizeof

类的sizeof值等于类中成员变量所占用的内存字节数。如：

****************************************************************

class A
{
public:
  int b;
  float c;
  char d;
};

int main(void)
{
A object;
cout << "sizeof(object) is " << sizeof(object) << endl;
return 0 ;
}

************************************************************


输出结果为12（我的机器上sizeof(float)值为4，字节对其前面已经讲过）。

不过需要注意的是，如果类中存在静态成员变量，结果又会是什么样子呢？

************************************************************

class A
{
public:
  static int a;
  int b;
  float c;
  char d;
};

int main()
{
A object;
cout << "sizeof(object) is " << sizeof(object) << endl;
return 0 ;
}

************************************************************


16？不对。结果仍然是12.

因为在程序编译期间，就已经为static变量在静态存储区域分配了内存空间，并且这块内存在程序的整个运行期间都存在。

而每次声明了类A的一个对象的时候，为该对象在堆上，根据对象的大小分配内存。

如果类A中包含成员函数，那么又会是怎样的情况呢？看下面的例子

************************************************************

class A
{
public:
  static int a;
  int b;
  float c;
  char d;
  int add(int x,int y)
  {
    return x+y;
  }
};

int main()
{
A object;
cout << "sizeof(object) is " << sizeof(object) << endl;
b = object.add(3,4);
cout << "sizeof(object) is " << sizeof(object) << endl;
return 0 ;
}

************************************************************

结果仍为12。 

因为只有非静态类成员变量在新生成一个object的时候才需要自己的副本。
所以每个非静态成员变量在生成新object需要内存，而function是不需要的。


注：C++中的多态和虚继承也是非常重要的东西，不过比较复杂，编译器不同，细节也有所不同。（以后慢慢研究，哈哈）
上一页 12
⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -