《C陷阱与缺陷》：如何理解((void()())0)()？

转载

tennysonsky 2022-09-28 20:50:48 博主文章分类：【C/C++】

有一次，一个程序员与我交谈一个问题。他当时正在编写一个独立运行于某种微处理器上的C程序。当计算机启动时，硬件将调用首地址为0位置的子例程。

为了模拟开机启动时的情形，我们必须设计出一个C语句，以显式调用该子例程。经过一段时间的思考，我们最后得到的语句如下：

(* ( void(*)() ) 0) ();

像这样的表达式恐怕会令每个C程序员的内心都“不寒而栗”。然而，他们大可不必对此望而生畏，因为构造这类表达式其实只有一条简单的规则：按照使用的方式来声明。

任何C变量的声明都由两部分组成：类型以及一组类似表达式的声明符（declarator）。

声明符从表面上看与表达式有些类似，对它求值应该返回一个声明中给定类型的结果。最简单的声明符就是单个变量，如：

float

这个声明的含义是：当对其求值时，表达式 f 和 g 的类型为浮点数类型（float）。

因为声明符与表达式的相似，所以我们也可以在声明符中任意使用括号：

float

这个声明的含义是：当对其求值时，((f)) 的类型为浮点类型，由此可以推知，f也是浮点类型。

同样的逻辑也适用于函数和指针类型的声明，例如：

float ff();

这个声明的含义是：表达式 ff() 求值结果是一个浮点数，也就是说，ff是一个返回值为浮点类型的函数。类似地，

float

这个声明的含义是 *pf 是一个浮点数，也就是说，pf 是一个指向浮点数的指针。

以上这些形式在声明中还可以组合起来，就像在表达式中进行组合一样。因此，

*g(), (*h)();

表示 *g() 与 (*h)() 是浮点表达式。因为 () 结合优先级高于*，*g() 也就是 *(g())：g 是一个函数，该函数的返回值类型为指向浮点数的指针。同理，可以得出 h 是一个函数指针，h 所指向函数的返回值为浮点类型。

一旦我们知道了如何声明一个给定类型的变量，那么该类型的类型转换符就很容易得到了：只需要把声明中的变量名和声明末尾的分号去掉，再将剩余的部分用一个括号整个“封装”起来即可。例如，因为下面的声明：

float

表示 h 是一个指向返回值为浮点类型的函数的指针，因此，

(float (*)())

表示一个“指向返回值为浮点类型的函数的指针”的类型转换符。

拥有了这些预备知识，我们现在可以分两步来分析表达式 (*(void(*)())0)() 。

第一步，假定变量 fp 是一个函数指针，那么如何调用 fp 所指向的函数呢？

调用方法如下：

(*fp)();

因为 fp 是一个函数指针，那么 *fp 就是该指针所指向的函数，所以 (*fp)() 就是调用该函数的方式。ANSI C标准允许程序员将上式简写为 fp()，但是一定要记住这种写法只是一种简写形式。

在表达式 (*fp)() 中，*fp 两侧的括号非常重要，因为函数运算符 () 的优先级高于单目运算符 *。如果 *fp 两侧没有括号，那么 *fp() 实际上与 *( fp() ) 的含义完全一致，ANSI C把它作为 *( (*fp)() ) 的简写形式。

现在，剩下的问题就只是找到一个恰当的表达式来替换 fp。我们将在分析的第二步来解决这个问题。如果C编译器能够理解我们大脑中对于类型的认识，那么我们可以这样写：

(*0)();

上式并不能生效，因为运算符 * 必须要一个指针来做操作数。而且，这个指针还应该是一个函数指针，这样经运算符 * 作用后的结果才能作为函数被调用。因此，在上式中必须对 0 作类型转换，转换后的类型可以大致描述为：“指向返回值为void类型的函数的指针”。

如果 fp 是一个指向返回值为 void 类型的函数的指针，那么 (*fp)() 的值为 void，fp 的声明如下：

void

因此，我们可以用下式来完成调用存储位置为 0 的子例程：

void (*fp)();
(*fp)();

译注：此处作者假设 fp 默认初始化为 0，这种写法不宜提倡。这种写法的代价是多声明了一个“哑”变量。

但是，我们一旦知道如何声明一个变量，也就自然知道如何对一个常数进行类型转换，将其转型为该变量的类型：只需要在变量声明中将变量名去掉即可。因此，将常数 0 转型为“指向返回值为 void 的函数的指针”类型，可以这样写：

(void (*)())0

因此，我们可以用 (void (*)())0 来替换 fp，从而得到：

(*(void (*)())0)();

末尾的分号使得表达式成为一个语句。

在我当初解决这个问题的时候，C 语言中还没有 typedef 声明。尽管不用 typedef 来解决这个问题对剖析本例的细节而言是一个很好的方式，但无疑使用 typedef 能够使表述更加清晰：

typedef void (*funcptr)();
(*(funcptr)0)();

这个棘手的例子并不是孤立的，还有一些 C 程序员经常遇到的问题，实际上和这个例子是同一个类型的。例如，考虑 signal 库函数，在包括该函数的 C 编译器实现中，signal 函数接受两个参数：一个是代表需要“被捕获”的特定 signal 的整数值；另一个是指向用户提供的函数的指针，该函数用于处理“捕获到”的特定signal，返回值类型为 void。

一般情况下，程序员并不主动声明 signal 函数，而是直接使用系统头文件 signal.h 中的声明。那么，在头文件 signal.h 中，signal 函数是如何声明的呢？

首先，让我们从用户定义的信号处理函数开始考虑，这无疑是最容易解决的。该函数可以定义如下：

void sigfunc(int n)
{
    /* 特定信号处理部分*/

函数sigfunc的参数是一个代表特定信号的整数值，此处我们暂时忽略它。

上面假设的函数体定义了sigfunc函数，因而sigfunc函数的声明可以如下：

void sigfunc(int

现在假定我们希望声明一个指向sigfunc函数的指针变量，不妨命名为 sfp。因为 sfp 指向 sigfunc 函数，则 *sfp 就代表了 sigfunc 函数，因此 *sfp 可以被调用。又假定 sig 是一个整数，则 (*sfp)(sig) 的值为 void 类型，因此我们可以如下声明sfp：

void (*sfp)(int);

因为 signal 函数的返回值类型与 sfp 的返回类型一样，上式也就声明了 signal 函数，我们可以如下声明 signal 函数：

void (*signal(something))(int);

此处的 something 代表了 signal 函数的参数类型，我们还需要进一步了解如何声明它们。

上面声明可以这样理解：传递适当的参数以调用signal函数，对signal函数返回值（为函数指针类型）解除引用（dereference），然后传递一个整型参数调用解除引用后所得函数，最后返回值为void类型。因此，signal函数的返回值是一个指向返回值为void类型的函数的指针。

那么，signal函数的参数又是如何呢？signal函数接受两个参数：一个整型的信号编号，以及一个指向用户定义的信号处理函数的指针。我们此前已经定义了指向用户定义的信号处理函数的指针sfp：

void (*sfp)(int);

sfp 的类型可以通过将上面的声明中的 sfp 去掉而得到，即 void (*)(int) 。此外，signal 函数的返回值是一个指向调用前的用户定义信号处理函数的指针，这个指针的类型与 sfp 指针类型一致。因此，我们可以如下声明signal函数：

void (*signal(int, void(*)(int)))(int);

同样地，使用typedef可以简化上面的函数声明：

typedef void (*HANDLER)(int);
HANDLER signal(int, HANDLER);

上一篇：MD5

下一篇：《C陷阱与缺陷》：更新顺序文件

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

《C陷阱与缺陷》：如何理解(*(void(*)())0)()？

《C陷阱与缺陷》：如何理解(*(void(*)())0)()？

51CTO博客

《C陷阱与缺陷》：如何理解((void()())0)()？

《C陷阱与缺陷》：如何理解((void()())0)()？