有一次,一个程序员与我交谈一个问题。他当时正在编写一个独立运行于某种微处理器上的C程序。当计算机启动时,硬件将调用首地址为0位置的子例程。

为了模拟开机启动时的情形,我们必须设计出一个C语句,以显式调用该子例程。经过一段时间的思考,我们最后得到的语句如下:

(* ( void(*)() ) 0) ();

像这样的表达式恐怕会令每个C程序员的内心都“不寒而栗”。然而,他们大可不必对此望而生畏,因为构造这类表达式其实只有一条简单的规则:按照使用的方式来声明。

任何C变量的声明都由两部分组成:类型以及一组类似表达式的声明符(declarator)。

声明符从表面上看与表达式有些类似,对它求值应该返回一个声明中给定类型的结果。最简单的声明符就是单个变量,如:

float

这个声明的含义是:当对其求值时,表达式 f 和 g 的类型为浮点数类型(float)。

因为声明符与表达式的相似,所以我们也可以在声明符中任意使用括号:

float

这个声明的含义是:当对其求值时,((f)) 的类型为浮点类型,由此可以推知,f也是浮点类型。

同样的逻辑也适用于函数和指针类型的声明,例如:

float ff();

这个声明的含义是:表达式 ff() 求值结果是一个浮点数,也就是说,ff是一个返回值为浮点类型的函数。类似地,

float

这个声明的含义是 *pf 是一个浮点数,也就是说,pf 是一个指向浮点数的指针。

以上这些形式在声明中还可以组合起来,就像在表达式中进行组合一样。因此,

*g(), (*h)();

表示 *g() 与 (*h)() 是浮点表达式。因为 () 结合优先级高于*,*g() 也就是 *(g()):g 是一个函数,该函数的返回值类型为指向浮点数的指针。同理,可以得出 h 是一个函数指针,h 所指向函数的返回值为浮点类型。

一旦我们知道了如何声明一个给定类型的变量,那么该类型的类型转换符就很容易得到了:只需要把声明中的变量名和声明末尾的分号去掉,再将剩余的部分用一个括号整个“封装”起来即可。例如,因为下面的声明:

float

表示 h 是一个指向返回值为浮点类型的函数的指针,因此,

(float (*)())

表示一个“指向返回值为浮点类型的函数的指针”的类型转换符。

拥有了这些预备知识,我们现在可以分两步来分析表达式 (*(void(*)())0)() 。

第一步,假定变量 fp 是一个函数指针,那么如何调用 fp 所指向的函数呢?

调用方法如下:

(*fp)();

因为 fp 是一个函数指针,那么 *fp 就是该指针所指向的函数,所以 (*fp)() 就是调用该函数的方式。ANSI C标准允许程序员将上式简写为 fp(),但是一定要记住这种写法只是一种简写形式

在表达式 (*fp)() 中,*fp 两侧的括号非常重要,因为函数运算符 () 的优先级高于单目运算符 *。如果 *fp 两侧没有括号,那么 *fp() 实际上与 *( fp() ) 的含义完全一致,ANSI C把它作为 *( (*fp)() ) 的简写形式。

现在,剩下的问题就只是找到一个恰当的表达式来替换 fp。我们将在分析的第二步来解决这个问题。如果C编译器能够理解我们大脑中对于类型的认识,那么我们可以这样写:

(*0)();

上式并不能生效,因为运算符 * 必须要一个指针来做操作数。而且,这个指针还应该是一个函数指针,这样经运算符 * 作用后的结果才能作为函数被调用。因此,在上式中必须对 0 作类型转换,转换后的类型可以大致描述为:“指向返回值为void类型的函数的指针”。

如果 fp 是一个指向返回值为 void 类型的函数的指针,那么 (*fp)() 的值为 void,fp 的声明如下:

void

因此,我们可以用下式来完成调用存储位置为 0 的子例程:

void (*fp)();
(*fp)();

译注:此处作者假设 fp 默认初始化为 0,这种写法不宜提倡。这种写法的代价是多声明了一个“哑”变量。

但是,我们一旦知道如何声明一个变量,也就自然知道如何对一个常数进行类型转换,将其转型为该变量的类型:只需要在变量声明中将变量名去掉即可。因此,将常数 0 转型为“指向返回值为 void 的函数的指针”类型,可以这样写:

(void (*)())0

因此,我们可以用 (void (*)())0 来替换 fp,从而得到:

(*(void (*)())0)();

末尾的分号使得表达式成为一个语句。

在我当初解决这个问题的时候,C 语言中还没有 typedef 声明。尽管不用 typedef 来解决这个问题对剖析本例的细节而言是一个很好的方式,但无疑使用 typedef 能够使表述更加清晰

typedef void (*funcptr)();
(*(funcptr)0)();

这个棘手的例子并不是孤立的,还有一些 C 程序员经常遇到的问题,实际上和这个例子是同一个类型的。例如,考虑 signal 库函数,在包括该函数的 C 编译器实现中,signal 函数接受两个参数:一个是代表需要“被捕获”的特定 signal 的整数值;另一个是指向用户提供的函数的指针,该函数用于处理“捕获到”的特定signal,返回值类型为 void。

一般情况下,程序员并不主动声明 signal 函数,而是直接使用系统头文件 signal.h 中的声明。那么,在头文件 signal.h 中,signal 函数是如何声明的呢?

首先,让我们从用户定义的信号处理函数开始考虑,这无疑是最容易解决的。该函数可以定义如下:

void sigfunc(int n)
{
/* 特定信号处理部分*/

函数sigfunc的参数是一个代表特定信号的整数值,此处我们暂时忽略它。

上面假设的函数体定义了sigfunc函数,因而sigfunc函数的声明可以如下:

void sigfunc(int

现在假定我们希望声明一个指向sigfunc函数的指针变量,不妨命名为 sfp。因为 sfp 指向 sigfunc 函数,则 *sfp 就代表了 sigfunc 函数,因此 *sfp 可以被调用。又假定 sig 是一个整数,则 (*sfp)(sig) 的值为 void 类型,因此我们可以如下声明sfp:

void (*sfp)(int);

因为 signal 函数的返回值类型与 sfp 的返回类型一样,上式也就声明了 signal 函数,我们可以如下声明 signal 函数:

void (*signal(something))(int);

此处的 something 代表了 signal 函数的参数类型,我们还需要进一步了解如何声明它们。

上面声明可以这样理解:传递适当的参数以调用signal函数,对signal函数返回值(为函数指针类型)解除引用(dereference),然后传递一个整型参数调用解除引用后所得函数,最后返回值为void类型。因此,signal函数的返回值是一个指向返回值为void类型的函数的指针。

那么,signal函数的参数又是如何呢?signal函数接受两个参数:一个整型的信号编号,以及一个指向用户定义的信号处理函数的指针。我们此前已经定义了指向用户定义的信号处理函数的指针sfp:

void (*sfp)(int);

sfp 的类型可以通过将上面的声明中的 sfp 去掉而得到,即 void (*)(int) 。此外,signal 函数的返回值是一个指向调用前的用户定义信号处理函数的指针,这个指针的类型与 sfp 指针类型一致。因此,我们可以如下声明signal函数:

void (*signal(int, void(*)(int)))(int);

同样地,使用typedef可以简化上面的函数声明:

typedef void (*HANDLER)(int);
HANDLER signal(int, HANDLER);