1

对于同一个语句,有如下三种:高级语言、低级语言、机器语言的表示

  • C语言 
    a=b+1;
  • 汇编语言 
    mov -0xc(%ebp),%eax
    add $0x1,%eax
    mov %eax,-0x8(%ebp)
  • 机器语言 
    8b 45 f4
    83 c0 01
    89 45 f8

编译(Compile)由编译器(Compiler)来完成。汇编器(Assembler)来执行的。

C和汇编语言转换为机器语言都是由编译器来完成的。

2

体系(Architecture),另一种是指操作系统(Operate System),也可以是指两种的结合。不同的平台,他们所需要的执行机器语言的指令集是不同的。C的跨平台性是指,只需要编写一份不需要修改的C程序代码,就可以在不同体系、不同操作系统的计算机上运行。这都要靠编译器的功劳,编译器将C程序翻译为了适合当前计算机体系的机器语言。

下面说一下将C语言编译为机器语言的整个过程:

hello.c,这个代码文件,我们称之为源代码(Srouce Code)hello.out。这份新生成的代码文件称为目标代码(Object Code)可执行代码(Executable)

3

对于编译过程,里面还涉及到具体的一些可以说的细节步骤。

Linux下,使用gcc编译器:

预编译hello.c文件:

gcc -E -o hello.i hello.c

hello.i的文件,可以用编辑器(Vim)查看它的内容,这个文件就是经过预编译后的内容。预编译又称为预处理,是做些代码文本的替换工作。预编译可以处理#开头的指令,比如拷贝#include包含的文件代码,#define的宏定义的替换,条件编译等。

纯粹的进行编译:

gcc -S -o hello.s hello.i

把.i文件写为hello.c也行,就是跳过手动预编译,直接完成预编译和编译两个过程。这时会得到一个hello.s文件,打开看一下,里面是编译好的使用于当前体系结构的汇编代码。

把汇编代码进行汇编可执行:

gcc -c -o hello.o hello.s

把.s文件换成.c也行,就是自动完成预编译、编译和汇编三个过程。现在得到一个hello.o文件,这是一个二进制文件,但不是最后的可执行二进制文件,因为它还缺少最后一步连接处理。

最后对.o文件进行连接,我们这里就一个.o文件所以简单,经常是需要有多个.o文件需要连接。连接执行:

gcc -o hello hello.o

如果把最后的.o文件写成.c,那就和最开始我们用hello.c编译时示范的那样了。实际上那样是完成了预编译、编译、汇编和连接一连串的过程。

想了解更多gcc的只是可以到GNU的网站上去看看。

BTW,gdb是常用的调式软件。