大家肯定都知道计算机程序设计语言通常分为机器语言、汇编语言和高级语言三类。高级语言需要通过翻译成机器语言才能执行,而翻译的方式分为两种,一种是编译型,另一种是解释型,因此我们基本上将高级语言分为两大类,一种是编译型语言,例如C,C++,Java,另一种是解释型语言,例如Python、Ruby、MATLAB 、JavaScript。
本文将介绍如何将高层的C/C++语言编写的程序转换成为处理器能够执行的二进制代码的过程,包括四个步骤:
预处理(Preprocessing)
编译(Compilation)
汇编(Assembly)
链接(Linking)
一般来说,对C、C++程序、先把源文件编译成中间代码文件。Linux下是 .o 文件即 Object File,在Windows下也就是 .obj 文件,这个动作叫做编译(compile)。然后再把大量的.O文件合成执行文件,这个动作叫作链接(link)
编译时,编译器需要的是语法的正确,函数与变量的声明的正确。对于后者,通常是让我们告诉编译器头文件的所在位置(头文件中放声明,而定义放在C/C++文件中),只要所有的语法正确,编译器就可以编译出中间目标文件。一般来说,每个源文件都应该对应于一个中间目标文件(.O文件或是OBJ文件)。
链接时,主要是链接函数和全局变量,所以,我们可以使用这些中间目标文件(.O文件或.OBJ文件)来链接我们的应用程序。链接器并不管函数所在的源文件,只管函数的中间目标文件。在大多数时候,由于源文件太多,编译生成的中间目标文件太多,而在链接时需要明显地指出中间目标文件名,这对于编译很不方便,所以,我们要给中间目标文件打个包,在Windows下这种包叫“库文件”(Library File),也就是 .lib 文件,在Linux下,是Archive File,也就是 .a 文件
总的来说就是,首先源文件-> .o文件,再由.o文件->可执行文件。在编译时,编译器只检测程序语法,和函数、变量是否被声明。如果函数未被声明,编译器会给出一个警告,但可以生成Object File。而在链接程序时,链接器会在所有的.o文件中找寻函数的实现,如果找不到,那到就会报链接错误码(Linker Error):下面我们看个例子
(一)、Linux 编译和链接程序
1、在北京大学北极星高性能计算平台解压如下文件:
[test_pkuhpc@login12 2019test]$ unzip /gpfs1/web-q/linux-shell/conf/multi_c_program_linux.zip
2、查看下解压后的文件:
[test_pkuhpc@login12 cankao_multi_c_program_linux]$ ls
add.c all main.c makefile test.h
3、查看文件内容
[test_pkuhpc@login12 cankao_multi_c_program_linux]$ cat main.c
#include "test.h"
int main(void)
{
int a =3;//初始化两个整数
int b = 5;
printf("%d + %d = %d \n", a, b, add(a, b));//这里调用函数
return 0;
}
[test_pkuhpc@login12 cankao_multi_c_program_linux]$ cat add.c
#include "test.h"
int add(int a, int b)
{
return a+b;//求和运算
}
4、编译主文件
[test_pkuhpc@login12 cankao_multi_c_program_linux]$ gcc -c main.c -o main.o
5、编译函数
[test_pkuhpc@login12 cankao_multi_c_program_linux]$ gcc -c add.c -o add.o
6、链接*.o文件
[test_pkuhpc@login12 cankao_multi_c_program_linux]$ gcc main.o add.o -o all
7、测试:
[test_pkuhpc@login12 cankao_multi_c_program_linux]$ ./all
3 + 5 = 8