虚拟内存
虚拟内存是一个抽象概念,它为每个进程提供了一个假象,即每个进程都在独占地使用主存。每个进程看到的内存都是一致的,称为虚拟地址空间。
既然是为每一个进程提供假象,那么言外之意就是每一个进程都有一个虚拟内存空间。你有一个,我有一个,她也有一个,然后我们需要把这些所有的内存空间都放置在主存上,也就是映射到主存上,这样才符合每个进程都在独占地使用主存的假象。
下图所示的是 Linux 进程的虚拟地址空间(其他 Unix 系统的设计也与此类似)。在 Linux 中,地址空间最上面的区域是保留给操作系统中的代码和数据的,这对所有进程来说都是一样。地址空间的底部区域存放用户进程定义的代码和数据。请注意,图中的地址是从下往上增大的。
这几句话什么意思啊,我给大家翻译一下:地址空间最上面的区域是保留给操作系统中的代码和数据的,这对所有进程来说都是一样,意思就是这有三个进程,你我他,大家的虚拟内存的最上面的区域都存储的内核代码数据,而且代码和数据都一样;
地址空间的底部区域存放用户进程定义的代码和数据:这里面就是谁的进程存储谁的内容了,我张三进程就存储张三的用户代码数据,我李四就存李四的。
每个进程看到的虚拟地址空间由大量准确定义的区构成,每个区都有专门的功能。在本书的后续章节你将学到更多有关这些区的知识,但是先简单了解每一个区是非常有益的。我们从最低的地址开始,逐步向上介绍。
- 程序代码和数据。对所有的进程来说,代码是从同一固定地址开始,紧接着的是和 C 全局变量相对应的数据位置。代码和数据区是直接按照可执行目标文件的内容初始化的,在示例中就是可执行文件 hello。
什么叫做代码个数据区是直接按照可执行目标文件的内容初始化的,意思就是说我们的虚拟内存中的代码和数据区放的就是可执行目标文件,我们又知道可执行目标文件就是二进制。 - 堆。代码和数据区后紧随着的是运行时堆。代码和数据区在进程一开始运行时就被指定了大小,与此不同,当调用像 malloc 和 free 这样的 C 标准库函数时,堆可以在运行时动态地扩展和收缩。
意思就是:代码和数据区的大小在一开始就被定下来了,你是不可以再变化的,但是堆他不一样,他可以动态的伸长和收缩。也就是说堆中存放的是函数中的代码和数据局,也就是我们想象一个画面,在一个进程的虚拟内存中,位于内存地址的最低端是代码和数据区上面便是我们的运行时堆了,在进程运行的过程中代码和数据区一直不变,而堆一会儿变长一会儿变短。 - 共享库。大约在地址空间的中间部分是一块用来存放像 C 标准库和数学库这样的共享库的代码和数据的区域。共享库的概念非常强大,也相当难懂。在第 7 章介绍动态链接时,将学习共享库是如何工作的。
解读:我们在写程序的时候要进场include一些c标准库或者一些其他的头文件,那么这时候这些我们要用到的标准库中的一些数据和代码的内容就被复制到了共享库中。 - 栈。位于用户虚拟地址空间顶部的是用户栈,编译器用它来实现函数调用。栈用来实现函数调用,也就是说每调用一个函数的时候,我们就在栈中存放这个函数的地址,和堆一样,用户栈在程序执行期间可以动态地扩展和收缩。特别地,每次我们调用一个函数时,栈就会增长;从一个函数返回时,栈就会收缩。关于栈最重要的概念就是,它存储的所有数据必须是已知(这里指可在编译期确定大小)的固定大小。如果我们不知道我们要存储的数据有多大,那么我们应该使用堆。在第 3 章中将学习编译器是如何使用栈的。
- 内核虚拟内存。地址空间顶部的区域是为内核保留的。不允许应用程序读写这个区域的内容或者直接调用内核代码定义的函数。相反,它们必须调用内核来执行这些操作。