6.1 Linux的内存管理概述

Linux是为多用户多任务设计的操作系统, 所以存储资源要被多个进程有效共享;且由于程序规模的不断膨胀,要求的内存空间比从前大得多。 Linux内存管理的设计充分利用了计算机系统所提供的虚拟存储技术,真正实现了虚拟存储器管理。

第二章介绍的Intel386的段机制和页机制是 Linux实现虚拟存储管理的一种硬件平台。实际上, Linux2.0以上的版本不仅仅可以运行在Intel系列个人计算机上,还可以运行在Apple系列、DEC Alpha系列、MIPS和Motorola 68k等系列上, 这些平台都支持虚拟存储器管理,我们之所以选择Intel386,是因为它具有代表性和普遍性。

Linux的内存管理主要体现在对虚拟内存的管理。我们可以把Linux虚拟内存管理功能概括为以下几点:

·大地址空间
·进程保护
·内存映射
·公平的物理内存分配
·共享虚拟内存

关于这些功能的实现,我们将会陆续介绍。

6.1.1 Linux虚拟内存的实现结构

我们先从整体结构上看一下Linux对虚拟内存的实现结构,如图6.2所示。



图6.2 Linux虚存的实现结构

从图中可看到实现虚拟内存的组成模块。 其实现的原代码大部分放在/mm目录下。

1. 内存映射模块(mmap)—负责把磁盘文件的逻辑地址映射到虚拟地址,以及把虚拟地址映射到物理地址。
2.交换模块(swap)—负责控制内存内容的换入和换出,它通过交换机制,使得在物理内存的页面(RAM页)中保留有效的页 ,即从主存中淘汰最近没被访问的页,保存近来访问过的页。
3.核心内存管理模块(core)—负责核心内存管理功能,即对页的分配、回收、释放及请页处理等,这些功能将被别的内核子系统(如文件系统)使用。
4. 结构特定的模块—负责给各种硬件平台提供通用接口,这个模块通过执行命令来改变硬件MMU的虚拟地址映射,并在发生页错误时,提供了公用的方法来通知别的内核子系统。这个模块是实现虚拟内存的物理基础。

6.1.2 内核空间和用户空间

从第二章我们知道,Linux简化了分段机制,使得虚拟地址与线性地址总是一致,因此,Linux的虚拟地址空间也为0~4G。Linux内核将这4G字节的空间分为两部分。将最高的1G字节(从虚拟地址0xC0000000到0xFFFFFFFF),供内核使用,称为“内核空间”。而将较低的3G字节(从虚拟地址0x00000000到0xBFFFFFFF),供各个进程使用,称为“用户空间)。因为每个进程可以通过系统调用进入内核,因此,Linux内核由系统内的所有进程共享。于是,从具体进程的角度来看,每个进程可以拥有4G字节的虚拟空间。图 6.3 给出了进程虚拟空间示意图。



图6.3 Linux 进程的虚拟空间

Linux使用两级保护机制:0级供内核使用,3级供用户程序使用。从图中可以看出,每个进程有各自的私有用户空间(0~3G),这个空间对系统中的其他进程是不可见的。最高的1GB字节虚拟内核空间则为所有进程以及内核所共享。

1.虚拟内核空间到物理空间的映射

内核空间中存放的是内核代码和数据,而进程的用户空间中存放的是用户程序的代码和数据。不管是内核空间还是用户空间,它们都处于虚拟空间中。读者会问,系统启动时,内核的代码和数据不是被装入到物理内存吗?它们为什么也处于虚拟内存中呢?这和编译程序有关,后面我们通过具体讨论就会明白这一点。

虽然内核空间占据了每个虚拟空间中的最高1GB字节,但映射到物理内存却总是从最低地址(0x00000000)开始。如图6.4所示,对内核空间来说,其地址映射是很简单的线性映射,0xC0000000就是物理地址与线性地址之间的位移量,在Linux代码中就叫做PAGE_OFFSET。




图6.4内核的虚拟地址空间到物理地址空间的映射

我们来看一下在include/asm/i386/page.h中对内核空间中地址映射的说明及定义:

/* 

 * This handles the memory map.. We could make this a config 

 * option, but too many people screw it up, and too few need 

 * it. 

 * 

 * A __PAGE_OFFSET of 0xC0000000 means that the kernel has 

 * a virtual address space of one gigabyte, which limits the 

 * amount of physical memory you can use to about 950MB. 

 * 

 * If you want more physical memory than this then see the CONFIG_HIGHMEM4G 

 * and CONFIG_HIGHMEM64G options in the kernel configuration. 

 */ 


 #define __PAGE_OFFSET (0xC0000000) 

 …… 

 #define PAGE_OFFSET ((unsigned long)__PAGE_OFFSET) 

 #define __pa(x) ((unsigned long)(x)-PAGE_OFFSET) 

 #define __va(x) ((void *)((unsigned long)(x)+PAGE_OFFSET))



源代码的注释中说明,如果你的物理内存大于950MB,那么在编译内核时就需要加CONFIG_HIGHMEM4G和CONFIG_HIGHMEM64G选项,这种情况我们暂不考虑。如果物理内存小于950MB,则对于内核空间而言,给定一个虚地址x,其物理地址为“x- PAGE_OFFSET”,给定一个物理地址x,其虚地址为“x+ PAGE_OFFSET”。

这里再次说明,宏__pa()仅仅把一个内核空间的虚地址映射到物理地址,而决不适用于用户空间,用户空间的地址映射要复杂得多。

2.内核映像

在下面的描述中,我们把内核的代码和数据就叫内核映像(kernel image)。当系统启动时,Linux内核映像被安装在物理地址0x00100000开始的地方,即1MB开始的区间(第1M留作它用)。然而,在正常运行时, 整个内核映像应该在虚拟内核空间中,因此,连接程序在连接内核映像时,在所有的符号地址上加一个偏移量PAGE_OFFSET,这样,内核映像在内核空间的起始地址就为0xC0100000。

例如,进程的页目录PGD(属于内核数据结构)就处于内核空间中。在进程切换时,要将寄存器CR3设置成指向新进程的页目录PGD,而该目录的起始地址在内核空间中是虚地址,但CR3所需要的是物理地址,这时候就要用__pa()进行地址转换。在mm_context.h中就有这么一行语句:

asm volatile(“movl %0,%%cr3”: :”r” (__pa(next->pgd));



这是一行嵌入式汇编代码,其含义是将下一个进程的页目录起始地址next_pgd,通过__pa()转换成物理地址,存放在某个寄存器中,然后用mov指令将其写入CR3寄存器中。经过这行语句的处理,CR3就指向新进程next的页目录表PGD了。

6.1.3 虚拟内存实现机制间的关系

Linux虚拟内存的实现需要各种机制的支持,因此,本章我们将对内存的初始化进行描述以后,围绕以下几种实现机制进行介绍:

·内存分配和回收机制
·地址映射机制
·缓存和刷新机制
·请页机制
·交换机制
·内存共享机制
这几种机制的关系如图6.5所示。



图6.5 虚存实现机制间

首先内存管理程序通过映射机制把用户程序的逻辑地址映射到物理地址,在用户程序运行时如果发现程序中要用的虚地址没有对应的物理内存时,就发出了请页要求①;如果有空闲的内存可供分配,就请求分配内存②(于是用到了内存的分配和回收),并把正在使用的物理页记录在页缓存中③(使用了缓存机制)。如果没有足够的内存可供分配,那么就调用交换机制,腾出一部分内存④⑤。另外在地址映射中要通过TLB(翻译后援存储器)来寻找物理页⑧;交换机制中也要用到交换缓存⑥,并且把物理页内容交换到交换文件中后也要修改页表来映射文件地址⑦。