I. 什么是MMU,MMU的作用

MMU是Memory Management Unit的缩写. 针对各种CPU, MMU是个可选的配件. MMU负责的是虚拟地址 &O1663;&O1664; 物理地址的转换. 提供硬件机制的内存访问授权.

现 代的多用户多进程操作系统, 需要MMU, 才能达到每个用户进程都拥有自己的独立的地址空间的目标. 使用MMU, OS划分出一段地址区域, 在这块地址区域中, 每个进程看到的内容都不一定一样. 例如MICROSOFT WINDOWS操作系统, 地址4M-2G处划分为用户地址空间. 进程A在地址 0X400000映射了可执行文件. 进程B同样在地址 0X400000映射了可执行文件. 如果A进程读地址0X400000, 读到的是A的可执行文件映射到RAM的内容. 而进程B读取地址0X400000时则读到的是B的可执行文件映射到RAM的内容.

这就是MMU在当中进行地址转换所起的作用.

II. X86系列的MMU

INTEL出品的80386CPU或者更新的CPU中都集成有MMU. 可以提供32BIT共4G的地址空间.


III. ARM系列的MMU

    ARM出品的CPU, MMU作为一个协处理器存在. 根据不同的系列有不同搭配. 需要查询DATASHEET才可知道是否有MMU. 如果有的话, 一定是编号为15的协处理器. 可以提供32BIT共4G的地址空间.


IV X86启动MMU后的寻址模式

1.    X86 MMU提供的模式有4K/2M/4M的PAGE模式(根据不同的CPU, 提供不同的能力), 此处提供的是目前大部分OS使用的4K PAGE模式的描述. 并且不提供ACCESS CHECK的部分. (毕竟不是完整的CPU手册. &O1514;)

2.    涉及的寄存器

a)    GDT

b)    LDT

c)    CR0

d)    CR3

e)    SEGMENT REGISTER

3.    虚拟地址到物理地址的转换步骤(INTEL的2M/4M的PAGE或许会在将来文章中描述)

a)    SEGMENT REGISTER作为GDT或者LDT的INDEX, 取出对应的GDT/LDT ENTRY. 注 意: SEGMENT是无法取消的, 即使是FLAT模式下也是如此. 说FLAT模式下不使用SEGMENT REGISTER是错误的. 任意的RAM寻址指令中均有DEFAULT的SEGMENT假定. 除非使用SEGMENT OVERRIDE PREFIX来改变当前寻址指令的SEGMENT, 否则使用的就是DEFAULT SEGMENT.

i.    ENTRY格式

typedef struct

{

    UINT16    limit_0_15;

    UINT16    base_0_15;

    UINT8        base_16_23;


    UINT8        accessed    : 1;

    UINT8        readable    : 1;

    UINT8        conforming  : 1;

    UINT8        code_data   : 1;

    UINT8        app_system  : 1;

    UINT8        dpl         : 2;

    UINT8        present     : 1;


    UINT8        limit_16_19 : 4;

    UINT8        unused      : 1;

    UINT8        always_0    : 1;

    UINT8        seg_16_32   : 1;

    UINT8        granularity : 1;


    UINT8        base_24_31;

} CODE_SEG_DESCRIPTOR,*PCODE_SEG_DESCRIPTOR;


typedef struct

{

    UINT16    limit_0_15;

    UINT16    base_0_15;

    UINT8        base_16_23;


    UINT8        accessed    : 1;

    UINT8        writeable   : 1;

    UINT8        expanddown  : 1;

    UINT8        code_data   : 1;

    UINT8        app_system  : 1;

    UINT8        dpl         : 2;

    UINT8        present     : 1;


    UINT8        limit_16_19 : 4;

    UINT8        unused      : 1;

    UINT8        always_0    : 1;

    UINT8        seg_16_32   : 1;

    UINT8        granularity : 1;


    UINT8        base_24_31;

} DATA_SEG_DESCRIPTOR,*PDATA_SEG_DESCRIPTOR;


共 有4种ENTRY格式, 此处提供的是CODE SEGMENT和DATA SEGMENT的ENTRY格式. FLAT模式下的ENTRY在base_0_15, base_16_23处为0, 而limit_0_15, limit_16_19处为0xfffff.  granularity处为1. 表名SEGMENT地址空间是从0到0XFFFFFFFF的4G的地址空间.

b)    从SEGMENT处取出BASE ADDRESS 和LIMIT. 将要访问的ADDRESS首先进行ACCESS CHECK, 是否超出SEGMENT的限制.

c)    将要访问的ADDRESS+BASE ADDRESS, 形成需要32BIT访问的虚拟地址. 该地址被解释成如下格式:

typedef struct

{

    UINT32    offset        :12;

    UINT32    page_index    :10;

    UINT32    pdbr_index    :10;

} VA,*LPVA;

d)    pdbr_index作为CR3的INDEX, 获得到一个如下定义的数据结构

typedef struct

{

    UINT8    present        :1;

    UINT8    writable    :1;

    UINT8    supervisor    :1;

    UINT8    writethrough:1;

    UINT8    cachedisable:1;

    UINT8    accessed    :1;

    UINT8    reserved1    :1;

    UINT8    pagesize    :1;


    UINT8    ignoreed    :1;

    UINT8    avl            :3;

    UINT8    ptadr_12_15    :4;


    UINT16    ptadr_16_31;

}PDE,*LPPDE;

e)    从中取出PAGE TABLE的地址. 并且使用page_index作为INDEX, 得到如下数据结构

typedef struct

{

    UINT8    present        :1;

    UINT8    writable    :1;

    UINT8    supervisor    :1;

    UINT8    writethrough:1;

    UINT8    cachedisable:1;

    UINT8    accessed    :1;

    UINT8    dirty        :1;

    UINT8    pta            :1;


    UINT8    global        :1;

    UINT8    avl            :3;

    UINT8    ptadr_12_15    :4;


    UINT16    ptadr_16_31;

}PTE,*LPPTE;

f)    从PTE中获得PAGE的真正物理地址的BASE ADDRESS. 此BASE ADDRESS表名了物理地址的.高20位. 加上虚拟地址的offset就是物理地址所在了.


ARM启动MMU后的寻址模式

1.    ARM MMU提供的分页模式有1K/4K/64K 3种模式. 本文介绍的是目前OS通常使用的4K模式. 并且不提供ACCESS CHECK的部分. (毕竟不是完整的CPU手册. &O1514;)

2.    涉及的寄存器, 全部位于协处理器15. 

3.    ARM没有SEGMENT的寄存器, 是真正的FLAT模式的CPU. 给定一个ADDRESS. 该地址可以被理解为如下数据结构:

typedef struct

{

    UINT32    offset        :12;

    UINT32    page_index    :8;

    UINT32    pdbr_index    :12;

} VA,*LPVA;

4.    从MMU寄存器2中取出BIT14-31. pdbr_index就是这个表的索引. 每个入口为4BYTE大小. 结构为

typedef struct

{

    UINT32    type        :2;    //always set to 01b

    UINT32    writebackcacheable:1;

    UINT32    writethroughcacheable:1;

    UINT32    ignore    :1;    //set to 1b always

    UINT32    domain    :4;

    UINT32    reserved    :1;    //set 0

    UINT32    base_addr:22;

} PDE,*LPPDE;

5.    获得的PDE地址, 获得如下结构的ARRAY, 用page_index作为索引,取出内容.

typedef struct

{

    UINT32    type        :2;    //always set to 11b

    UINT32    ignore    :3;    //set to 100b always

    UINT32    domain    :4;

    UINT32    reserved    :3;    //set 0

    UINT32    base_addr:20;

} PTE,*LPPTE;

6.    从PTE中获得的基地址和上offset,组成了物理地址.

7.    PDE/PTE中其他的BIT, 用于访问控制. 这边讲述的是一切正常, 物理地址被正常组合出来的状况.


ARM/X86 MMU使用上的差异

1.    X86始终是有SEGMENT的概念存在. 而ARM则没有此概念(没有SEGMENT REGISTER.).

2.    ARM有个DOMAIN的概念. 用于访问授权. 这是X86所没有的概念. 当通用OS尝试同时适用于此2者的CPU上, 一般会抛弃DOMAIN的使用.