系统引导过程主要由以下几个步骤组成(以硬盘启动为例)

 1、开机;

  2、 BIOS加电自检(POST——Power On Self Test),包括检查RAM,keyboard,显示器,软硬磁盘等等。Intel系列的CPU首先进入的是实模式,并开始执行位于地址0xFFFF0处的代码,也就是ROM-BIOS起始位置的代码;

3、搜索启动的操作系统,根据BIOS设置,可能会依次访问每个软盘的第一个扇区、硬盘、CD-ROW等;一旦找到有效的启动设备,将第一个扇区(0头0道1扇区,也就是Boot Sector)的内容读入内存地址0x7c00处;

  4、检查(WORD)0000:7dfe是否等于0xaa55.若不等于则转去尝试其他介质;如果没有其他启动介质,则显示 “No ROM BASIC” ,然后死机;

  5、跳转到0000:7c00处执行MBR中的程序bootsect.S;

6、 MBR先将自己复制到0x90000处,然后将紧接其后的setup部分(第二扇区)拷贝到0x90200,将真正的内核代码拷贝到0x100000。以上这些拷贝动作都是以bootsect.S、setup.S以及vmlinux在磁盘上连续存放为前提的;

7、bootsect.S完成加载动作后,就直接跳转到0x90200,这里正是setup.S的程序入口。 setup.S的主要功能就是将系统参数(包括内存、磁盘等,由BIOS返回)拷贝到 0x90000-0x901FF内存中,这个地方正是bootsect.S存放的地方,这时它将被系统参数覆盖。以后这些参数将由保护模式下的代码来读取。

  8、 setup.S还将video.S中的代码包含进来,检测和设置显示器和显示模式。最后,setup.S将系统转换到保护模式,并跳转到0x100000(对于bzImage格式的大内核是 0x100000,对于zImage格式的是0x1000)的内核引导代码,Bootloader过程结束;

  9、Bootloader跳转到0x100000, 此处为"arch/I386/init/head.S"中的startup_32, startup_32的代码只需要设置一下全局变量,然后就跳转到start_kernel去了;start_kernel()是"init/main.c"中的asmlinkage函数,至此,启动过程转入体系结构无关的通用C代码中;

  10、start_kernel()中设置与体系结构相关的环境、页表结构初始化、Trap/IRQ初始化、核心进程调度器初始化、时间/定时器初始化、控制台初始化、核心Cache初始化、内存初始化、内部及通用等各种Cache初始化、信号量初始化、其他部分初始化(Init()及smp_init());

  11、启动Init()过程,创建第一个进程;Init()中,取得 run-level 信息, 执行 /etc/rc.d/rc.sysinit 脚本, 激活核心的外挂式模块 (/etc/modules.conf), 然后init 执行 run-level 的各个脚本, 接着执行 /etc/rc.d/rc.local脚本, 最后执行 /bin/login 程序 , 登入之后开始以 Shell 控管主机;

  12、启动完成。


---------------------------------------------------------------------------------------------------------

现在的内核文件结构已经不是这样的了.

------------------------------------------------------------------------------------------------------------------------------------

bootsect.S,系统引导程序,一般不超过512字节。

在PC系统结构中,线性地址0xA0000以上,即640K以上用于图形接口卡和BIOS自身,640K以下为系统的基本内存。如果配置更多的内存,则0x100000,即1MB处开始称为高内存。当BIOS引导一个系统时,总是把引导扇区读入到基本内存地址为0x7c00的地方,然后跳转到此执行引导扇区的代码。这段代码将自身搬运到0x90000处,并跳转到那继续执行,然后通过BIOS提供的读磁盘调用“int 0x13”从磁盘上读入setup和内核映像。其中setup的映像读入到0x90200处,然后跳转到setup的代码中。

从0x90000到0xA0000一共64K,bootsect仅占512字节,所以setup大小理论上可到63.5KB。

在Linux2.4版本以前,在最前面的512字节里保护了一个mini “boot loader”,只要拷贝启动代码运行就可从软盘启动?

setup进行映像的解压缩,从BIOS收集一些数据,在控制台显示一些信息。

基本内存中开头一部分空间是保留给BIOS自己用的,另一方面对于Linux内核的引导也需要保留一些运行空间,一共保存了64K。基本内存中用于内核映像的就是8*64K=512K,其中顶端留4K用于引导命令行及从BIOS获取需要传递给内核的数据。内核映像一般都经过压缩,压缩后的映像和引导扇区及辅助引导程序的映像拼接在一起,成为内核的引导映像。大小不超过508K的映像称为小映像zImage,早期版本放在0x10000位置处,否则称为大内核bzImage,放在0x100000位置处。

CPU在bootsect时处于16位实地址模式,然后在 setup的执行过程中转入32 位保护模式

Setup从BIOS中读取系统数据(内存大小、显卡模式、磁盘等参数),将数据保存在0x90000-0x901FF,覆盖了bootsect的内容。设置32位运行方式:加载中断描述表寄存器 IDTR 、全局描述表寄存器 GDTR CR0(机器状态字)的保护模式比特(PE)位,从而进入32 位保护模式运行

对于小内核映像放在0x10000处,Setup会把system从0x10000移到0x0000开始处。对于大内核映像,vmlinux中普通内核代码被编译成以PAGE_OFFSET+1MB为起始地址,在Head.S中初始化代码把虚拟地址减去PAGE_OFFSET就能得到以1MB为起始位置的物理地址,这也正是内核映像在物理内存中的存放位置。

Head.S中的startup_32主要用于开启页面单元

 

1 . Bootsect 启动过程:

假设用 LILO 启动,启动时用户可以选择启动哪个操作系统。 LILO 将 boot loader 分为两部分,一部分放到启动分区的第一个扇区;

1)        BIOS 将 MBR 或启动分区的第一个扇区的启动部分加载到地址 0x00007c00 处;

2)        该程序将自身移到 0x00096a00 ,建立实模式栈 ( 从 0x00098000 到 0x000969ff) ,将 LILO 的第二部分加载到 0x00096c00 处,然后跳转到此执行;

3)        然后第二部分程序从磁盘读取一个可启动的操作系统列表让用户选择,最后用户选择每个 OS 后, boot loader 可以拷贝不启动分区或者之间拷贝内核映像到 RAM 中去;

4)        加载 Linux 内核映像时, LILO boot loader 首先调用 BIOS 例程显示 ”Loading …” 信息;

5)        调用 BIOS 例程加载内核映像的初始化部分到 RAM 上,内核映像的前 512 字节放在 0x00090000 位置, setup() 函数代码放在 0x00090200 位置;

6)        接着调用 BIOS 例程装载内核映像的其余部分,映像可能放在低地址 0x00010000( 使用 make zImage 编译的小内核映像 ) 或者高地址 0x00100000 (使用 make bzImage 编译的大内核映像)。

7)        然后跳至刚刚 setup 部分。

 

2 . Setup.S 分析

setup()汇编函数被连接器放在内核映像文件中的0x200偏移处。Setup函数必须初始化计算机中的硬件设备并为内核程序的执行建立环境。

1)        在 ACPI 兼容的系统中,调用 BIOS 例程建立描述系统物理内存布局的表。在早期系统中,它调用 BIOS 例程返回系统可以的 RAM 大小;

2)        设置键盘的重复延迟和速率;

3)        初始化显卡;

4)        检测 IBM MCA 总线、 PS/2 鼠标设备、 APM BIOS 支持等;

5)        如果 BIOS 支持 Enhanced Disk Drive Services (EDD) ,将调用正确的 BIOS 例程建立描述系统可用硬盘的表;

6)        如果内核加载在低 RAM 地址 0x00010000 ,则把它移动到 0x00001000 处;如果映像加载在高内存 1M 位置,则不动;

7)        启动位于 8042 键盘控制器的 A20 pin 。

8)        建立一个中断描述表 IDT 和全局描述表 GDT 表;

9)        如果有的话,重启 FPU 单元;

10)    对可编程中断控制器进行重新编程,屏蔽所以中断,级连 PIC 的 IRQ2 不需要;

11)    设置 CR0 状态寄存器的 PE 位使 CPU 从实模式切换到保护模式, PG 位清 0 ,禁止分页功能;

12)    跳转到 startup_32()汇编函数, jmpi 0x100000, __BOOT_CS ,终于进入内核 Head.S ;

 

3 . Head.S 分析

有两个不同的startup_32()函数,一个在arch/i386/boot/compressed/head.S文件中,setup结束后,该函数被放在0x00001000或者0x00100000位置,该函数主要操作:

1)        首先初始化段寄存器和临时堆栈;

2)        清除 eflags 寄存器的所有位;

3)        将 _edata 和 _end 区间的所有内核未初始化区填充 0 ;

4)        调用 decompress_kernel( ) 函数解压内核映像。首先显示 "Uncompressing Linux..." 信息,解压完成后显示 "OK, booting the kernel." 。内核解压后,如果时低地址载入,则放在 0x00100000 位置;否则解压后的映像先放在压缩映像后的临时缓存里,最后解压后的映像被放置到物理位置 0x00100000 处;

5)        跳转到 0x00100000 物理内存处执行;

   

    解压后的映像开始于 arch/i386/kernel/head.S 文件中的 startup_32() 函数,因为通过物理地址的跳转执行该函数的,所以相同的函数名并没有什么问题。该函数未 Linux 第一个进程建立执行环境,操作如下:

1)          初始化 ds,es,fs,gs 段寄存器的最终值;

2)        用 0 填充内核 bss 段;

3)        初始化 swapper_pg_dir 数组和 pg0 包含的临时内核页表:

l          将 swapper_pg_dir ( 0x1000) 和 pg0(0x2000) 清空, swapper_pg_dir 作为整个系统的页目录;

l          将 pg0 作为第一个页表,将其地址赋到 swapper_pg_dir 的第一个 32 位字中。

l          同时将该页表项也赋给 swapper_pg_dir 的第 3072 个入口,表示虚拟地址 0xc0000000 也指向 pg0 。

l          将 pg0 这个页表填满指向内存前 4M 。

l          在 cr3 寄存器中存放 PGD 的地址,并设置 cr0 寄存器中的 PG 位,启用分页支持。

4)        建立进程 0idle 进程的内核模式的堆栈;

5)        再次清除 eflags 寄存器的所有位;

6)        调用 setup_idt() 用非空的中断处理函数填充 IDT 表;

7)        将从 BIOS 获取的系统参数传递到操作系统的第一个页面帧;

8)        识别处理器的模式;

9)        将 GDT 和 IDT 表的地址加载到 gdtr 和 idtr 寄存器中;

10) 跳转到 start_kernel 函数,这个函数是第一个 C 编制的函数,内核又有了一个新的开始。

 

4 . start_kernel() 分析:

1)        调度器初始化,调用 sched_init();

2)        调用 build_all_zonelists 函数初始化内存区;

3)        调用 page_alloc_init() 和 mem_init() 初始化伙伴系统分配器;

4)        调用 trap_init() 和 init_IRQ() 对中断控制表 IDT 进行最后的初始化;

5)        调用 softirq_init() 初始化 TASKLET_SOFTIRQ 和 HI_SOFTIRQ ;

6)        Time_init() 对系统日期和时间进行初始化;

7)        调用 kmem_cache_init() 初始化 slab 分配器;

8)        调用 calibrate_delay() 计算 CPU 时钟频率;

通过调用 kernel_thread() 启动进程 1init 进程的内核线程,然后该线程再创建其他的内核线程执行 /sbin/init 程序。