Linux内核子系统
Linux内核子系统的结构在前面的博客中提到过:
本次文章介绍其中的两个主要部分:内存管理子系统 和 进程管理子系统。
Linux内存管理子系统
内存管理子系统模型图:
内存管理子系统的职能:
1、虚拟内存地址与物理内存地址之间的映射
2、物理内存的分配
地址映射管理 模型图:
若系统为32位系统,则对应的虚拟内存的大小为4G
地址映射管理包括两部分:
1、虚拟内存空间分布
2、虚拟地址转化为物理地址
虚拟内存的空间分布:
(地址:0G-3G)用户空间,运行应用程序
(地址:3G-4G)内核空间
内核空间包括:
1、3G – 3G+896MB 直接映射区
2、vmalloc区
3、永久映射区
4、固定映射区
虚拟地址转化为物理地址
上面讲到的用户空间的四个部分在映射到物理地址时有一定的区别:
1、直接映射区:物理内存中896M以下的位置称为低端内存,以上的区域称为高端内存,在直接映射区中,若虚拟地址为:3G+128,则物理地址就是128。直接映射区虚拟地址=3G+物理地址。
2、vmalloc区:即可访问低端物理地址,也可访问高端地址,没有线性的映射特性。
3、永久映射区:固定用来访问高端物理内存区域。
4、固定映射区:与特殊的寄存器建立映射关系。
物理内存的分配
Linux使用虚拟内存,因此程序中分配的都是虚拟地址,只有访问虚拟地址时,才会为其分配物理内存。
当获取到虚拟地址时,并不会为其分配物理内存。
当调用malloc函数时,只是分配了一个虚拟地址,当向其中写入数据时才会分配物理内存。
当使用 kmalloc 函数时,不仅为其分配虚拟地址,同时还会为其分配物理内存地址。
Linux进程管理子系统
进程与程序:
程序:
存放在磁盘上的一系列代码和数据的可执行映像,是一个静止的实体。
进程:
是一个执行中的程序,它是动态的实体。
进程四要素:
1、有一段程序供其执行。这段程序不一定是某个进程所专有,可以与其他进程共用。
2、有进程专用的内核空间堆栈。
3、在内核中有一个task_struct数据结构,即通常所说的“进程控制块”。有了这个数据结构,进程才能成为内核调度的一个基本单位接受内核的调度。
4、有独立的用户空间。
Linux进程状态:(此处比一般的三种状态更详细)
1、TASK_RUNNING
进程正在被CPU执行,或者已经准备就绪,随时可以执行。当一个进程刚被创建时,就处于TASK_RUNNING状态。
2、TASK_INTERRUPTIBLE
处于等待中的进程,待等待条件为真时被唤醒,也可以被信号或者中断唤醒。
3、TASK_UNINTERRUPTIBLE
处于等待中的进程,待资源有效时唤醒,但不可以由其它进程通过信号(signal)或中断唤醒。
4、TASK_KILLABLE
Linux2.6.25新引入的进程睡眠状态,原理类似于TASK_UNINTERRUPTIBLE,但是可以被致命信号(SIGKILL) 唤醒。
5、TASK_TRACED
正处于被调试状态的进程。
6、TASK_DEAD
进程退出时(调用do_exit),所处的状态。
Linux进程描述:
在Linux内核代码中,线程、进程都使用结构 task_struct (sched.h) 来表示,它包含了大量描述进程/线程的信息,其中比较重要的有:
pid_t pid; //进程号
long state; //进程状态
int prio; //进程优先级
什么是进程调度
从就绪的进程中选出最适合的一个来执行。
进程调度涉及到的内容:
1、调度策略
2、调度时机
3、调度步骤
调度策略:
SCHED_ NORMAL(SCHED_OTHER):普通的分时进程。
SCHED_FIFO:先入先出的实时进程。
SCHED_RR:时间片轮转的实时进程。
SCHED_BATCH:批处理进程。
SCHED_IDLE:只在系统空闲时才能够被调度执行的进程。
调度时机:
即schedule()函数什么时候被调用。
主动式调度:
在内核中直接调用schedule()。当进程需要等待资源等而暂时停止运行时,会把自己的状态置于挂起(睡眠),并主动请求调度,让出CPU。
范例:
1、current->state = TASK_INTERRUPTIBLE;
2、schedule();
被动式调度:
被动式调度又名:抢占式调度。分为:用户态抢占(Linux2.4、Linux2.6)和内核态抢占(Linux2.6)。
用户态抢占:
用户抢占发生在:
1、从系统调用返回用户空间。
2、从中断处理程序返回用户空间。
内核即将返回用户空间的时候,如果need_resched标志被设置,会导致schedule()被调用,即发生用户抢占。
- 当某个进程耗尽它的时间片时,会设置need_resched标志。
- 当一个优先级更高的进程进入可执行状态的时候,也会设置need_resched标志。
用户态抢占缺陷:
进程/线程一旦运行到内核态,就可以一直执行,直到它主动放弃或时间片耗尽为止。这样会导致一些非常紧急的进程或线程将长时间得不到运行,降低整个系统的实时性。
改进方式:
允许系统在内核态也支持抢占,更高优先级的进程/线程可以抢占正在内核态运行的低优先级进程/线程。
内核态抢占:
内核抢占可能发生在:
1、中断处理程序完成,返回内核空间之前。
2、当内核代码再一次具有可抢占性的时候,如解锁及使能软中断等。
在支持内核抢占的系统中,某些特例下是不允许抢占的:
1、内核正在运行中断处理。
2、内核正在进行中断上下文的Bottom Half(中断的底半部)处理。硬件中断返回前会执行软中断,此时仍然处于中断上下文中。
3、进程正持有spinlock自旋锁、writelock/readlock读写锁等,当持有这些锁时,不应该被抢占,否则由于抢占将可能导致其他进程长期得不到锁,而让系统处于死锁状态。
4、内核正在执行调度程序Scheduler。抢占的原因就是为了进行新的调度,没有理由将调度程序抢占掉再运行调度程序。
抢占计数:
为保证Linux内核在以上情况下不会被抢占,抢占式内核使用了一个变量preempt_ count,称为内核抢占计数。这一变量被设置在进程的thread_ info结构中。每当内核要进入以上几种状态时,变量preempt_ count就加1,指示内核不允许抢占。每当内核从以上几种状态退出时,变量preempt_count就减1,同时进行可抢占的判断与调度。
调度步骤
Schedule函数工作流程如下:
1、清理当前运行中的进程;
2、选择下一个要运行的进程;
3、设置新进程的运行环境;
4、进程上下文切换 。