背景


  • Read the fucking source code!
     --By 鲁迅
  • A picture is worth a thousand words.
    --By 高尔基

说明:


  1. Kernel版本:4.14
  2. ARM64处理器,Contex-A53,双核
  3. 使用工具:Source Insight 3.5, Visio

1. 概述

从这篇文章开始,来聊一聊中断子系统。中断是处理器用于异步处理外围设备请求的一种机制,可以说中断处理是操作系统管理外围设备的基石,此外系统调度、核间交互等都离不开中断,它的重要性不言而喻。

来一张概要的分层图:


Linux中断子系统(一)-中断控制器及驱动分析_字段



  • 硬件层:最下层为硬件连接层,对应的是具体的外设与SoC的物理连接,中断信号是从外设到中断控制器,由中断控制器统一管理,再路由到处理器上;
  • 硬件相关层:这个层包括两部分代码,一部分是架构相关的,比如ARM64处理器处理中断相关,另一部分是中断控制器的驱动代码;
  • 通用层:这部分也可以认为是框架层,是硬件无关层,这部分代码在所有硬件平台上是通用的;
  • 用户层:这部分也就是中断的使用者了,主要是各类设备驱动,通过中断相关接口来进行申请和注册,最终在外设触发中断时,进行相应的回调处理;

中断子系统系列文章,会包括硬件相关、中断框架层、上半部与下半部、Softirq、Workqueue等机制的介绍,本文会先介绍硬件相关的原理及驱动,前戏结束,直奔主题。

2. GIC硬件原理

  • ARM公司提供了一个通用的中断控制器GIC(Generic Interrupt Controller)
    ,GIC
    的版本包括V1 ~ V4
    ,由于本人使用的SoC中的中断控制器是V2
    版本,本文将围绕GIC-V2
    来展开介绍;

来一张功能版的框图:


Linux中断子系统(一)-中断控制器及驱动分析_中断处理_02



  • GIC-V2
    从功能上说,除了常用的中断使能、中断屏蔽、优先级管理等功能外,还支持安全扩展、虚拟化等;
  • GIC-V2
    从组成上说,主要分为Distributor
    和CPU Interface
    两个模块,Distributor
    主要负责中断源的管理,包括优先级的处理,屏蔽、抢占等,并将最高优先级的中断分发给CPU Interface
    ,CPU Interface
    主要用于连接处理器,与处理器进行交互;
  • Virtual Distributor
    和Virtual CPU Interface
    都与虚拟化相关,本文不深入分析;

再来一张细节图看看​​Distributor​​和​​CPU Interface​​的功能:

Linux中断子系统(一)-中断控制器及驱动分析_中断处理_03


  • GIC-V2
    支持三种类型的中断:

  1. SGI(software-generated interrupts)
    :软件产生的中断,主要用于核间交互,内核中的IPI:inter-processor interrupts
    就是基于SGI
    ,中断号ID0 - ID15
    用于SGI
  2. PPI(Private Peripheral Interrupt)
    :私有外设中断,每个CPU都有自己的私有中断,典型的应用有local timer
    ,中断号ID16 - ID31
    用于PPI
  3. SPI(Shared Peripheral Interrupt)
    :共享外设中断,中断产生后,可以分发到某一个CPU上,中断号ID32 - ID1019
    用于SPI
    ,ID1020 - ID1023
    保留用于特殊用途;

  • Distributor
    功能:

  1. 全局开关控制Distributor
    分发到CPU Interface
  2. 打开或关闭每个中断;
  3. 设置每个中断的优先级;
  4. 设置每个中断将路由的CPU列表;
  5. 设置每个外设中断的触发方式:电平触发、边缘触发;
  6. 设置每个中断的Group:Group0或Group1,其中Group0用于安全中断,支持FIQ和IRQ,Group1用于非安全中断,只支持IRQ;
  7. 将SGI
    中断分发到目标CPU上;
  8. 每个中断的状态可见;
  9. 提供软件机制来设置和清除外设中断的pending状态;

  • CPU Interface
    功能:

  1. 使能中断请求信号到CPU上;
  2. 中断的确认;
  3. 标识中断处理的完成;
  4. 为处理器设置中断优先级掩码;
  5. 设置处理器的中断抢占策略;
  6. 确定处理器的最高优先级pending中断;

中断处理的状态机如下图:


Linux中断子系统(一)-中断控制器及驱动分析_初始化_04



  • Inactive
    :无中断状态;
  • Pending
    :硬件或软件触发了中断,但尚未传递到目标CPU,在电平触发模式下,产生中断的同时保持pending
    状态;
  • Active
    :发生了中断并将其传递给目标CPU,并且目标CPU可以处理该中断;
  • Active and pending
    :发生了中断并将其传递给目标CPU,同时发生了相同的中断并且该中断正在等待处理;

GIC检测中断流程如下:


  1. GIC捕获中断信号,中断信号assert,标记为pending状态;
  2. Distributor
    确定好目标CPU后,将中断信号发送到目标CPU上,同时,对于每个CPU,Distributor
    会从pending信号中选择最高优先级中断发送至CPU Interface
  3. CPU Interface
    来决定是否将中断信号发送至目标CPU;
  4. CPU完成中断处理后,发送一个完成信号EOI(End of Interrupt)
    给GIC;

3. GIC驱动分析

3.1 设备信息添加

ARM平台的设备信息,都是通过​​Device Tree​​设备树来添加,设备树信息放置在​​arch/arm64/boot/dts/​​下

下图就是一个中断控制器的设备树信息:


Linux中断子系统(一)-中断控制器及驱动分析_初始化_05



  • compatible
    字段:用于与具体的驱动来进行匹配,比如图片中arm, gic-400
    ,可以根据这个名字去匹配对应的驱动程序;
  • interrupt-cells
    字段:用于指定编码一个中断源所需要的单元个数,这个值为3。比如在外设在设备树中添加中断信号时,通常能看到类似interrupts = <0 23 4>;
    的信息,第一个单元0,表示的是中断类型(1:PPI,0:SPI
    ),第二个单元23表示的是中断号,第三个单元4表示的是中断触发的类型;
  • reg
    字段:描述中断控制器的地址信息以及地址范围,比如图片中分别制定了GIC Distributor(GICD)
    和GIC CPU Interface(GICC)
    的地址信息;
  • interrupt-controller
    字段:表示该设备是一个中断控制器,外设可以连接在该中断控制器上;
  • 关于设备数的各个字段含义,详细可以参考Documentation/devicetree/bindings
    下的对应信息;

设备树的信息,是怎么添加到系统中的呢?​​Device Tree​​最终会编译成​​dtb​​文件,并通过Uboot传递给内核,在内核启动后会将​​dtb​​文件解析成​​device_node​​结构。关于设备树的相关知识,本文先不展开,后续再找机会补充。来一张图,先简要介绍下关键路径:

Linux中断子系统(一)-中断控制器及驱动分析_字段_06



  • 设备树的节点信息,最终会变成device_node
    结构,在内存中维持一个树状结构;
  • 设备与驱动,会根据compatible
    字段进行匹配;

3.2 驱动流程分析

GIC驱动的执行流程如下图所示:


Linux中断子系统(一)-中断控制器及驱动分析_初始化_07



  • 首先需要了解一下链接脚本vmlinux.lds
    ,脚本中定义了一个__irqchip_of_table
    段,该段用于存放中断控制器信息,用于最终来匹配设备;
  • 在GIC驱动程序中,使用IRQCHIP_DECLARE
    宏来声明结构信息,包括compatible
    字段和回调函数,该宏会将这个结构放置到__irqchip_of_table
    字段中;
  • 在内核启动初始化中断的函数中,of_irq_init
    函数会去查找设备节点信息,该函数的传入参数就是__irqchip_of_table
    段,由于IRQCHIP_DECLARE
    已经将信息填充好了,of_irq_init
    函数会根据arm,gic-400
    去查找对应的设备节点,并获取设备的信息。中断控制器也存在级联的情况,of_irq_init
    函数中也处理了这种情况;
  • or_irq_init
    函数中,最终会回调IRQCHIP_DECLARE
    声明的回调函数,也就是gic_of_init
    ,而这个函数就是GIC驱动的初始化入口函数了;
  • GIC的工作,本质上是由中断信号来驱动,因此驱动本身的工作就是完成各类信息的初始化,注册好相应的回调函数,以便能在信号到来之时去执行;
  • set_smp_process_call
    设置__smp_cross_call
    函数指向gic_raise_softirq
    ,本质上就是通过软件来触发GIC的SGI中断
    ,用于核间交互;
  • cpuhp_setup_state_nocalls
    函数,设置好CPU进行热插拔时GIC的回调函数,以便在CPU热插拔时做相应处理;
  • set_handle_irq
    函数的设置很关键,它将全局函数指针handle_arch_irq
    指向了gic_handle_irq
    ,而处理器在进入中断异常时,会跳转到handle_arch_irq
    执行,所以,可以认为它就是中断处理的入口函数了;
  • 驱动中完成了各类函数的注册,此外还完成了irq_chip
    , irq_domain
    等结构体的初始化,这些结构在下文会进一步分析;
  • 最后,完成GIC硬件模块的初始化设置,以及电源管理相关的注册等工作;

3.3 数据结构分析

先来张图:


Linux中断子系统(一)-中断控制器及驱动分析_字段_08



  • GIC驱动中,使用struct gic_chip_data
    结构体来描述GIC控制器的信息,整个驱动都是围绕着该结构体的初始化,驱动中将函数指针都初始化好,实际的工作是由中断信号触发,也就是在中断来临的时候去进行回调;
  • struct irq_chip
    结构,描述的是中断控制器的底层操作函数集,这些函数集最终完成对控制器硬件的操作;
  • struct irq_domain
    结构,用于硬件中断号和Linux IRQ中断号(virq,虚拟中断号)之间的映射;

还是上一下具体的数据结构代码吧,关键注释如下:


struct irq_chip {
struct device *parent_device; //指向父设备
const char *name; // /proc/interrupts中显示的名字
unsigned int (*irq_startup)(struct irq_data *data); //启动中断,如果设置成NULL,则默认为enable
void (*irq_shutdown)(struct irq_data *data); //关闭中断,如果设置成NULL,则默认为disable
void (*irq_enable)(struct irq_data *data); //中断使能,如果设置成NULL,则默认为chip->unmask
void (*irq_disable)(struct irq_data *data); //中断禁止

void (*irq_ack)(struct irq_data *data); //开始新的中断
void (*irq_mask)(struct irq_data *data); //中断源屏蔽
void (*irq_mask_ack)(struct irq_data *data); //应答并屏蔽中断
void (*irq_unmask)(struct irq_data *data); //解除中断屏蔽
void (*irq_eoi)(struct irq_data *data); //中断处理结束后调用

int (*irq_set_affinity)(struct irq_data *data, const struct cpumask *dest, bool force); //在SMP中设置CPU亲和力
int (*irq_retrigger)(struct irq_data *data); //重新发送中断到CPU
int (*irq_set_type)(struct irq_data *data, unsigned int flow_type); //设置中断触发类型
int (*irq_set_wake)(struct irq_data *data, unsigned int on); //使能/禁止电源管理中的唤醒功能

void (*irq_bus_lock)(struct irq_data *data); //慢速芯片总线上的锁
void (*irq_bus_sync_unlock)(struct irq_data *data); //同步释放慢速总线芯片的锁

void (*irq_cpu_online)(struct irq_data *data);
void (*irq_cpu_offline)(struct irq_data *data);

void (*irq_suspend)(struct irq_data *data);
void (*irq_resume)(struct irq_data *data);
void (*irq_pm_shutdown)(struct irq_data *data);

void (*irq_calc_mask)(struct irq_data *data);

void (*irq_print_chip)(struct irq_data *data, struct seq_file *p);
int (*irq_request_resources)(struct irq_data *data);
void (*irq_release_resources)(struct irq_data *data);

void (*irq_compose_msi_msg)(struct irq_data *data, struct msi_msg *msg);
void (*irq_write_msi_msg)(struct irq_data *data, struct msi_msg *msg);

int (*irq_get_irqchip_state)(struct irq_data *data, enum irqchip_irq_state which, bool *state);
int (*irq_set_irqchip_state)(struct irq_data *data, enum irqchip_irq_state which, bool state);

int (*irq_set_vcpu_affinity)(struct irq_data *data, void *vcpu_info);

void (*ipi_send_single)(struct irq_data *data, unsigned int cpu);
void (*ipi_send_mask)(struct irq_data *data, const struct cpumask *dest);

unsigned long flags;
};

struct irq_domain {
struct list_head link; //用于添加到全局链表irq_domain_list中
const char *name; //IRQ domain的名字
const struct irq_domain_ops *ops; //IRQ domain映射操作函数集
void *host_data; //在GIC驱动中,指向了irq_gic_data
unsigned int flags;
unsigned int mapcount; //映射中断的个数

/* Optional data */
struct fwnode_handle *fwnode;
enum irq_domain_bus_token bus_token;
struct irq_domain_chip_generic *gc;
#ifdef CONFIG_IRQ_DOMAIN_HIERARCHY
struct irq_domain *parent; //支持级联的话,指向父设备
#endif
#ifdef CONFIG_GENERIC_IRQ_DEBUGFS
struct dentry *debugfs_file;
#endif

/* reverse map data. The linear map gets appended to the irq_domain */
irq_hw_number_t hwirq_max; //IRQ domain支持中断数量的最大值
unsigned int revmap_direct_max_irq;
unsigned int revmap_size; //线性映射的大小
struct radix_tree_root revmap_tree; //Radix Tree映射的根节点
unsigned int linear_revmap[]; //线性映射用到的查找表
};

struct irq_domain_ops {
int (*match)(struct irq_domain *d, struct device_node *node,
enum irq_domain_bus_token bus_token); // 用于中断控制器设备与IRQ domain的匹配
int (*select)(struct irq_domain *d, struct irq_fwspec *fwspec,
enum irq_domain_bus_token bus_token);
int (*map)(struct irq_domain *d, unsigned int virq, irq_hw_number_t hw); //用于硬件中断号与Linux中断号的映射
void (*unmap)(struct irq_domain *d, unsigned int virq);
int (*xlate)(struct irq_domain *d, struct device_node *node,
const u32 *intspec, unsigned int intsize,
unsigned long *out_hwirq, unsigned int *out_type); //通过device_node,解析硬件中断号和触发方式

#ifdef CONFIG_IRQ_DOMAIN_HIERARCHY
/* extended V2 interfaces to support hierarchy irq_domains */
int (*alloc)(struct irq_domain *d, unsigned int virq,
unsigned int nr_irqs, void *arg);
void (*free)(struct irq_domain *d, unsigned int virq,
unsigned int nr_irqs);
void (*activate)(struct irq_domain *d, struct irq_data *irq_data);
void (*deactivate)(struct irq_domain *d, struct irq_data *irq_data);
int (*translate)(struct irq_domain *d, struct irq_fwspec *fwspec,
unsigned long *out_hwirq, unsigned int *out_type);
#endif
};

3.3.1 IRQ domain

IRQ domain用于将硬件的中断号,转换成Linux系统中的中断号(​​virtual irq, virq​​),来张图:

Linux中断子系统(一)-中断控制器及驱动分析_初始化_09



  • 每个中断控制器都对应一个IRQ Domain;
  • 中断控制器驱动通过irq_domain_add_*()
    接口来创建IRQ Domain;
  • IRQ Domain支持三种映射方式:linear map(线性映射),tree map(树映射),no map(不映射);


  1. linear map:维护固定大小的表,索引是硬件中断号,如果硬件中断最大数量固定,并且数值不大,可以选择线性映射;
  2. tree map:硬件中断号可能很大,可以选择树映射;
  3. no map:硬件中断号直接就是Linux的中断号;

三种映射的方式如下图:


Linux中断子系统(一)-中断控制器及驱动分析_初始化_10



  • 图中描述了三个中断控制器,对应到三种不同的映射方式;
  • 各个控制器的硬件中断号可以一样,最终在Linux内核中映射的中断号是唯一的;

4. Arch-speicific代码分析


  • 中断也是异常模式的一种,当外设触发中断时,处理器会切换到特定的异常模式进行处理,而这部分代码都是架构相关的;ARM64的代码位于arch/arm64/kernel/entry.S
  • ARM64处理器有四个异常级别Exception Level:0~3,EL0级对应用户态程序,EL1级对应操作系统内核态,EL2级对应Hypervisor,EL3级对应Secure Monitor;
  • 异常触发时,处理器进行切换,并且跳转到异常向量表开始执行,针对中断异常,最终会跳转到irq_handler
    中;

代码比较简单,如下:


/*
* Interrupt handling.
*/
.macro irq_handler
ldr_l x1, handle_arch_irq
mov x0, sp
irq_stack_entry
blr x1
irq_stack_exit
.endm

来张图:


Linux中断子系统(一)-中断控制器及驱动分析_初始化_11



  • 中断触发,处理器去异常向量表找到对应的入口,比如EL0的中断跳转到el0_irq
    处,EL1则跳转到el1_irq
    处;
  • 在GIC驱动中,会调用set_handle_irq
    接口来设置handle_arch_irq
    的函数指针,让它指向gic_handle_irq
    ,因此中断触发的时候会跳转到gic_handle_irq
    处执行;
  • gic_handle_irq
    函数处理时,分为两种情况,一种是外设触发的中断,硬件中断号在16 ~ 1020
    之间,一种是软件触发的中断,用于处理器之间的交互,硬件中断号在16以内;
  • 外设触发中断后,根据irq domain
    去查找对应的Linux IRQ中断号,进而得到中断描述符irq_desc
    ,最终也就能调用到外设的中断处理函数了;

GIC和Arch相关的介绍就此打住,下一篇文章会接着介绍通用的中断处理框架,敬请期待。