马氏链模型(Markov Chain)

  • 对于有随机因素影响的动态系统,系统从这个时期到下个时期的状态按照一定的概率进行转移,并且下个时期的状态只取决于这个时期的状态和转移概率。
  • 无后效性:已知现在,将来与历史无关。
  • 具有无后效性,时间、状态均为离散的随机转移过程通常用马氏链模型描述。

实例1:健康与疾病

  • 本实例介绍马氏链的基本概念,以及两种主要类型——正则链和吸收链。

人的健康状态随时间的推移会发生转变,人寿保险公司要通过对状态转变的概率做出估计,才能确定出不同年龄、不同健康状况的人的保险金和理赔金数额,下面分两种情况进行讨论:

情况一:

  • 把人的健康状况分为健康和疾病两种,以一年为一个时段研究状态的转变。假定对某一年龄段的人,今年健康,明年转为疾病状态的概率为0.2;今年患病,明年转为健康的概率为0.7。
  • 如果一个人投保时处于健康状态,我们研究以后若干年他分别处于这两种状态的概率。
  • 用随机变量 马氏链模拟R语言 马氏链模型的适用性_动态规划 表示第 马氏链模拟R语言 马氏链模型的适用性_概率论_02 年的状态,马氏链模拟R语言 马氏链模型的适用性_算法_03 表示健康,马氏链模拟R语言 马氏链模型的适用性_动态规划_04 表示疾病,马氏链模拟R语言 马氏链模型的适用性_算法_05,用 马氏链模拟R语言 马氏链模型的适用性_动态规划_06 表示第 马氏链模拟R语言 马氏链模型的适用性_概率论_02 年处于状态 马氏链模拟R语言 马氏链模型的适用性_机器学习_08 的概率,马氏链模拟R语言 马氏链模型的适用性_机器学习_09,即 马氏链模拟R语言 马氏链模型的适用性_概率论_10
  • 马氏链模拟R语言 马氏链模型的适用性_算法_11 表示已知今年状态处于状态 马氏链模拟R语言 马氏链模型的适用性_机器学习_08,来年状态处于状态 马氏链模拟R语言 马氏链模型的适用性_动态规划_13 的概率,马氏链模拟R语言 马氏链模型的适用性_算法_11 称为状态转移概率
  • 显然,第 马氏链模拟R语言 马氏链模型的适用性_算法_15 年的状态 马氏链模拟R语言 马氏链模型的适用性_机器学习_16 只取决于第 马氏链模拟R语言 马氏链模型的适用性_概率论_02 年的状态 马氏链模拟R语言 马氏链模型的适用性_动态规划 和转移概率 马氏链模拟R语言 马氏链模型的适用性_算法_11,而与以前的状态 马氏链模拟R语言 马氏链模型的适用性_机器学习_20 无关,即状态转移具有无后效性
  • 马氏链模拟R语言 马氏链模型的适用性_算法_15 年的状态概率可由全概率公式得到:
    马氏链模拟R语言 马氏链模型的适用性_机器学习_22
  • 由前 马氏链模拟R语言 马氏链模型的适用性_动态规划_23,投保人开始时处于健康状态,即 马氏链模拟R语言 马氏链模型的适用性_动态规划_24 立即可以算出以后各年他处于两种状态的概率 马氏链模拟R语言 马氏链模型的适用性_马氏链模拟R语言_25 如下表:
  • 通过计算可以发现,无论初始状态概率是否相同,对于给定的状态转移概率,马氏链模拟R语言 马氏链模型的适用性_机器学习_26 时,状态概率 马氏链模拟R语言 马氏链模型的适用性_算法_27,这是一种主要的马氏链类型的重要性质。

情况二:

  • 把人的死亡作为第3种状态,用 马氏链模拟R语言 马氏链模型的适用性_算法_28
  • 马氏链模拟R语言 马氏链模型的适用性_动态规划_06 表示第 马氏链模拟R语言 马氏链模型的适用性_概率论_02 年处于状态 马氏链模拟R语言 马氏链模型的适用性_机器学习_08 的概率,马氏链模拟R语言 马氏链模型的适用性_概率论_32,用 马氏链模拟R语言 马氏链模型的适用性_算法_11 表示状态转移概率。特别注意,马氏链模拟R语言 马氏链模型的适用性_动态规划_34
  • 马氏链模拟R语言 马氏链模型的适用性_算法_15 年的状态概率可由全概率公式得到:
    马氏链模拟R语言 马氏链模型的适用性_算法_36
  • 算得的结果如下表所示:
  • 表中的最后一列时根据计算数值的趋势猜测的,可以看到,不论初始状态如何,最终都要转到状态3.

马氏链的基本概念

马氏链及其基本方程
  • 按照系统的发展,时间离散化为 马氏链模拟R语言 马氏链模型的适用性_算法_37,对每个 马氏链模拟R语言 马氏链模型的适用性_概率论_02 ,系统的状态用随机变量 马氏链模拟R语言 马氏链模型的适用性_动态规划 表示,设 马氏链模拟R语言 马氏链模型的适用性_动态规划 可取 马氏链模拟R语言 马氏链模型的适用性_机器学习_41 个离散值 马氏链模拟R语言 马氏链模型的适用性_机器学习_42,且记 马氏链模拟R语言 马氏链模型的适用性_概率论_10,即状态概率。
  • 如果马氏链模拟R语言 马氏链模型的适用性_机器学习_16 的取值只取决于 马氏链模拟R语言 马氏链模型的适用性_动态规划 的取值及转移概率,而与 马氏链模拟R语言 马氏链模型的适用性_机器学习_20 的取值无关,那么这种离散状态按照离散时间的随机转移过程称为马氏链
  • 由状态转移的无后效性和全概率公式可以写出马氏链的基本方程为:
    马氏链模拟R语言 马氏链模型的适用性_概率论_47
    并且满足:
    马氏链模拟R语言 马氏链模型的适用性_概率论_48
    引入状态概率向量(行向量)和转移概率矩阵(简称转移矩阵):
    马氏链模拟R语言 马氏链模型的适用性_算法_49
    则基本方程可以表示为:
    马氏链模拟R语言 马氏链模型的适用性_动态规划_50
    还可以得到:
    马氏链模拟R语言 马氏链模型的适用性_动态规划_51
    转移矩阵 马氏链模拟R语言 马氏链模型的适用性_动态规划_52 是非负阵,马氏链模拟R语言 马氏链模型的适用性_动态规划_52 的行和为1,称为 随机矩阵
  • 马氏链模型最基本的问题是构造状态 马氏链模拟R语言 马氏链模型的适用性_动态规划 及写出转移矩阵 马氏链模拟R语言 马氏链模型的适用性_动态规划_52,这里的转移矩阵与时段 马氏链模拟R语言 马氏链模型的适用性_概率论_02
马氏链的两个重要类型
正则链

这类马氏链的特点是,从任意状态出发经过有限次转移都能达到另外的任意状态。

  • 定义 一个有 马氏链模拟R语言 马氏链模型的适用性_机器学习_41 个状态的马氏链如果存在正整数 马氏链模拟R语言 马氏链模型的适用性_动态规划_58 ,使从任意状态 马氏链模拟R语言 马氏链模型的适用性_机器学习_08马氏链模拟R语言 马氏链模型的适用性_动态规划_58 次转移都以大于零的概率到达状态 马氏链模拟R语言 马氏链模型的适用性_马氏链模拟R语言_61,则称为正则链。
  • 用下面的定理可以检验一个马氏链是否是正则链:
    定理1 若马氏链的转移矩阵是 马氏链模拟R语言 马氏链模型的适用性_动态规划_52,则它是正则链的充要条件是,存在正整数 马氏链模拟R语言 马氏链模型的适用性_动态规划_58,使马氏链模拟R语言 马氏链模型的适用性_马氏链模拟R语言_64
    定理2 正则链存在唯一的极限状态概率 马氏链模拟R语言 马氏链模型的适用性_马氏链模拟R语言_65,又称稳态概率
    求解稳态概率 马氏链模拟R语言 马氏链模型的适用性_概率论_66 线性方程租:
    马氏链模拟R语言 马氏链模型的适用性_动态规划_67
    从状态 马氏链模拟R语言 马氏链模型的适用性_机器学习_08 出发,第一次到达状态 马氏链模拟R语言 马氏链模型的适用性_动态规划_13 的概率称为 马氏链模拟R语言 马氏链模型的适用性_机器学习_08马氏链模拟R语言 马氏链模型的适用性_动态规划_13首达概率,记作 马氏链模拟R语言 马氏链模型的适用性_动态规划_72,于是由状态 马氏链模拟R语言 马氏链模型的适用性_机器学习_08 到达第一次状态 马氏链模拟R语言 马氏链模型的适用性_动态规划_13 的平均转移次数为
    马氏链模拟R语言 马氏链模型的适用性_算法_75
吸收链
  • 定义 转移概率 马氏链模拟R语言 马氏链模型的适用性_算法_76 的状态 马氏链模拟R语言 马氏链模型的适用性_机器学习_08 称为吸收状态。如果马氏链至少包含一个吸收状态,并且从每一个非吸收状态出发,能以正的概率经有限次转移到达某个吸收状态,那么这个马氏链称为吸收链
  • 吸收链的转移矩阵可以写成简单的标准形式。若有 马氏链模拟R语言 马氏链模型的适用性_算法_78 个吸收状态, 马氏链模拟R语言 马氏链模型的适用性_机器学习_79 个非吸收状态,则转移矩阵 马氏链模拟R语言 马氏链模型的适用性_动态规划_52 可表为
    马氏链模拟R语言 马氏链模型的适用性_机器学习_81