马氏链模拟R语言马氏链模型的适用性

转载

mob6454cc6f8e48 2023-11-03 10:25:53

文章标签 马氏链模拟R语言概率论机器学习算法动态规划 文章分类 R语言后端开发

马氏链模型（Markov Chain）

对于有随机因素影响的动态系统，系统从这个时期到下个时期的状态按照一定的概率进行转移，并且下个时期的状态只取决于这个时期的状态和转移概率。
无后效性：已知现在，将来与历史无关。
具有无后效性，时间、状态均为离散的随机转移过程通常用马氏链模型描述。

实例1：健康与疾病

本实例介绍马氏链的基本概念，以及两种主要类型——正则链和吸收链。

人的健康状态随时间的推移会发生转变，人寿保险公司要通过对状态转变的概率做出估计，才能确定出不同年龄、不同健康状况的人的保险金和理赔金数额，下面分两种情况进行讨论：

情况一：

把人的健康状况分为健康和疾病两种，以一年为一个时段研究状态的转变。假定对某一年龄段的人，今年健康，明年转为疾病状态的概率为0.2；今年患病，明年转为健康的概率为0.7。
如果一个人投保时处于健康状态，我们研究以后若干年他分别处于这两种状态的概率。
用随机变量 $马氏链模拟R语言马氏链模型的适用性_动态规划$ 表示第 $马氏链模拟R语言马氏链模型的适用性_概率论_02$ 年的状态， $马氏链模拟R语言马氏链模型的适用性_算法_03$ 表示健康， $马氏链模拟R语言马氏链模型的适用性_动态规划_04$ 表示疾病， $马氏链模拟R语言马氏链模型的适用性_算法_05$ ，用 $马氏链模拟R语言马氏链模型的适用性_动态规划_06$ 表示第 $马氏链模拟R语言马氏链模型的适用性_概率论_02$ 年处于状态 $马氏链模拟R语言马氏链模型的适用性_机器学习_08$ 的概率， $马氏链模拟R语言马氏链模型的适用性_机器学习_09$ ，即 $马氏链模拟R语言马氏链模型的适用性_概率论_10$ 。
用 $马氏链模拟R语言马氏链模型的适用性_算法_11$ 表示已知今年状态处于状态 $马氏链模拟R语言马氏链模型的适用性_机器学习_08$ ，来年状态处于状态 $马氏链模拟R语言马氏链模型的适用性_动态规划_13$ 的概率， $马氏链模拟R语言马氏链模型的适用性_算法_11$ 称为状态转移概率。
显然，第 $马氏链模拟R语言马氏链模型的适用性_算法_15$ 年的状态 $马氏链模拟R语言马氏链模型的适用性_机器学习_16$ 只取决于第 $马氏链模拟R语言马氏链模型的适用性_概率论_02$ 年的状态 $马氏链模拟R语言马氏链模型的适用性_动态规划$ 和转移概率 $马氏链模拟R语言马氏链模型的适用性_算法_11$ ，而与以前的状态 $马氏链模拟R语言马氏链模型的适用性_机器学习_20$ 无关，即状态转移具有无后效性。
第 $马氏链模拟R语言马氏链模型的适用性_算法_15$ 年的状态概率可由全概率公式得到：
$马氏链模拟R语言马氏链模型的适用性_机器学习_22$
由前 $马氏链模拟R语言马氏链模型的适用性_动态规划_23$ ，投保人开始时处于健康状态，即 $马氏链模拟R语言马氏链模型的适用性_动态规划_24$ 立即可以算出以后各年他处于两种状态的概率 $马氏链模拟R语言马氏链模型的适用性_马氏链模拟R语言_25$ 如下表：
通过计算可以发现，无论初始状态概率是否相同，对于给定的状态转移概率， $马氏链模拟R语言马氏链模型的适用性_机器学习_26$ 时，状态概率 $马氏链模拟R语言马氏链模型的适用性_算法_27$ ，这是一种主要的马氏链类型的重要性质。

情况二：

把人的死亡作为第3种状态，用 $马氏链模拟R语言马氏链模型的适用性_算法_28$
用 $马氏链模拟R语言马氏链模型的适用性_动态规划_06$ 表示第 $马氏链模拟R语言马氏链模型的适用性_概率论_02$ 年处于状态 $马氏链模拟R语言马氏链模型的适用性_机器学习_08$ 的概率， $马氏链模拟R语言马氏链模型的适用性_概率论_32$ ，用 $马氏链模拟R语言马氏链模型的适用性_算法_11$ 表示状态转移概率。特别注意， $马氏链模拟R语言马氏链模型的适用性_动态规划_34$
第 $马氏链模拟R语言马氏链模型的适用性_算法_15$ 年的状态概率可由全概率公式得到：
$马氏链模拟R语言马氏链模型的适用性_算法_36$
算得的结果如下表所示：
表中的最后一列时根据计算数值的趋势猜测的，可以看到，不论初始状态如何，最终都要转到状态3.

马氏链的基本概念

马氏链及其基本方程

按照系统的发展，时间离散化为 $马氏链模拟R语言马氏链模型的适用性_算法_37$ ，对每个 $马氏链模拟R语言马氏链模型的适用性_概率论_02$ ，系统的状态用随机变量 $马氏链模拟R语言马氏链模型的适用性_动态规划$ 表示，设 $马氏链模拟R语言马氏链模型的适用性_动态规划$ 可取 $马氏链模拟R语言马氏链模型的适用性_机器学习_41$ 个离散值 $马氏链模拟R语言马氏链模型的适用性_机器学习_42$ ，且记 $马氏链模拟R语言马氏链模型的适用性_概率论_10$ ，即状态概率。
如果 $马氏链模拟R语言马氏链模型的适用性_机器学习_16$ 的取值只取决于 $马氏链模拟R语言马氏链模型的适用性_动态规划$ 的取值及转移概率，而与 $马氏链模拟R语言马氏链模型的适用性_机器学习_20$ 的取值无关，那么这种离散状态按照离散时间的随机转移过程称为马氏链。
由状态转移的无后效性和全概率公式可以写出马氏链的基本方程为：
$马氏链模拟R语言马氏链模型的适用性_概率论_47$
并且满足：
$马氏链模拟R语言马氏链模型的适用性_概率论_48$
引入状态概率向量（行向量）和转移概率矩阵（简称转移矩阵）：
$马氏链模拟R语言马氏链模型的适用性_算法_49$
则基本方程可以表示为：
$马氏链模拟R语言马氏链模型的适用性_动态规划_50$
还可以得到：
$马氏链模拟R语言马氏链模型的适用性_动态规划_51$
转移矩阵 $马氏链模拟R语言马氏链模型的适用性_动态规划_52$ 是非负阵， $马氏链模拟R语言马氏链模型的适用性_动态规划_52$ 的行和为1，称为 随机矩阵。
马氏链模型最基本的问题是构造状态 $马氏链模拟R语言马氏链模型的适用性_动态规划$ 及写出转移矩阵 $马氏链模拟R语言马氏链模型的适用性_动态规划_52$ ，这里的转移矩阵与时段 $马氏链模拟R语言马氏链模型的适用性_概率论_02$

马氏链的两个重要类型

正则链

这类马氏链的特点是，从任意状态出发经过有限次转移都能达到另外的任意状态。

定义一个有 $马氏链模拟R语言马氏链模型的适用性_机器学习_41$ 个状态的马氏链如果存在正整数 $马氏链模拟R语言马氏链模型的适用性_动态规划_58$ ，使从任意状态 $马氏链模拟R语言马氏链模型的适用性_机器学习_08$ 经 $马氏链模拟R语言马氏链模型的适用性_动态规划_58$ 次转移都以大于零的概率到达状态 $马氏链模拟R语言马氏链模型的适用性_马氏链模拟R语言_61$ ，则称为正则链。
用下面的定理可以检验一个马氏链是否是正则链：
定理1 若马氏链的转移矩阵是 $马氏链模拟R语言马氏链模型的适用性_动态规划_52$ ，则它是正则链的充要条件是，存在正整数 $马氏链模拟R语言马氏链模型的适用性_动态规划_58$ ，使 $马氏链模拟R语言马氏链模型的适用性_马氏链模拟R语言_64$
定理2 正则链存在唯一的极限状态概率 $马氏链模拟R语言马氏链模型的适用性_马氏链模拟R语言_65$ ，又称稳态概率。
求解稳态概率 $马氏链模拟R语言马氏链模型的适用性_概率论_66$ 线性方程租：
$马氏链模拟R语言马氏链模型的适用性_动态规划_67$
从状态 $马氏链模拟R语言马氏链模型的适用性_机器学习_08$ 出发，第一次到达状态 $马氏链模拟R语言马氏链模型的适用性_动态规划_13$ 的概率称为 $马氏链模拟R语言马氏链模型的适用性_机器学习_08$ 到 $马氏链模拟R语言马氏链模型的适用性_动态规划_13$ 的首达概率，记作 $马氏链模拟R语言马氏链模型的适用性_动态规划_72$ ，于是由状态 $马氏链模拟R语言马氏链模型的适用性_机器学习_08$ 到达第一次状态 $马氏链模拟R语言马氏链模型的适用性_动态规划_13$ 的平均转移次数为
$马氏链模拟R语言马氏链模型的适用性_算法_75$

吸收链

定义转移概率 $马氏链模拟R语言马氏链模型的适用性_算法_76$ 的状态 $马氏链模拟R语言马氏链模型的适用性_机器学习_08$ 称为吸收状态。如果马氏链至少包含一个吸收状态，并且从每一个非吸收状态出发，能以正的概率经有限次转移到达某个吸收状态，那么这个马氏链称为吸收链。
吸收链的转移矩阵可以写成简单的标准形式。若有 $马氏链模拟R语言马氏链模型的适用性_算法_78$ 个吸收状态， $马氏链模拟R语言马氏链模型的适用性_机器学习_79$ 个非吸收状态，则转移矩阵 $马氏链模拟R语言马氏链模型的适用性_动态规划_52$ 可表为
$马氏链模拟R语言马氏链模型的适用性_机器学习_81$