时空熵权R语言熵权法时间序列

转载

mob64ca14061c9e 2024-01-16 20:33:04

熵这个概念最早是用于热力学中，毕竟这个字是火字旁，用于衡量一个系统能量的不可用程度，熵越大，能量的不可用程度就越大；越小能量的不可用程度越低。它的物理意义是体系中混乱程度或者复杂程度的度量。
关于熵的应用也在不断拓展，从热力学到生物学、物理学，以及在时间序列分析上都有应用。

一、近似熵（Approximate Entropy, ApEn）

概念

近似熵是一种用于量化时间序列的不规则性或者复杂性的度量方式，它反映了时间序列中新的子序列产生的概率，也就是以一种条件概率的方式来衡量时间序列中新信息发生的可能性，因此越复杂的时间序列对应的近似熵就越大。

近似熵求法

1、设有长度为 $时空熵权R语言熵权法时间序列_近似熵$ 的时间序列 $时空熵权R语言熵权法时间序列_样本熵_02$ ，规定一个表示相似度比较的阈值 $时空熵权R语言熵权法时间序列_样本熵_03$ ，再确定一个划分子序列长度的度量 $时空熵权R语言熵权法时间序列_近似熵_04$ 。
2、通过将原序列进行重构，这样就可以得到 $时空熵权R语言熵权法时间序列_熵_05$ 个子序列 $时空熵权R语言熵权法时间序列_时空熵权R语言_06$ 。将每个子序列以 $时空熵权R语言熵权法时间序列_时空熵权R语言_07$ 表示，其中 $时空熵权R语言熵权法时间序列_近似熵_08$ 。
3、计算任意两个重构向量 $时空熵权R语言熵权法时间序列_时空熵权R语言_07$ 和 $时空熵权R语言熵权法时间序列_时空熵权R语言_10$ 之间的距离 $时空熵权R语言熵权法时间序列_样本熵_11$ ，其中 $时空熵权R语言熵权法时间序列_模糊熵_12$ 表示两个重构向量 $时空熵权R语言熵权法时间序列_时空熵权R语言_10$ ( $时空熵权R语言熵权法时间序列_熵_14$ )与 $时空熵权R语言熵权法时间序列_时空熵权R语言_07$ 之间的距离，距离 $时空熵权R语言熵权法时间序列_模糊熵_12$ 由两个向量中对应位置元素的最大差值决定。这里包括 $时空熵权R语言熵权法时间序列_近似熵_17$ 的距离。
4、然后统计满足以下条件的向量个数，并求出与总的统计数目之间的比值：
$时空熵权R语言熵权法时间序列_模糊熵_18$ 这个过程称作 $时空熵权R语言熵权法时间序列_时空熵权R语言_07$ 的模版匹配过程， $时空熵权R语言熵权法时间序列_熵_20$ 表示任意一个 $时空熵权R语言熵权法时间序列_时空熵权R语言_10$ 与模版之间的匹配概率。
5、定义在划分子序列个数为 $时空熵权R语言熵权法时间序列_近似熵_04$ 时的平均相似率： $时空熵权R语言熵权法时间序列_模糊熵_23$ 6、按照上面1~5再计算当划分子序列个数为 $时空熵权R语言熵权法时间序列_近似熵_24$ 时的平均相似率 $时空熵权R语言熵权法时间序列_模糊熵_25$ 。
7、得近似熵： $时空熵权R语言熵权法时间序列_熵_26$
注：关于 $时空熵权R语言熵权法时间序列_近似熵_04$ 和 $时空熵权R语言熵权法时间序列_样本熵_03$ 的选取， $时空熵权R语言熵权法时间序列_近似熵_04$ 通常选择为2或者3； $时空熵权R语言熵权法时间序列_样本熵_03$ 则根据实际应用的场景选择，通常选择 $时空熵权R语言熵权法时间序列_时空熵权R语言_31$ ， $时空熵权R语言熵权法时间序列_模糊熵_32$ 是原时间序列的标准差。从信息熵的角度来看，近似熵的思想是通过判断每个子序列中元素与全局子序列中每个元素之间的差异的大小来决定信息熵的大小，如果一个子序列与其他子序列之间的差异都很大，那么它满足 $时空熵权R语言熵权法时间序列_时空熵权R语言_33$ 的数量就会很少，相对应它的信息量就大，因而它的信息熵就会很大。

二、样本熵（Sample Entropy, SampEn）

概念

样本熵同样也是用于衡量时间序列在单一尺度上的复杂度，与近似熵相比，具有更高的精度。样本熵是在近似熵的基础上的改进，所以求法也很类似。

样本熵的求法

1、设有长度为 $时空熵权R语言熵权法时间序列_近似熵$ 的时间序列 $时空熵权R语言熵权法时间序列_样本熵_02$ ，规定一个表示相似度比较的阈值 $时空熵权R语言熵权法时间序列_样本熵_03$ ，再确定一个划分子序列长度的度量 $时空熵权R语言熵权法时间序列_近似熵_04$ 。
2、通过将原序列进行重构，这样就可以得到 $时空熵权R语言熵权法时间序列_熵_05$ 个子序列 $时空熵权R语言熵权法时间序列_时空熵权R语言_06$ 。将每个子序列以 $时空熵权R语言熵权法时间序列_时空熵权R语言_07$ 表示，其中 $时空熵权R语言熵权法时间序列_近似熵_08$ 。
3、计算任意两个重构向量 $时空熵权R语言熵权法时间序列_时空熵权R语言_07$ 和 $时空熵权R语言熵权法时间序列_时空熵权R语言_10$ 之间的距离 $时空熵权R语言熵权法时间序列_样本熵_11$ ，其中 $时空熵权R语言熵权法时间序列_模糊熵_12$ 表示两个重构向量 $时空熵权R语言熵权法时间序列_时空熵权R语言_10$ ( $时空熵权R语言熵权法时间序列_熵_14$ )与 $时空熵权R语言熵权法时间序列_时空熵权R语言_07$ 之间的距离，距离 $时空熵权R语言熵权法时间序列_模糊熵_12$ 由两个向量中对应位置元素的最大差值决定。这里的 $时空熵权R语言熵权法时间序列_时空熵权R语言_50$ 。
4、然后统计满足以下条件的向量个数，并求出与总的统计数目之间的比值：
$时空熵权R语言熵权法时间序列_样本熵_51$ 这个过程称作 $时空熵权R语言熵权法时间序列_时空熵权R语言_07$ 的模版匹配过程， $时空熵权R语言熵权法时间序列_时空熵权R语言_53$ 表示任意一个 $时空熵权R语言熵权法时间序列_时空熵权R语言_10$ 与模版之间的匹配概率。这里的 $时空熵权R语言熵权法时间序列_熵_55$ ，所以总的统计数就是 $时空熵权R语言熵权法时间序列_模糊熵_56$ 。
5、求 $时空熵权R语言熵权法时间序列_时空熵权R语言_53$ 对于每个 $时空熵权R语言熵权法时间序列_时空熵权R语言_58$ 的平均值，也就是平均相似率，记为 $时空熵权R语言熵权法时间序列_近似熵_59$ ： $时空熵权R语言熵权法时间序列_模糊熵_60$ 注意，这里的近似平均率没有取对数，这里也是和近似熵的区别。
6、按照上面的1~5步骤计算 $时空熵权R语言熵权法时间序列_近似熵_24$ 时的平均相似率 $时空熵权R语言熵权法时间序列_模糊熵_62$ 。
7、这样就可以得到 $时空熵权R语言熵权法时间序列_近似熵$ 取有限值时，样本熵为： $时空熵权R语言熵权法时间序列_熵_64$
注：关于 $时空熵权R语言熵权法时间序列_近似熵_04$ 和 $时空熵权R语言熵权法时间序列_样本熵_03$ 的选取， $时空熵权R语言熵权法时间序列_近似熵_04$ 通常选择为1或者2； $时空熵权R语言熵权法时间序列_样本熵_03$ 则根据实际应用的场景选择，通常选择 $时空熵权R语言熵权法时间序列_近似熵_69$ ， $时空熵权R语言熵权法时间序列_模糊熵_32$ 是原时间序列的标准差。近似熵是以 $时空熵权R语言熵权法时间序列_熵_71$ 为模型，为了避免出现 $时空熵权R语言熵权法时间序列_时空熵权R语言_72$ 的情况，所以在计算重构向量距离的时候，剔除了与自身的比较。

三、模糊熵（Fuzzy Entropy，FsEn）

概念

模糊熵是在样本熵的基础上改进得到的，模糊熵引入了模糊隶属度函数，它是一种指数函数。它的主要特点是其参数的改变对复杂性度量的结果影响很小。

模糊熵的求法

1、设有长度为 $时空熵权R语言熵权法时间序列_近似熵$ 的时间序列 $时空熵权R语言熵权法时间序列_样本熵_02$ ，规定一个表示相似度比较的阈值 $时空熵权R语言熵权法时间序列_样本熵_03$ ，再确定一个划分子序列长度的度量 $时空熵权R语言熵权法时间序列_样本熵_76$ 。
2、通过将原序列进行重构，这样就可以得到 $时空熵权R语言熵权法时间序列_熵_05$ 个子序列 $时空熵权R语言熵权法时间序列_时空熵权R语言_06$ 。将每个子序列以 $时空熵权R语言熵权法时间序列_时空熵权R语言_07$ 表示，其中 $时空熵权R语言熵权法时间序列_模糊熵_80$ 。这里的操作有点类似去中心化。其中 $时空熵权R语言熵权法时间序列_时空熵权R语言_81$ 3、计算任意两个重构向量 $时空熵权R语言熵权法时间序列_时空熵权R语言_07$ 和 $时空熵权R语言熵权法时间序列_时空熵权R语言_10$ 之间的距离 $时空熵权R语言熵权法时间序列_熵_84$ ，其中 $时空熵权R语言熵权法时间序列_样本熵_85$ 表示两个重构向量 $时空熵权R语言熵权法时间序列_时空熵权R语言_10$ ( $时空熵权R语言熵权法时间序列_熵_14$ )与 $时空熵权R语言熵权法时间序列_时空熵权R语言_07$ 之间的距离，距离 $时空熵权R语言熵权法时间序列_模糊熵_12$ 由两个向量中对应位置元素的最大差值决定。这里同样 $时空熵权R语言熵权法时间序列_时空熵权R语言_50$ 。
4、引入模糊隶属度函数： $时空熵权R语言熵权法时间序列_近似熵_91$ 5、计算针对于每个 $时空熵权R语言熵权法时间序列_时空熵权R语言_58$ 的平均值： $时空熵权R语言熵权法时间序列_模糊熵_93$ 6、定义 $时空熵权R语言熵权法时间序列_模糊熵_94$ 7、按照1~6步骤，求 $时空熵权R语言熵权法时间序列_近似熵_24$ 时的 $时空熵权R语言熵权法时间序列_近似熵_96$ 。
8、模糊熵： $时空熵权R语言熵权法时间序列_近似熵_97$

四、总结

关于重构向量的大小 $时空熵权R语言熵权法时间序列_近似熵_04$ 和相似度 $时空熵权R语言熵权法时间序列_样本熵_03$ 的选择都是要考虑的事情，过大的相似度会导致信息丢失，太小则会增加对噪声的敏感性。
上面几种熵，都是衡量时间序列在单一尺度上的复杂性。后面也有多尺度熵来衡量时间序列在不同尺度因子上的复杂性和自相似性。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。