这个概念最早是用于热力学中,毕竟这个字是火字旁,用于衡量一个系统能量的不可用程度,熵越大,能量的不可用程度就越大;越小能量的不可用程度越低。它的物理意义是体系中混乱程度或者复杂程度的度量。
关于熵的应用也在不断拓展,从热力学到生物学、物理学,以及在时间序列分析上都有应用。

一、近似熵(Approximate Entropy, ApEn)

概念

近似熵是一种用于量化时间序列的不规则性或者复杂性的度量方式,它反映了时间序列中新的子序列产生的概率,也就是以一种条件概率的方式来衡量时间序列中新信息发生的可能性,因此越复杂的时间序列对应的近似熵就越大

近似熵求法

1、设有长度为时空熵权R语言 熵权法时间序列_近似熵的时间序列时空熵权R语言 熵权法时间序列_样本熵_02,规定一个表示相似度比较的阈值时空熵权R语言 熵权法时间序列_样本熵_03,再确定一个划分子序列长度的度量时空熵权R语言 熵权法时间序列_近似熵_04
2、通过将原序列进行重构,这样就可以得到时空熵权R语言 熵权法时间序列_熵_05个子序列时空熵权R语言 熵权法时间序列_时空熵权R语言_06。将每个子序列以时空熵权R语言 熵权法时间序列_时空熵权R语言_07表示,其中时空熵权R语言 熵权法时间序列_近似熵_08
3、计算任意两个重构向量时空熵权R语言 熵权法时间序列_时空熵权R语言_07时空熵权R语言 熵权法时间序列_时空熵权R语言_10之间的距离 时空熵权R语言 熵权法时间序列_样本熵_11,其中时空熵权R语言 熵权法时间序列_模糊熵_12表示两个重构向量时空熵权R语言 熵权法时间序列_时空熵权R语言_10(时空熵权R语言 熵权法时间序列_熵_14)与时空熵权R语言 熵权法时间序列_时空熵权R语言_07之间的距离,距离时空熵权R语言 熵权法时间序列_模糊熵_12由两个向量中对应位置元素的最大差值决定。这里包括时空熵权R语言 熵权法时间序列_近似熵_17的距离。
4、然后统计满足以下条件的向量个数,并求出与总的统计数目之间的比值:
时空熵权R语言 熵权法时间序列_模糊熵_18这个过程称作时空熵权R语言 熵权法时间序列_时空熵权R语言_07的模版匹配过程,时空熵权R语言 熵权法时间序列_熵_20表示任意一个时空熵权R语言 熵权法时间序列_时空熵权R语言_10与模版之间的匹配概率。
5、定义在划分子序列个数为时空熵权R语言 熵权法时间序列_近似熵_04时的平均相似率:时空熵权R语言 熵权法时间序列_模糊熵_236、按照上面1~5再计算当划分子序列个数为时空熵权R语言 熵权法时间序列_近似熵_24时的平均相似率时空熵权R语言 熵权法时间序列_模糊熵_25
7、得近似熵:时空熵权R语言 熵权法时间序列_熵_26
注:关于时空熵权R语言 熵权法时间序列_近似熵_04时空熵权R语言 熵权法时间序列_样本熵_03的选取,时空熵权R语言 熵权法时间序列_近似熵_04通常选择为2或者3;时空熵权R语言 熵权法时间序列_样本熵_03则根据实际应用的场景选择,通常选择时空熵权R语言 熵权法时间序列_时空熵权R语言_31时空熵权R语言 熵权法时间序列_模糊熵_32是原时间序列的标准差。从信息熵的角度来看,近似熵的思想是通过判断每个子序列中元素与全局子序列中每个元素之间的差异的大小来决定信息熵的大小,如果一个子序列与其他子序列之间的差异都很大,那么它满足时空熵权R语言 熵权法时间序列_时空熵权R语言_33的数量就会很少,相对应它的信息量就大,因而它的信息熵就会很大。

二、样本熵(Sample Entropy, SampEn)

概念

样本熵同样也是用于衡量时间序列在单一尺度上的复杂度,与近似熵相比,具有更高的精度。样本熵是在近似熵的基础上的改进,所以求法也很类似。

样本熵的求法

1、设有长度为时空熵权R语言 熵权法时间序列_近似熵的时间序列时空熵权R语言 熵权法时间序列_样本熵_02,规定一个表示相似度比较的阈值时空熵权R语言 熵权法时间序列_样本熵_03,再确定一个划分子序列长度的度量时空熵权R语言 熵权法时间序列_近似熵_04
2、通过将原序列进行重构,这样就可以得到时空熵权R语言 熵权法时间序列_熵_05个子序列时空熵权R语言 熵权法时间序列_时空熵权R语言_06。将每个子序列以时空熵权R语言 熵权法时间序列_时空熵权R语言_07表示,其中时空熵权R语言 熵权法时间序列_近似熵_08
3、计算任意两个重构向量时空熵权R语言 熵权法时间序列_时空熵权R语言_07时空熵权R语言 熵权法时间序列_时空熵权R语言_10之间的距离 时空熵权R语言 熵权法时间序列_样本熵_11,其中时空熵权R语言 熵权法时间序列_模糊熵_12表示两个重构向量时空熵权R语言 熵权法时间序列_时空熵权R语言_10(时空熵权R语言 熵权法时间序列_熵_14)与时空熵权R语言 熵权法时间序列_时空熵权R语言_07之间的距离,距离时空熵权R语言 熵权法时间序列_模糊熵_12由两个向量中对应位置元素的最大差值决定。这里的时空熵权R语言 熵权法时间序列_时空熵权R语言_50
4、然后统计满足以下条件的向量个数,并求出与总的统计数目之间的比值:
时空熵权R语言 熵权法时间序列_样本熵_51这个过程称作时空熵权R语言 熵权法时间序列_时空熵权R语言_07的模版匹配过程,时空熵权R语言 熵权法时间序列_时空熵权R语言_53表示任意一个时空熵权R语言 熵权法时间序列_时空熵权R语言_10与模版之间的匹配概率。这里的时空熵权R语言 熵权法时间序列_熵_55,所以总的统计数就是时空熵权R语言 熵权法时间序列_模糊熵_56
5、求时空熵权R语言 熵权法时间序列_时空熵权R语言_53对于每个时空熵权R语言 熵权法时间序列_时空熵权R语言_58的平均值,也就是平均相似率,记为时空熵权R语言 熵权法时间序列_近似熵_59时空熵权R语言 熵权法时间序列_模糊熵_60注意,这里的近似平均率没有取对数,这里也是和近似熵的区别。
6、按照上面的1~5步骤计算时空熵权R语言 熵权法时间序列_近似熵_24时的平均相似率时空熵权R语言 熵权法时间序列_模糊熵_62
7、这样就可以得到时空熵权R语言 熵权法时间序列_近似熵取有限值时,样本熵为:时空熵权R语言 熵权法时间序列_熵_64
注:关于时空熵权R语言 熵权法时间序列_近似熵_04时空熵权R语言 熵权法时间序列_样本熵_03的选取,时空熵权R语言 熵权法时间序列_近似熵_04通常选择为1或者2;时空熵权R语言 熵权法时间序列_样本熵_03则根据实际应用的场景选择,通常选择时空熵权R语言 熵权法时间序列_近似熵_69时空熵权R语言 熵权法时间序列_模糊熵_32是原时间序列的标准差。近似熵是以时空熵权R语言 熵权法时间序列_熵_71为模型,为了避免出现时空熵权R语言 熵权法时间序列_时空熵权R语言_72的情况,所以在计算重构向量距离的时候,剔除了与自身的比较。

三、模糊熵(Fuzzy Entropy,FsEn)

概念

模糊熵是在样本熵的基础上改进得到的,模糊熵引入了模糊隶属度函数,它是一种指数函数。它的主要特点是其参数的改变对复杂性度量的结果影响很小。

模糊熵的求法

1、设有长度为时空熵权R语言 熵权法时间序列_近似熵的时间序列时空熵权R语言 熵权法时间序列_样本熵_02,规定一个表示相似度比较的阈值时空熵权R语言 熵权法时间序列_样本熵_03,再确定一个划分子序列长度的度量时空熵权R语言 熵权法时间序列_样本熵_76
2、通过将原序列进行重构,这样就可以得到时空熵权R语言 熵权法时间序列_熵_05个子序列时空熵权R语言 熵权法时间序列_时空熵权R语言_06。将每个子序列以时空熵权R语言 熵权法时间序列_时空熵权R语言_07表示,其中时空熵权R语言 熵权法时间序列_模糊熵_80。这里的操作有点类似去中心化。其中时空熵权R语言 熵权法时间序列_时空熵权R语言_813、计算任意两个重构向量时空熵权R语言 熵权法时间序列_时空熵权R语言_07时空熵权R语言 熵权法时间序列_时空熵权R语言_10之间的距离 时空熵权R语言 熵权法时间序列_熵_84,其中时空熵权R语言 熵权法时间序列_样本熵_85表示两个重构向量时空熵权R语言 熵权法时间序列_时空熵权R语言_10(时空熵权R语言 熵权法时间序列_熵_14)与时空熵权R语言 熵权法时间序列_时空熵权R语言_07之间的距离,距离时空熵权R语言 熵权法时间序列_模糊熵_12由两个向量中对应位置元素的最大差值决定。这里同样时空熵权R语言 熵权法时间序列_时空熵权R语言_50
4、引入模糊隶属度函数:时空熵权R语言 熵权法时间序列_近似熵_915、计算针对于每个时空熵权R语言 熵权法时间序列_时空熵权R语言_58的平均值:时空熵权R语言 熵权法时间序列_模糊熵_936、定义时空熵权R语言 熵权法时间序列_模糊熵_947、按照1~6步骤,求时空熵权R语言 熵权法时间序列_近似熵_24时的时空熵权R语言 熵权法时间序列_近似熵_96
8、模糊熵:时空熵权R语言 熵权法时间序列_近似熵_97

四、总结

关于重构向量的大小时空熵权R语言 熵权法时间序列_近似熵_04和相似度时空熵权R语言 熵权法时间序列_样本熵_03的选择都是要考虑的事情,过大的相似度会导致信息丢失,太小则会增加对噪声的敏感性。
上面几种熵,都是衡量时间序列在单一尺度上的复杂性。后面也有多尺度熵来衡量时间序列在不同尺度因子上的复杂性自相似性