目录

  • 概览
  • 问题定义
  • 符号定义
  • 研究方法
  • 损失函数


概览

问题定义

拐点检测名为 change point detection,对于一条不平缓的时间序列曲线,认为存在一些时间点 拐点回归设计 拐点检测_算法 ,使得曲线在这些点对应的位置发生突变,这些时间点对应的曲线点称为拐点,在连续的两个拐点之间,曲线是平稳的。

拐点回归设计 拐点检测_深度学习_02


拐点检测算法的质量,通过算法输出拐点与实际观测到的拐点的差值绝对值除以样本数来评估。

拐点回归设计 拐点检测_拐点回归设计_03


理想情况下,当样本数 T 无穷大时,误差应该减少到 0,这种性质称为满足渐近一致性 (asymptotic consistency.)

拐点回归设计 拐点检测_深度学习_04

符号定义

拐点回归设计 拐点检测_深度学习_05 表示时间点 拐点回归设计 拐点检测_拐点回归设计_06拐点回归设计 拐点检测_算法_07 之间的时间序列,因此完整信号为 拐点回归设计 拐点检测_深度学习_08

对于给定的拐点索引 拐点回归设计 拐点检测_损失函数_09,它的关联分数 associate fraction 称为拐点分数 change point fractions ,公式为 :

拐点回归设计 拐点检测_拐点回归设计_10


拐点分数的集合 拐点回归设计 拐点检测_算法_11,写作 拐点回归设计 拐点检测_损失函数_12

研究方法

一般思路是构造一个对照函数 contrast function,目标是将对照函数的值最小化。

拐点回归设计 拐点检测_深度学习_13


其中 拐点回归设计 拐点检测_损失函数_14 表示用来测量拟合度 goodness-of-fit 的损失函数 cost function,损失函数的值在均匀的子序列上较低,在不均匀的子序列上较高。

基于离散优化问题 discrete optimization problem,拐点的总数量记为 K

如果 K 是固定值,估算的拐点值为:

拐点回归设计 拐点检测_拐点回归设计_15


如果 拐点回归设计 拐点检测_算法_16 不是固定值,估算的拐点值为:

拐点回归设计 拐点检测_算法_17


其中 拐点回归设计 拐点检测_拐点回归设计_18 为对 拐点回归设计 拐点检测_损失函数_09

在这种方法论下,拐点检测的算法包含以下三个元素:

  1. 选择合适的损失函数来测算子序列的均匀程度 homogeneity,这与要检测的变化类型有关
  2. 解决离散优化问题
  3. 合理约束拐点的数量,确定使用固定的 K 还是用 pen() 来惩罚 penalizing 不固定的数量

损失函数