Autoencoders

优势。

这种方法的优点如下。

(i) 大量先进的(预训练的)深度模型和现成的异常探测器随时可用。

(ii)深度特征提取提供了比流行的线性方法更强大的降维

(iii)考虑到深度模型和检测方法的公开可用性,它很容易实现。

缺点。

它们的缺点如下。

(i) 完全不相交的特征提取和异常评分通常会导致次优的异常评分

(ii)预先训练的深度模型通常仅限于特定类型的数据。

面对的挑战。 这类方法将高维/非独立数据投射到低维空间,使现有的异常检测方法能够处理更简单的数据空间。低维空间通常有助于揭示隐藏的异常并减少假阳性(CH2)。然而,这些方法未必能为异常检测保存足够的资料,因为数据推算与异常检测完全脱钩。此外,这种方法允许我们利用多种类型的特征并学习语义丰富的检测模型(例如,References [65,66,163]中的各种预定义的图像/视频特征) ,这也有助于减少假阳性(CH1)。

GAN

优势。 这些方法的优点如下。

(i) GANs在生成真实实例方面表现出了卓越的能力,尤其是在图像数据上,能够检测从潜在空间重建不良的异常实例。

(ii)大量现有的基于GAN的模型和理论[32]可以适用于异常检测。

缺点。 它们的缺点如下。

(i) GANs的训练可能会遇到多种问题,如无法收敛和模式崩溃[99],这导致训练基于GANs的异常检测模型的难度很大。

(ii)生成器网络可能会被误导,并从正态实例的流形中生成数据实例,特别是当给定数据集的真实分布复杂或训练数据包含意外的异常值时。

(iii)基于GAN的异常分数可能是次优的,因为它们建立在生成器网络上,目标是设计用于数据合成而不是异常检测

有针对性的挑战。 类似于AE,基于GAN的异常检测能够通过检查从所学习的低维潜在空间(CH2)的重建来检测高维异常。当潜在空间保留了重要的异常判别信息时,与原始数据空间(CH1)中的检测精度相比,它有助于提高检测精度。

Predictability Modeling

优势。 这类方法的优点如下。

(i) 许多序列学习技术可以被调整并结合到这种方法中。

(ii)这种方法能够学习不同类型的时间和空间依赖性。

缺点。 它们的缺点如下。

(i) 这种方法仅限于序列数据中的异常检测。

(ii)顺序预测在计算上可能是昂贵的。

(iii)学习的表示对于异常检测可能是次优的,因为其基本目标是用于顺序预测而不是异常检测。

有针对性的挑战。 这种方法特别设计用于学习表达性的时间依赖性低维表示,这有助于解决高维和/或时间数据集(CH1和CH2)中异常检测的误报问题。这里的预测是以一些经过的时间实例为条件的,因此这类方法能够检测基于时间上下文的条件异常(CH5)。

Distance-based Measure 基于距离的测量

优势。 这类方法的优点如下。

(i) 基于距离的异常是直接的,并且在文献中得到了丰富的理论支持。因此,由于先前相关工作奠定了坚实的基础,基于深距离的异常检测方法可以很好地扎根。

(ii)它们在低维表示空间中工作,可以有效地处理传统的基于距离的异常测量失败的高维数据。

(iii)他们能够学习专门为自己量身定制的表达方式。

缺点。 它们的缺点如下。

(i) 大多数基于距离的异常测量中涉及的大量计算可能是将基于距离的反常测量纳入表示学习过程的障碍。

(ii)它们的能力可能受到基于距离的异常测量的固有弱点的限制。

有针对性的挑战。 这种方法能够学习为现有的基于距离的异常测量量身定制的低维表示,解决了基于距离的检测[178](CH1和CH2)中臭名昭著的维数诅咒。如参考文献[112]所示,可以设计自适应的三重态损失,以利用一些标记的异常示例来学习更有效的正态表示(CH3)。得益于伪异常标记,方法[112,155]对潜在的异常污染具有鲁棒性,并在完全无监督的环境(CH4)中有效工作。

One-class Classification-based Measure

优势。 这类方法的优点如下。

(i) 基于一类分类的异常在文献中得到了很好的研究,并为基于深层分类的方法提供了坚实的基础。

(ii)表示学习和一类分类模型可以统一,以学习定制的和更优化的表示。(iii)它们使用户不用在传统的单类模型中手动选择合适的内核函数。

缺点。 它们的缺点如下。

(i) 单类模型在正态类内具有复杂分布的数据集中可能无效工作。

(ii)检测性能取决于基于一类分类的异常测量。

有针对性的挑战。 这类方法通过学习针对一类分类模型(CH1和CH2)优化的低维表示空间来提高检测精度。这些方法[133]可以利用少量标记的正常和异常数据来学习更有效的一类描述模型,该模型不仅可以检测已知异常,还可以检测新的异常类别(CH3)。

Clustering-based Measure 基于聚类的度量

优势。 基于深度聚类的方法的优点如下。

(i) 许多深度聚类方法和理论可以用来支持异常检测的有效性和理论基础。(ii)与传统的基于聚类的方法相比,基于深度聚类的方法学习专门优化的表示,这有助于比原始数据更容易发现异常,尤其是在处理复杂的数据集时。

缺点。 它们的缺点如下。

(i) 异常检测的性能在很大程度上取决于聚类结果。

(ii)聚类过程可能会因训练数据中受污染的异常而产生偏差,这反过来又导致无效的表示。

有针对性的挑战。 将基于聚类的异常度量应用于新学习的数据输入的低维表示;当新的表示空间保留了足够的判别信息时,深度方法可以实现比原始数据空间(CH1和CH2)更好的检测精度。一些聚类算法对异常值很敏感,因此当给定的数据被异常污染时,深度聚类和随后的异常检测可能会被很大程度上误导。使用自动编码器[179]重建误差的手工特征进行深度聚类可能有助于学习关于污染(CH4)的更稳健的模型。

Ranking Models

优势。 深度排序模型库方法的优点如下。

(i) 异常分数可以通过调整的损失函数直接优化。

(ii)通过在异常和正常情况之间强加一个弱序假设,它们通常不受异常定义的限制。

(iii)这种方法可以建立在学习排名等领域公认的排名技术和理论的基础上[85,87158]。

缺点。 它们的缺点如下。

(i) 这些方法中至少需要某种形式的标记异常,这可能不适用于无法获得此类标记异常的应用。参考文献[117]中的方法是完全无监督的,并获得了一些有希望的性能,但与半监督方法相比仍有很大差距。

(ii)由于模型仅适用于检测少数标记异常,因此它们可能无法推广到表现出与标记异常不同的异常特征的看不见的异常。

有针对性的挑战。 使用伪标签或噪声类标签等弱监督提供了可疑异常的一些重要知识,从而能够学习更具表现力的低维表示空间和更好的检测精度(CH1和CH2)。MIL方案[145]和成对关系预测[114]提供了一种将粗粒度/有限异常标签结合到检测模型学习(CH3)中的简单方法。更重要的是,端到端异常分数学习通过反向传播异常分数的激活权重或梯度来定位导致大异常分数的特征,从而提供了直接的异常解释[117](CH6)。此外,参考文献[1141117]中的方法在具有异常污染或噪声标签(CH4)的数据中使用也非常好。

Prior-driven Models 先前驱动的模型

优势。 先验驱动模型的优点如下。

(i) 对于给定的先验,可以直接优化异常分数。

(ii)它提供了一个灵活的框架,用于将不同的先验分布合并到异常分数学习中。不同的贝叶斯深度学习技术[156]可以适用于异常检测。

(iii)与其他方法相比,先验方法还可以产生更多可解释的异常分数。

缺点。 它们的缺点如下。

(i) 对于不同的异常检测应用场景,即使不是不可能,也很难设计出一种普遍有效的先验。

(ii)如果先前的模型不能很好地适应潜在的分布,则模型的工作效率可能会降低。

目标挑战。 先验使模型能够学习不同复杂数据的低维表示,如高维数据和序列数据(CH1和CH2)。通过施加先验的过度异常评分,偏差网络方法[115]在利用有限数量的标记异常数据来增强正常和异常的表示方面具有良好的性能,从而大大提高了检测召回率(CH1和CH3)。这里的检测模型由先验分布*w.r.t.*异常评分函数驱动,并且在训练数据(CH4)中具有异常污染的数据中工作良好。

Softmax Likelihood Models Softmax 似然模型

优势。 基于softmax模型的方法的优点如下。

(i) 不同类型的交互可以被合并到异常分数学习过程中。

(ii)相对于我们旨在捕捉的特定异常交互作用,异常分数得到了忠实的优化。

缺点。 它们的缺点如下。

(i) 当每个数据实例中的特征/元素的数量很大时,交互的计算可能非常昂贵,即,对于D个特征/元件的n阶交互,每个实例的时间复杂度为[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3mYtO9Kd-1681800089473)(C:\Users\13933\AppData\Roaming\Typora\typora-user-images\image-20230404204802008.png)]。(ii)异常分数学习在很大程度上取决于负样本生成的质量。

有针对性的挑战: 这类方法的公式化为学习具有异构数据源(CH2和CH5)的数据集的低维表示提供了一种很有前途的方法。所学习的表示通常从不同的数据源捕获更多的正常/异常信息,从而能够比传统方法(CH1)更好地进行检测。

End-to-end One-class Classification 端到端一类分类

优势。 这类方法的优点如下。

(i) 其异常分类模型是以端到端的方式进行对抗性优化的。

(ii)它可以通过丰富的对抗性学习技术和理论以及一类分类来发展和支持。

缺点。 它们的缺点如下。

(i) 很难保证生成的参考实例与未知异常非常相似。

(ii)GANs的不稳定性可能导致生成具有不同质量的实例,从而导致异常分类性能不稳定。最近在参考文献[169]中对这一问题进行了研究,该文献表明,这种类型的异常检测器的性能在不同的训练步骤中可能会大幅波动。

(iii)其应用仅限于半监督异常检测场景。

它们的缺点如下。

(i) 很难保证生成的参考实例与未知异常非常相似。

(ii)GANs的不稳定性可能导致生成具有不同质量的实例,从而导致异常分类性能不稳定。最近在参考文献[169]中对这一问题进行了研究,该文献表明,这种类型的异常检测器的性能在不同的训练步骤中可能会大幅波动。

(iii)其应用仅限于半监督异常检测场景。

有针对性的挑战: 对抗性学习的一类分类器学习生成真实的边缘/边界实例,从而能够学习表达性的低维正态性表示(CH1和CH2)。