android 异常日志日志异常检测

转载

mob64ca14116c53 2023-10-21 18:50:11

文章标签 android 异常日志自然语言处理异常检测编码器最小化 文章分类 Android 移动开发

摘要

在线检测计算机系统的异常是保护系统不受恶意攻击或故障的关键。系统日志记录了详细信息，广泛用于系统状态分析。

本文提出了一种基于BERT的日志异常检测方法LogBERT，通过两个自监督训练任务学习正常日志序列的模式，并能够检测出底层模式偏离正常日志序列的异常。

介绍

系统日志记录了系统产生事件的详细信息，许多传统的机器学习模型被用来从日志消息中识别异常事件，需要从日志消息中提取特征。由于数据不平衡的问题，训练一个二进制分类器来检测异常日志序列是不可行的。因而许多无监督学习模型，如PCA，一分类模型被广泛用于异常检测；但传统的机器学习模型，如单类支持向量机，很难捕获离散日志消息的时间信息。

近年深度学习模型，特别是RNN由于能够对顺序数据建模，广泛应用于日志异常检测。但RNN对日志数据建模仍有一定的局限性。

首先RNN可以通过递归公式捕获序列信息，但不能使每个日志序列中编码左右上下文信息。而观察完整的上下文信息而不仅仅是前面步骤中的信息对恶意攻击是至关重要的。

其次，当前基于rnn的异常检测模型，通过给定先前的日志消息预测下一条日志消息来捕获正常序列的模式。该训练目标主要关注捕获正常序列日志消息之间的相关性。当日志序列中的这种相关性变化时，RNN模型就不能根据之前的日志消息正确预测下一个日志消息，而将该序列标记为异常序列。但仅用对下一个日志消息的预测作为目标函数，不能显式地编码所有正常序列所共有的共同模式。

为解决rnn模型的问题，本文提出了一种基于BERT的日志异常检测方法LogBERT。利用BERT捕获正常日志序列的模式，使用BERT的结构期望将每条日志的上下文都能捕获。

使用两个自监督训练任务:

1)掩码日志关键词预测，正确预测正常日志序列中随机掩码的词汇;

2)超球体积最小化，使正常日志序列在嵌入空间中彼此接近。

训练后LogBERT 可编码正常日志序列的信息，进而得到序列异常检测准则。

LogBERT

android 异常日志日志异常检测_编码器

使用BERT捕获正常序列模式信息。

框架

给定日志消息序列，检测该序列正常或异常。

为标识日志消息，先使用日志解析器提取日志键。

将一个日志序列定义为一个有序的日志键S = [ki，…, kt, . .， kr)。

目的是使用只包含正常日志的序列训练数据集预测新的日志序列是否异常。LogBERT对正常序列进行建模，后接异常检测准识别异常序列。

输入表示

给定一个正常的日志序列S，在开头添加特殊的令牌DIST，作为第一个日志键，表示整个日志序列。LogBERT将每个日志模板表示为x，x是log词向量和位置想了的总和。随机生成矩阵E(k*d)作为log向量矩阵，其中d为日志向量的维数，而位置向量T(T*d)使用正弦函数将日志位置信息按顺序编码。日志模板输入表征：

android 异常日志日志异常检测_android 异常日志_02