论文阅读:An incremental learning system for atrial fibrillation detection based on transfer learning and active learning

一、摘要

文章在迁移学习和主动学习的基础上,提出了一种融合AF诊断,标签查询和模型微调闭环框架。在预训练阶段,将使用来自原始训练集中的标记样本对新的多输入深度神经网络(MIDNN)进行预训练。在实际应用中,该模型可用于自动对焦检测。同时,收集连续数据以形成候选集。在增量学习阶段,通过候选集中信息最丰富的样本对模型进行连续微调。这些样本是根据预训练模型和新的主动学习策略从候选集中选择的。该策略结合了预测结果的特征和不确定性。
为了评估该方法,使用MIT-BIH心房颤动数据库进行预训练,并以MIT-BIH心律失常数据库的样本作为候选集。Acc,Sen和PPV的初始值为87.40%,97.46%和81.11%。经过14次迭代,这些指数达到了97.53%,100.00%和95.29%的最高值。

二、数据

使用了MIT-BIH心律失常数据库和MIT-BIH心房颤动数据库,使用的ECG节段的持续时间为10 s。选择此长度是基于对更好的诊断结果和更短延迟的综合考虑。这些样品标记有AF或非AF。除AF样本外,所有其他类型的样本都标记为非AF。在两个数据集中,都使用了所有AF样本。随机选择相同数量的非AF样本。AFDB的ECG作为原始训练样本。MITDB的ECG作为新收集的样本。
本研究以10 s ECG段为样本。这些片段是直接从原始ECG信号获取的,无需任何预处理。该操作避免了幅度信息失真并且保留了原始特性。两个连续的段之间没有重叠。为了统一输入矢量的长度,以250 Hz的频率对MITDB的样本进行重新采样。因此,一个段包含2500点。这些点被作为第一个输入。

三、方法

模型结构如图,它由三个主要模块组成。在预训练模块中,将从原始训练集中构造的训练样本用于训练MIDNN模型。原始训练集包含大量带标签的ECG数据。可以通过长期的数据收集和注释来获得。值得注意的是,预训练过程仅进行一次。

在实际应用中,从用户那里收集连续数据。这些ECG以设定的间隔(例如每天一个周期)进行处理。在输入构建后获得一组未标记的样品。这些样本将用于更新模型。

【论文阅读笔记】An incremental learning system for atrial fibrillation detection based on transfer learning_池化


所提出的多输入深度神经网络的结构如图4所示。14层学习网络包含卷积层,池化层,LSTM层,连接层和完全连接层。第一个输入直接馈入五对卷积和池化层。最后一个池化层的输出是卷积特征。输出仍然是时间序列,并通过LSTM层。在LSTM层之后是一个完全连接的层。第二个输入首先通过两个完全连接的层,而不是直接与自动提取的特征连接。随后,将第12层中两个完全连接的层的输出连接起来,并馈入最后一层。

【论文阅读笔记】An incremental learning system for atrial fibrillation detection based on transfer learning_池化_02


逐步微调模型的关键是选择信息最丰富的样本。幸运的是,主动学习策略为选择提供了标准。在提出的改进熵(MEN)方法中,不直接使用计算得出的En。如果分类为AF的样本的Se等于0,则认为该样本具有参考价值。如果被归类为非AF的样品具有较高的Se,则也被认为是提供信息的。在这些情况下,En的值将增加,以使样本更有可能被选择。

四、结果

通过10倍交叉验证对AFDB进行评估,MIDNN模式提供的Acc,Sen和PPV分别为98.92%,99.07%和98.76%。

【论文阅读笔记】An incremental learning system for atrial fibrillation detection based on transfer learning_深度学习_03


主动学习阶段始于一个空的学习集和预先训练的MIDNN。Acc,Sen和PPV的初始值为87.40%,97.46%和81.11%。随着查询数量的增加,性能得到了提高。标记150个样本后,MEN的三个指标的值分别达到97.53%,100.00%和95.29%。

【论文阅读笔记】An incremental learning system for atrial fibrillation detection based on transfer learning_池化_04

五、讨论

本文提出的方法结合了转移学习和主动学习。使用预先训练的模型,从新收集的ECG数据中选择有用的样本。仅查询这些样本,并将其用于微调模型。该方法经过14次迭代达到了最佳性能,这意味着可以节省90%以上的标签成本。拟议的新学习策略有助于这一结果。MEN比EN和RS更有效,因为MEN的性能收敛最快。事实证明,将特征和预测结果的不确定性相结合可以有效地选择用于AF分类的样本。尽管某些信息样本的分类熵较低,但可以根据RRI系列的熵来增加其排名。