【多标签文本分类】《基于标签语义注意力的多标签文本分类》

原创

征途黯然2 2023-01-16 21:04:50 ©著作权

文章标签 分类人工智能多标签文本分类文本分类权重 文章分类 虚拟化云计算

©著作权归作者所有：来自51CTO博客作者征途黯然2的原创作品，请联系作者获取转载授权，否则将追究法律责任

·阅读摘要：
为了建立标签的语义信息和文档的内容信息之间的联系并加以利用，文章提出了一种基于标签语义注意力的多标签文本分类(LAbel Semantic Attention Multi-label Classification,简称 LASA)方法。
·参考文献：
[1] 基于标签语义注意力的多标签文本分类

参考论文信息

论文名称：《基于标签语义注意力的多标签文本分类》

发布期刊：《软件学报》

期刊信息：CSCD

【多标签文本分类】《基于标签语义注意力的多标签文本分类》_分类

论文《融合注意力与CorNet的多标签文本分类》与此篇论文是同一个思路，值得参考。

模型结构

模型结构如下：

【多标签文本分类】《基于标签语义注意力的多标签文本分类》_分类_02

【注】：本篇论文的网络结构很简洁，论文写的也很干净利落。

1. 单词隐表示学习

$【多标签文本分类】《基于标签语义注意力的多标签文本分类》_权重_03$ 与 $【多标签文本分类】《基于标签语义注意力的多标签文本分类》_分类_04$ 。

2. 标签隐表示学习

这部分的工作是把标签转化为向量表示。文中使用的方法是，把标签中的每个词的向量表示相加取得平均。第i个标签的向量表示如下：

$【多标签文本分类】《基于标签语义注意力的多标签文本分类》_文本分类_05$

【例如】：某个标签为“love story”，那么这个标签的 $【多标签文本分类】《基于标签语义注意力的多标签文本分类》_文本分类_06$ ， $【多标签文本分类】《基于标签语义注意力的多标签文本分类》_文本分类_07$ 为"love"， $【多标签文本分类】《基于标签语义注意力的多标签文本分类》_文本分类_08$ 为"story"。然后把 $【多标签文本分类】《基于标签语义注意力的多标签文本分类》_文本分类_07$ 、 $【多标签文本分类】《基于标签语义注意力的多标签文本分类》_文本分类_08$ 送到Bi-LSTM模型里面得到向量，最后取平均值。

上述公式称之为：词向量平均函数。

3. 单词重要性学习

本模块的目的是，计算每个标签对某条文本中的每个词的“重要性”，即权重。

$【多标签文本分类】《基于标签语义注意力的多标签文本分类》_权重_03$ 与 $【多标签文本分类】《基于标签语义注意力的多标签文本分类》_分类_04$ 。此处单词重要性权重也会有正向与反向的权重 $【多标签文本分类】《基于标签语义注意力的多标签文本分类》_文本分类_13$ 与 $【多标签文本分类】《基于标签语义注意力的多标签文本分类》_权重_14$ 。其中： $【多标签文本分类】《基于标签语义注意力的多标签文本分类》_文本分类_15$ ， $【多标签文本分类】《基于标签语义注意力的多标签文本分类》_分类_16$ 。