速览EMNLP 2020上录取的知识图谱相关论文

转载

夕小瑶谈人工智能 2023-05-01 12:13:55

文章标签 机器学习人工智能知识图谱深度学习自然语言处理 文章分类 Html/CSS 前端开发

文 | 泽宇

前不久，自然语言处理领域三大顶会之一的 EMNLP 2020 发布了论文录取的结果。在EMNLP 2020论文正式出版之前，泽宇搜集了目前Arxiv上已经发布出来的录取在EMNLP 2020上所有和知识图谱相关的论文，下面我们就一起来一睹为快。

1. 知识图谱嵌入（表示学习）

AutoETER: Automated Entity Type Representation for Knowledge Graph Embedding

Authors: Guanglin Niu, Bo Li, Yongfei Zhang, Shiliang Pu, Jingyang Li

论文地址：

https://arxiv.org/pdf/2009.12030

内容简介： 知识图谱表示学习领域的研究，一作是北航的Guanglin Niu。本文将知识图谱中实体-关系-实体的三元组扩展到实体类型-关系-实体类型的类型相关的三元组，提出能够自动化学习实体类型的向量表示的AutoETER模型，并给出建模和推理对称、逆反、传递关系的理论证明，同时能够解决1-N，N-1和N-N这类复杂关系的推理问题。特别的，论文中提出的AutoETER是一个可适配于任意知识图谱表示学习模型的可插播模块，用于提供实体类型表示并进一步提升原有知识图谱表示学习模型的性能。在四个不同数据集上的实验结果表明本文提出的AutoETER方法的有效性和先进性。实验中还给出了可视化分析，可以直观看出实体类型表示的聚类效果明显优于实体表示的聚类效果，说明了实体类型表示的有效性。

Knowledge Association with Hyperbolic Knowledge Graph Embeddings

Authors: Zequn Sun, Muhao Chen, Wei Hu, Chengming Wang, Jian Dai, Wei Zhang

论文地址：

https://arxiv.org/pdf/2010.02162

内容简介： 这篇论文同样是知识图谱表示学习领域的研究，一作是南京大学的Zequn Sun。传统的知识图谱表示学习模型依赖于较高的嵌入尺寸来实现足够的表现力。与此不同，这篇论文使用低维双曲嵌入来探索知识关联。通过提出用于知识图谱嵌入的双曲关系图神经网络，并利用双曲变换取得知识关联。关于实体对齐和实体类型推理的大量实验证明了本文方法的有效性。

Evaluating the Calibration of Knowledge Graph Embeddings for Trustworthy Link Prediction

Authors: Tara Safavi, Danai Koutra, Edgar Meij

论文地址：

https://arxiv.org/pdf/2004.01168

内容简介： 当前，很少去评估知识图谱表示学习模型所做预测的可信赖性。本文首先根据标准的封闭世界假设进行评估，在该假设中，知识图谱中尚未出现的预测三元组被认为是错误的，并表明在这种（通用但狭窄的）假设下，现有的校准技术对知识图谱表示学习有效。接下来，在更现实但更具挑战性的开放世界假设中，只有取得实实在在的标签，才能将未观察到的预测视为真或假。论文中表明，在开放世界假设下，现有的校准技术远不如在封闭世界假设中有效，并提供了这种差异的解释。本文进行了人与AI协作的独特案例研究，显示了经过校准的预测可以提高知识图谱补全任务的效果。

2. 结合知识图谱的对话、问答和文本生成

GraphDialog: Integrating Graph Knowledge into End-to-End Task-Oriented Dialogue Systems

Authors： Shiquan Yang, Rui Zhang, Sarah Erfani

论文地址：

https://arxiv.org/pdf/2010.01447

内容简介： 本文利用知识图谱中以及对话的依存关系分析树中的图结构信息来提高端到端面向任务的对话系统的性能。为了有效地利用对话历史中的结构信息，本文提出了一种新的循环单元结构，该结构允许在图上进行表示学习。为了利用知识图谱中的实体之间的关系，该模型结合了基于图结构的多跳推理能力。实验结果表明，在两个不同的面向任务的对话数据集上，所提出的模型取得了优于最新模型的一致改进。

Scalable Multi-Hop Relational Reasoning for Knowledge-Aware Question Answering

Authors:Yanlin Feng, Xinyue Chen, Bill Yuchen Lin, Peifeng Wang, Jun Yan, Xiang Ren

论文地址：

https://arxiv.org/pdf/2005.00646

内容简介： 知识库问答领域的研究，一作是北大的Yanlin Feng。现有的利用知识图谱增强问答模型的工作要么难以有效地建立多跳关系，要么在模型的预测原理上缺乏透明度。本文提出了一种新颖的知识感知方法，该方法为预训练语言模型（PTLM）配备了多跳关系推理模块，称为多跳图关系网络（MHGRN）。它对从知识图谱提取的子图执行多跳，多关系推理。所提出的推理模块统一了基于路径的推理方法和图神经网络的方法，以实现更好的可解释性和可扩展性。

Language Generation with Multi-Hop Reasoning on Commonsense Knowledge Graph

Authors: Haozhe Ji, Pei Ke, Shaohan Huang, Furu Wei, Xiaoyan Zhu, Minlie Huang

论文地址：

https://arxiv.org/pdf/2009.11692

内容简介： 结合常识知识的文本生成领域的研究，一作是清华的Haozhe Ji。利用知识图谱的结构和语义信息可促进常识性文本生成。在本文中，作者提出了使用多跳推理流程（GRF）进行生成的方法，该方法可以在从外部常识知识图谱中提取的多关系路径上启用带有动态多跳推理的预训练模型。实验结果表明在需要推理常识性知识的三个文本生成任务上，本文提出的模型优于现有基准模型。同时，通过模型推断出的推理路径为文本生成提供了可解释性。

3. 知识图谱嵌入相关的负采样、超关系和数据集

Structure Aware Negative Sampling in Knowledge Graphs

Authors: Kian Ahrabian, Aarash Feizi, Yasmin Salehi, William L. Hamilton, Avishek Joey Bose

论文地址：

https://arxiv.org/pdf/2009.11355

内容简介： 知识图谱嵌入模型普遍是使用对比估计来学习知识图谱中的实体和关系的低维表示。由于知识图谱中只存在正样本，因此对比学习方法的一个关键是选择产生负样本的分布，这将迫使嵌入模型学习判别式表示并找到观测数据的关键特征。本文提出了一种结构感知的负采样（SANS），这是一种廉价的负采样策略，不需要其他参数，也不需要困难的对抗性优化，而是通过从节点的k跳邻域中选择负采样来利用丰富的图结构。实验证明SANS可以找到与SOTA方法具有高度竞争力的高质量负样本。

Message Passing for Hyper-Relational Knowledge Graphs

Authors: Mikhail Galkin, Priyansh Trivedi, Gaurav Maheshwari, Ricardo Usbeck, Jens Lehmann

论文地址：

https://arxiv.org/pdf/2009.10847

内容简介: 超关系知识图谱（例如Wikidata）可将其他键值对与主要三元组关联起来以消除歧义或对一个事实在不同情况下的有效性进行约束。在这项工作中，我们提出了一种基于消息传递的图编码器-StarE，它能够对这种超关系知识图谱进行建模。与现有方法不同，StarE可以编码任意数量的附加信息以及主要三元组，同时保留限定符和三元组的语义不变。论文中证明现有的用于评估超关系知识图谱补全性能的benchmark存在缺陷，因此构建了基于Wikidata的新数据集WD50K。实验表明StarE在多个基准测试中均优于现有方法。

CoDEx: A Comprehensive Knowledge Graph Completion Benchmark

Authors: Tara Safavi, Danai Koutra

论文地址：

https://arxiv.org/pdf/2009.07810

内容简介： 本文构建了一个新的用于知识图谱补全的benchmark数据集CoDEx，其是从Wikidata和Wikipedia中提取的，可以更为全面有效的评价知识图谱补全的性能。CoDEx包括三个大小和结构各异的知识图谱，实体和关系的多语言描述。论文中给出了在CoDEx上五个经过广泛使用的知识图谱嵌入模型的链接预测和三元组分类的结果。

数据，代码和预训练模型的github地址：

https://github.com/tsafavi/codex。

4. 知识图谱中的事件抽取

Biomedical Event Extraction on Graph Edge-conditioned Attention Networks with Hierarchical Knowledge Graphs

Authors: Kung-Hsiang Huang, Mu Yang, Nanyun Peng

论文地址：

https://arxiv.org/pdf/2009.09335

内容简介： 本文属于知识图谱构建中的事件抽取领域。生物医学事件抽取对于理解科学语料库中描述的生物分子相互作用至关重要。本文通过Graph Edge-conditioned的注意力网络（GEANet）和分层图表示，将来自统一医学语言系统（UMLS）的领域知识合并到预先训练的语言模型中。为了更好地识别触发词，首先基于来自UMLS的联合建模的层次知识图谱，将每个句子ground to句子图谱上。然后，grounded graph由GEANet传播，GEANet是一种新颖的图神经网络，用于增强推断复杂事件的能力。在BioNLP 2011 GENIA事件抽取任务上，本文提出的方法显示出显著的性能提升。

Edge-Enhanced Graph Convolution Networks for Event Detection with Syntactic Relation

Authors: Shiyao Cui, Bowen Yu, Tingwen Liu, Zhenyu Zhang, Xuebin Wang, Jinqiao Shi

论文地址：

https://arxiv.org/pdf/2002.10757

内容简介： 本文同样属于事件抽取领域，一作是来自中科院信工所的Shiyao Cui。事件检测是信息抽取的关键子任务，旨在识别文本中特定事件类型的实例。本文提出了一种名为边增强的图卷积网络（EE-GCN），该网络同时利用句法结构和类型标签信息来执行事件检测。特别的，本文中设计的边感知节点更新模块和节点感知边更新模块相互补充，并且以相互促进的方式工作。通过对广泛使用的ACE2005数据集进行了实验，结果表明，与竞争性基准方法相比，本文方法有明显改进。

5. 知识图谱推理

Learning Collaborative Agents with Rule Guidance for Knowledge Graph Reasoning

Authors: Deren Lei, Gangrong Jiang, Xiaotao Gu, Kexuan Sun, Yuning Mao, Xiang Ren

论文地址：

https://arxiv.org/pdf/2005.00571

内容简介： 本文属于知识图谱多跳推理领域，一作是来自南加州的Deren Lei。基于强化学习的知识图谱推理具有可解释性的优势。但是，遍历知识图谱提供的稀疏奖励信号通常不足以指导复杂的强化学习模型。一种替代方法是使用传统的符号方法，其实现了良好的性能，但是由于符号表示的限制而可能难以概括。本文提出了一种结合规则的知识图谱多跳推理模型RuleGuider，其利用基于符号的方法生成的高质量规则为基于游走的代理提供奖励监督。在基准数据集上进行的实验表明，RuleGuider在不损失可解释性的情况下提高了基于游走的模型的性能。