paddlenlp 模型实体关系抽取实体关系抽取方法

转载

蓝月亮 2023-10-10 14:51:53

文章标签 paddlenlp 模型实体关系抽取人工智能知识图谱深度学习中文分词 文章分类 NLP 人工智能

实体关系抽取方法

wujietao的第1篇CSDN博客

文章目录

实体关系抽取方法

1 思维导图
2 阅读笔记

2.1 名词概念
2.2 关系抽取常用工具
2.3 联合学习

论文链接：

实体关系抽取方法研究综述_李冬梅

1 思维导图

paddlenlp 模型实体关系抽取实体关系抽取方法_知识图谱

2 阅读笔记

2.1 名词概念

信息抽取：主要包括３项子任务：实体抽取、关系抽取和事件抽取。

2.2 关系抽取常用工具

NLTK：NLTK是一个基于脚本语言Python开发的自然语言处理工具包，该工具包具有免费、开源等特点，并集成了中文分词、词形还原、文本分类以及语义推理等一系列文本处理技术，并涉及50多种语料库和词汇资源的交互界面。
DeepDive：它是一种新型数据管理系统，可以在单个系统中解决提取、集成和预测问题．相对于其他关系抽取工具，DeepDive使研究者关注重点在实体关系之间的特征而不是具体的算法，这有效地减轻了研究者的工作负担。
StandardCoreNLP：该工具包由众多语法分析工具集成，提供多种编程语言的接口，能实现对任意自然语言文本进行分析．该工具包为研究者提供了许多基础性的工具，如词性标记器（POS）、命名实体识别器（NER）、解析器、共参考分辨率系统、情感分析、自举模式学习和开放信息提取等。
中文分词工具：结巴分词（jieba）、清华分词（THULAC）、中国科学院计算技术研究所分词（NLPIR）、哈尔滨工业大学分词（LTP）等是国内常见中文分词的工具．这些工具对文本数据进行预处理，将字序列切分成具有语言含义的词序列，便于对中文领域的文本进行关系抽取。
LTP-Cloud：LTP-Cloud以哈工大社会计算与信息检索研究中心研发的“语言技术平台（LTP）”为基础，为用户提供高效精准的中文自然语言处理云服务．LTP-Cloud支持跨平台、跨语言编程等，并提供了一整套自底向上的丰富、高效、高精度的中文自然语言处理模块应用程序接口和可视化工具等。