记知识图谱学习(二) DAY 3
上一章记到知识图谱的体系架构,一个大规模的知识库的构建与应用需要多种信息处理技术的支持,而上回提到的知识提取、知识融合、知识推理以及知识表示便是其中必不可少的技术。

知识抽取(知识提取)

知识抽取即是从各类数据源中提取出实体、关系、属性等知识要素,并以此为基础形成一系列事实,为模式层的构建奠基。
它可以从一些公开的半结构化或非结构化数据中提取知识要素。抽取有三个主要工作:
a.实体抽取NER—实体是知识图谱中最基本的元素,其抽取结果直接影响到知识库的质量,所以实体抽取也是知识抽取中最为基础、关键的一步;b.关系抽取—为了解决实体间语义链接的问题;c. 属性提取—属性是对实体的完整勾画,亦可看成是实体与属性值之间的一种名称性关系,即又可转化成关系抽取问题。

知识融合

即知识组织,消除实体、关系、属性等指称项与事实对象之间的歧义,达到数据、信息、方法、经验以及人的思想的融合,以此提高知识库质量。其中知识更新是重要部分,使知识库不断扩充以适应不断进步的时代。

知识推理

指从知识库中已有的实体关系数据出发,经过计算机推理,建立实体间的新关联,从而拓展和丰富知识网络,包括基于逻辑的推理和基于图的推理。

知识表示

将实体的语义信息表示为稠密低维实值向量,用通俗的话说便是用关系图来表示知识库中的知识要素,进而可在低维空间中高效计算实体、关系及其之间的复杂语义关联。

知识抽取NER的schema 知识抽取的关键技术是?_知识抽取NER的schema


(相关知识参考知乎《什么是知识图谱》以及中fufu_good《知识图谱》)