文章目录
一、概念
以结构化形式,描述客观世界中存在的概念、实体、以及实体之间关系。因此,知识图谱是这样一类知识表示和应用技术的总称。
在典型的知识图谱中,每个实体或概念用一个 ID来标识,称为标识符。实体通过若干属性来刻画内在特性,实体之间通过多种关系来链接。所有实体相互关联,形成“图”。
发展历史:
二、典型的知识图谱
1.CYC知识库
2.WordNet
3.ConceptNet
4.HowNet
5.openHowNet
6.在线百科全书wikipedia
7.Wikidata
8.DBpedia
9.YAGO
10.BabelNet
11.哈工大:大词林
12.openKG.cn 中文开放知识图谱计划
三、知识图谱技术和应用
1.概况:
1.1知识图谱构建技术:
涉及三个核心问题:
– 实体识别问题:如何获取文本中实体?
– 实体关系学习:如何获取两个实体之间的关系?
– 事件学习:如何获取特定事件中多个实体之间的关系?
注:
实体识别通常要解决两个问题:
– 实体边界识别:判断实体的确切边界,如:“中华人民共和国” 是一个完整的实体,如得到“人民共和国”则边界缺失。
– 实体类型识别:通常包括时间、数字、人名、地名、机构名等类型。
实体识别的主要难点在于实体表达不规律、在特定领域中实体边界不易识别。
1.2知识图谱推理技术:
1.基于符号的推理
2.基于机器学习的推理
1.3知识图谱应用:
1.语义搜索
2.基于知识的问答
总结