什么是知识图谱
第一种解释:知识图谱本质上是语义网络(本体论)
第二种解释:知识图谱也叫做多关系图(multi-relational graph),由多种类型的节点和多种类型的边来组成。
右图即为多关系图,又称知识图谱。
构建知识图谱系统中所涉及到的技术
1.数据获取
- 数据爬取(爬虫)
- 数据库读取
2.数据预处理
- 数据清洗
- 知识抽取、消歧分析等
3.导入数据到知识图谱
- 数据筛选
- 知识图谱设计
- 批量导入
- 增量导入
4.应用层的搭建
- 各类模型搭建
- GraphX分布式处理
- 微服务
知识图谱的应用场景
- 风控知识图谱(做风险控制)
- 线上信贷的核心:风控。
通过图谱分析确定一个人的信誉,发现欺诈团体等。 - 证券知识图谱
- 一个事件发生了,可能导致哪些股票上涨或下跌,本质就是分析一个事件与股票或公司之间的关系,该关系可以从证券知识图谱中分析出来。
一个股票上涨了,有哪些股票也会随着上涨,可以从证券知识图谱中挖掘出公司与公司之间的关系。 - 教育知识图谱
- 用知识图谱来刻画知识点之间的先后关系。这类知识图谱可以结合一些算法诊断一个学生的学习情况
- 其他常见应用领域
搜索、聊天机器人、法律、医疗(这些领域目前处于比较初级的阶段)
知识图谱架构图
- 数据源
授权数据(个人信息等)(爬虫)、公开数据(爬虫)、三方数据(API)、业务数据