什么是知识图谱

第一种解释:知识图谱本质上是语义网络(本体论)
第二种解释:知识图谱也叫做多关系图(multi-relational graph),由多种类型的节点和多种类型的边来组成。

知识图谱能用关系型数据库_大数据


右图即为多关系图,又称知识图谱。

构建知识图谱系统中所涉及到的技术

1.数据获取

  • 数据爬取(爬虫)
  • 数据库读取

2.数据预处理

  • 数据清洗
  • 知识抽取、消歧分析等

3.导入数据到知识图谱

  • 数据筛选
  • 知识图谱设计
  • 批量导入
  • 增量导入

4.应用层的搭建

  • 各类模型搭建
  • GraphX分布式处理
  • 微服务

知识图谱的应用场景

  • 风控知识图谱(做风险控制)
  • 知识图谱能用关系型数据库_知识图谱能用关系型数据库_02

  • 线上信贷的核心:风控。
    通过图谱分析确定一个人的信誉,发现欺诈团体等。
  • 证券知识图谱
  • 知识图谱能用关系型数据库_微服务_03

  • 一个事件发生了,可能导致哪些股票上涨或下跌,本质就是分析一个事件与股票或公司之间的关系,该关系可以从证券知识图谱中分析出来。
    一个股票上涨了,有哪些股票也会随着上涨,可以从证券知识图谱中挖掘出公司与公司之间的关系。
  • 教育知识图谱
  • 知识图谱能用关系型数据库_知识图谱能用关系型数据库_04

  • 用知识图谱来刻画知识点之间的先后关系。这类知识图谱可以结合一些算法诊断一个学生的学习情况
  • 其他常见应用领域
    搜索、聊天机器人、法律、医疗(这些领域目前处于比较初级的阶段)

知识图谱架构图

  • 数据源
    授权数据(个人信息等)(爬虫)、公开数据(爬虫)、三方数据(API)、业务数据