Apache软件基金会最近宣布:TinkerPop 升级为顶级项目


TinkerPop 是一个图计算框架,用来进行实时的事务型处理,和批量的图分析,包含了一系列以 Gremlin 引擎为核心的子项目和模块


是一种描述数据存储结构的方式,比如键值对结构,也是存储数据的一种方式,只是图结构更为复杂


图是由顶点组成的,点和边各自都可以包含任意多个键值对形式的属性


是用来描述离散的对象,例如 人、地点、事件


是对点之间关系的描述,例如,一个人可以认识另一个人、一个人参与了某件事、一个人在某个地方


属性描述了点和边的信息,例如,一个点包含属性:名称、年龄,一个边包含属性:时间戳


点、边、属性 就构成了一个图,是 TinkerPop 的基本数据结构


Apache新的顶级项目 TinkerPop_java


图计算已经有了丰富的历史,他有查询语言,和复杂的算法,例如 路径分析、点的类聚、排序、子图识别 ……


正是因为图具有灵活的数据结构,并包含了丰富的复杂算法,所以图结构被广泛应用于数据挖掘、数据分析


TinkerPop 不仅适用于单机中的小型图,也可以工作在多机计算集群中的海量图,像 DataStax 和 IBM 等大型组织都在使用,Amazon 最近在使用 TinkerPop 处理他的订单图谱,这个规模非常大,含有万亿数量级的边


TinkerPop 的图处理引擎 Gremlin 非常强大,并支持非常多的开发语言,例如 Python, JavaScript, Scala, Go,选择自己熟悉的语言,即可运行图的遍历处理


TinkerPop 升级为顶级项目意味着Apache会对其注入更多的资源和关注,由更加精英化的流程来管理,所以,值得多熟悉一下 TinkerPop,有可能不久之后他会成长为一个非常流行的框架