Kylin简介
kylin-是由中国团队研发的,是第一个真正的由中国人自己主导,从零开始,并成为Apache顶级的开源项目,在此发表感叹国货之光。
1.kylin与hive相比
• Hive的性能比较慢,支持SQL灵活查询,特别慢
• HBase的性能快,原生不支持SQL - phoenix:可以写sql语句来查询hbase!!
• Kylin是将先将数据进行预处理,将预处理的结果放在HBase中。效率很高•(将hive和hbase两个技术的优点结合到一起
2.为什么要使用Kylin
• Kylin 是一个 Hadoop 生态圈下的 MOLAP 系统,是 ebay 大数据部门从2014 年开始研发的支持 TB 到 PB 级别数据量的分布式 Olap 分析引擎。其特点包括:
• 可扩展的超快的 OLAP 引擎
• 提供 ANSI-SQL 接口
• 交互式查询能力
• MOLAP Cube 的概念
• 与 BI 工具可无缝整合
Hive的性能比较慢,支持SQL,HBase的性能快,原生不支持SQL。
Kylin是将先将数据进行预处理,将预处理的结果放在HBase中。效率很高(将hive和hbase两个技术的优点结合到一起)
使用场景
用Hive将HDFS文件数据以关系数据方式存取,数据量巨大,每天有数G甚至数十G的数据增量导入,有10个以内较为固定的分析维度
核心思想
Kylin 的核心思想是利用空间换时间
Kylin 是一个 Hadoop 生态圈下的 MOLAP 系统,支持SQL语句,提供交互式的查询能力(交互式:强调的是查询返回速度的效率高/快),Cube 的概念,支持标准的JDBC查询方式,与 BI 工具可无缝整合。
联机事务处理OLTP、联机分析处理OLAP。
OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
联机分析处理的用户是企业中的专业分析人员及管理决策人员,他们在分析业务经营的数据时,从不同的角度来审视业务的衡量指标是一种很自然的思考模式。例如分析销售数据,可能会综合时间周期、产品类别、分销渠道、地理分布、客户群类等多种因素来考量。
Kylin的总体架构
Kylin 依赖于 Hadoop、Hive、Zookeeper 和 Hbase
这篇大概讲述kylin的特点及架构,下一篇会说到kylin配置和我所遇到的一些问题