今天,全球有超过1000+企业都在使用“麒麟”(Apache Kylin)这只神兽,在 Hadoop 生态中,大家对它的认可度和赞誉都很高。Apache Kylin 是运行在 Hadoop 集群之上的应用服务,而 Hadoop 集群的部署又并非易事,那这是否就阻碍了我们探究 Apache Kylin 的步伐呢?答案是否定的,通过借助强大的虚拟技术,在本地就能体验到“麒麟”的魅力,那么接下来就让我们            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-19 00:00:26
                            
                                82阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            Kylin使用①新建一个Project②在工程中,连接Hive,选择感兴趣的表和库③从感兴趣的表和库,进行 建模(星型模型,雪花模型)④从建的模型中定义Cube⑤将定义的Cube执行运算(build)⑥Cube计算完毕,使用SQL进行查询1. 创建工程1)点击下图中的"+"。2)填写项目名称和描述信息,并点击Submit按钮提交。2. 获取数据源1)点击DataSource2)点击下图按钮导入Hi            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-24 07:17:52
                            
                                200阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            由eBay开源的一个大数据OLAP框架,2014年11月加入了Apache,项目名字也改成了“Apache Kylin”,Apache Kylin是唯一来自中国的Apache顶级开源项目,定位于在Hadoop平台之上实现传统数据仓库,商业智能的能力,提供交互式的,多维分析能力,并提供在传统数据仓库技术所不能做到的超大规模数据集的快速查询,并使用普通的PC硬件,而无需采购专用的,私有的一体机或者高端            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-03 08:07:35
                            
                                121阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            前言Kylin目前不仅仅支持Hive作为数据源构建cube,也可以支持使用外部jdbc作为数据源进行构建,比如使用MySQL数据源的时候会让我们下载sqoop安装包,本质上是使用sqoop全量同步我们要构建的MySQL数据,先加载到hive的临时表中,构建完成之后然后再清理。对于需要增量数据同步并进行构建的情况不太友好提示:以下是本篇文章正文内容,下面案例可供参考一、环境安装部署为了简化安装的环节            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-26 12:56:55
                            
                                168阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            # Kylin系统与Docker的结合
## 引言
Apache Kylin是一个开源的分布式分析引擎,用于处理大规模数据,支持超快速的SQL查询。随着大数据技术的快速发展,Kylin在数据分析和报表生成方面发挥了重要作用。为了简化Kylin的部署和管理过程,将其运行在Docker容器中成为了一个热门的解决方案。下面,我们将探讨Kylin系统与Docker的结合,并提供相应的代码示例和步骤。            
                
         
            
            
            
            # 如何在 Kylin 系统中使用 Python
## 介绍
Apache Kylin 是一个开源的分布式分析引擎,主要用于支持业务智能(BI)的大数据 OLAP。这篇文章将指导你如何在 Kylin 系统中通过 Python 进行数据操作,适合刚入行的小白。我们将通过一个具体的流程,详细介绍每一步的操作,包括代码示例和注释。
## 工作流程
以下是实现“在 Kylin 系统中使用 Pyth            
                
         
            
            
            
            工具/原料
easyBCD系统引导软件
Ubuntu kylin 15.10镜像包1. 分区在磁盘上新分配一块空间,20G以上(最好是40G)。  win10分区方式:右键点击“我的电脑”,选择“管理”命令。在打开的“计算机管理”窗口中,依次展开“计算机管理”→“存储”→“磁盘管理”项,选定一个盘符,右键点击压缩卷,就可以进行分区。2.安装easyBSD软件,拷贝ubuntu安装镜像文件把准备好的            
                
         
            
            
            
            文章目录Linux系统的安装1、安装一个VMware2、新建一个虚拟机Oracle的安装1、使用root用户登录安装Xmanager2、检查硬件要求3、检查软件要求再去挂载光盘镜像安装软件包4、系统组和用户5、检查内核参数1、共享内存2、 生效该内核参数3、资源限制6、检查需要的目录7、复制安装文件到系统从windows传输文件到linux系统登出root8、开始安装进行安装 Linux系统的安            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-25 19:42:04
                            
                                152阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            软件环境Hadoop: 2.7+, 3.1+ (since v2.5)Hive: 0.13 - 1.2.1+HBase: 1.1+, 2.0 (since v2.5)Spark (optional) 2.3.0+Kafka (optional) 1.0.0+ (since v2.5)JDK: 1.8+ (since v2.5)OS: Linux only, CentOS 6.5+ or Ubunt            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-13 21:22:52
                            
                                94阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            众所周知,Apache Kylin 的主要工作就是为源数据构建 N 个维度的 Cube,实现聚合的预计算。理论上而言,构建 N 个维度的 Cube 会生成 2n个 Cuboid, 如图 1 所示,构建一个 4 个维度(A,B,C, D)的 Cube,需要生成 16 个Cuboid。随着维度数目的增加,Cuboid 的数量会爆炸式地增长。为了缓解 Cube的构建压力,Apache Kylin 引入了            
                
         
            
            
            
            CDH安装Kylin2.0及操作第一步,安装1,安装包准备最新安装包版本为2.0,下载链接如下:http://kylin.apache.org/download/下载内容为apache-kylin-2.0.0-bin-cdh57.tar.gz,见下图:2,安装通过xftp上传下载的安装包apache-kylin-2.0.0-bin-cdh57.tar.gz到CDH集群的Region Server节            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-06 12:00:52
                            
                                164阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            每一个成功人士的背后,必定曾经做出过勇敢而又孤独的决定。放弃不难,但坚持很酷~HDP 版本:2.6.4.0Kylin 版本:2.5.1机器说明:三台 CentOS-7,8G 内存Kylin 的计算引擎除了 MapReduce ,还有速度更快的 Spark ,本文就以 Kylin 自带的示例 kylin_sales_cube 来测试一下 Spark 构建 Cube 的速度。一、配置Kylin的相            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-09 01:35:30
                            
                                65阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            # Kylin查看系统架构指南
Apache Kylin 是一个用于大数据分析的开源分布式分析引擎。要想在 Kylin 中查看系统架构,您需要按照一定流程进行。本文将详细指导您如何完成这一任务,包括步骤、代码示例及图表展示。
## 查看系统架构的流程
以下是查看 Kylin 系统架构的基本步骤:
| 步骤编号 | 步骤描述                       |
| -------            
                
         
            
            
            
            一、Kylin介绍1.1 现状    Hadoop于2006年初步实现,改变了企业级的大数据存储(基于HDFS)和批处理(主要基于MR)问题,10几年过去了,数据量随着互联网的发展井喷式增长,如何高速、低延迟的分析数据成为后续面临的挑战,辟如我们面临的一些质疑:Hadoop老矣,尚能饭否?    其中也出现过各种各样的框架来协助Hadoop降低访问数据的延迟            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-20 16:48:44
                            
                                21阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            在Kylin系统上安装Python是一项必要的技能,尤其是在使用数据分析、人工智能和自动化任务的时候。接下来,我将带你逐步完成这个安装过程,从环境准备到验证测试,以及可能出现的问题和解决方法。
## 环境准备
在开始安装之前,我们需要确保我们的软硬件环境符合要求。
### 软硬件要求
- **硬件**:
  - 处理器:至少双核
  - 内存:至少 2GB
  - 硬盘:至少 10GB 可            
                
         
            
            
            
            # Kylin系统安装MySQL指南
在大数据领域,Apache Kylin被广泛运用于OLAP(联机分析处理),而MySQL则是一个流行的关系数据库管理系统。本文将指导你如何在Kylin系统中安装和配置MySQL,确保你能够顺利完成这一过程。
## 整体流程
下面是安装MySQL的整体流程表:
| 步骤 | 描述                         |
|------|---            
                
         
            
            
            
            kylin的datasource配置 文章目录kylin的datasource配置parquet(decimal)kylin的datasourcekylin 配置获取kylin datasourceconnection 的代理对象生成构造方法invoke方法wait方法notify方法优化Datasource parquet(decimal)spark写parquet数据,decimal类型在hi            
                
         
            
            
            
            在共享磁盘上裸设备划分1.1分区规划磁盘大小1T,总共分为4个区。第1个分区放dcr分配大小10G,第二个分区放vote分配大小10G,第三个分区放log 日志磁盘组分配大小100G,剩下的全部给第四个分区放DATA 数据盘组。1.1.1 硬盘分区使用root登录进行分区:输入fdisk -l,查看设备名称输入fdisk /dev/mapper/mpathc-partc2) 依次输入 n ->            
                
         
            
            
            
            Kylin 社区于 2021 年 08 月 30 日发布 Apache Kylin 4.0.0高性能、低云上 TCO 的开源 OLAP 平台。Kylin 4 升级了架构,使 Kylin 的学习、部署、调优更加简单,也使得在云上的部署、扩容更加简单。如果你对技术架构的细节感兴趣的话,欢迎阅读我们的技术文章:https://kylin.apache.org/blog/2021/07/02/Apache            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-17 10:41:30
                            
                                76阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1 Kylin简介Kylin是 Apache开源的分布式分析引擎,提供Hadoop、Spark、Flink之上的的SQL查询接口和**多维分析(OLAP)**能力,支持超大规模数据。即席查询有两种:Kylin是 预计算。Presto是 基于内存1.1 OLAPOLAP(online analytical processing)是一种软件技术,使分析人员能够迅速、一致、交互的从各个方面观察讯息,OL            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-26 20:51:35
                            
                                137阅读
                            
                                                                             
                 
                
                                
                    