Hadoop下载+安装+配置声明:此文章经过多次修改,初始为Hadoop-2.7.1版本,后改为Hadoop-2.6.0版本,文中出现的截图中有Hadoop-2.7.1请视为Hadoop-2.6.0!1.选择Hadoop版本并下载在Hadoop下载前请参考Hadoop和Hbase的版本匹配表,提前考虑好需要下载安装的版本。          Hadoop version support matri
转载 2023-12-02 11:53:51
43阅读
# Persto Hive:查询结果每次都会变化 在数据分析和处理过程中,我们经常会使用数据库来存储和查询数据。在数据库中,我们可以通过查询语句来检索需要的数据。然而,有些时候我们可能会遇到一个问题,即相同的查询语句在不同的时间执行时,返回的结果却不相同。这种情况可能让人感到困惑,特别是在需要结果稳定的场景下。 今天我们要介绍的是一种名为Persto Hive的数据库,它的特点就是查询结果每次
原创 2024-07-06 05:00:44
29阅读
大数据体系架构:Spark内存计算与传统MapReduce区别:SparkSQL与Hive的区别:SparkSQL替换的是Hive的查询引擎,Hive是一种基于HDFS的数据仓库,并且提供了基于SQL模型的,针对存了大数据的数据仓库,进行分布式交互查询的查询引擎,所以SparkSQL暂时并不能完全替代Hive,实际上,在生产环境中,SparkSQL也是针对Hive数据仓库中的数据进行查询,Spar
转载 2023-09-20 06:26:32
163阅读
集成Swagger及常用注解使用方法一、前言二、SpringBoot项目集成swagger1. 引入依赖2. 编写配置文件3. 启动访问页面三、SpringBoot项目集成swagger-bootstrap-ui1.引入依赖2.配置资源处理规则3.启动访问页面四、Swagger常用注解介绍1.Swagger2Config中相关swagger注解2.controller中相关swagger注解3.
一  mysql8概述在研究mysql8新特性的时候,越来越感觉mysql8朝sql server看齐。看来对于中小型企业级应用也挺有兴趣,但是没有企业级的应用套件,有知道的麻烦告知。本文不探讨mysql8的结构变化,函数变化,以及新增的功能。仅仅阐述下mysql8在sql语法上与标准sql的一点点区别,作为研究mysql系列文章的开篇二  mysql8sql与标准sql的些许
Hive架构: Hive基础 Hive基础 1 概念 1 概念 1.1 简介 1.1 简介 1.1.1 hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表, 并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。--OLAP 1.1.1
原创 2021-07-26 17:34:37
1774阅读
1、Hive安装地址 1.Hive官网地址 http://hive.apache.org/ 2.文档查看地址 https://cwiki.apache.org/confluence/display/Hive/GettingStarted 3.github地址 https://github.com/apache/hive2、Hive安装...
原创 2022-05-16 09:30:21
299阅读
文章目录一、环境准备二、Hive 查询1、普通查询2、别名查询3、限定查询4、多表ype) 5 个字段,字符类型为..
原创 2022-08-12 10:39:51
572阅读
# 升级 Hive Hive 是一个基于 Hadoop 的数据仓库工具,它提供了类似于 SQL 的查询语言 HiveQL,允许用户使用类似于 SQL 的语法来分析和处理大规模的数据。 随着技术的发展,Hive 也在不断演进,推出了新版本以提供更好的性能和功能。在本文中,我们将讨论如何升级 Hive,以及一些常用的升级技巧和注意事项。 ## 1. 升级前的准备工作 在升级 Hive 之前,我
原创 2023-08-19 05:16:32
320阅读
# Hive同步Hive:数据仓库之旅 在大数据时代,Hive作为一个在Hadoop生态系统中的数据仓库工具,帮助我们对海量数据进行分析与管理。随着数据应用的不断扩展,数据同步成为了一个重要的课题。本文将介绍Hive同步Hive的过程,并提供代码示例。 ## 什么是Hive同步HiveHive同步Hive是指将一个Hive表中的数据同步到另一个Hive表中。这个过程可能会涉及到多个数据源
原创 9月前
96阅读
公用表表达式(CTE)是从WITH子句中指定的简单查询派生的临时结果集(会把查询的表数据放到内存中,供其他查询随时使用),该子句紧跟在SELECT或INSERT关键字之前。CTE仅在单个语句的执行范围内定义。可以在Hive SELECT,INSERT,CREATE TABLE AS SELECT 或 CREATE VIEW AS SELECT 语句中使用一个或多个CTE 。  
转载 2023-05-27 15:07:25
274阅读
注:技术交流可以加我VX:k-loop,昵称:默读者。1,创建用户表   create table tmp_user( uid string comment'用户ID', name string comment'用户名' )comment'用户表' ; 插入测试数据   insert into tmp_user(uid,name) values('A','理
转载 2024-03-11 06:22:54
63阅读
查询语句语法:[WITH CommonTableExpression (, CommonTableExpression)*] (Note: Only available starting with Hive0.13.0)SELECT [ALL | DISTINCT] select_expr, select_expr, ...FROM table_reference[W...
原创 2022-05-16 09:29:14
2549阅读
Hive uses log4j for logging. By default logs are not emitted to the console by the CLI. The default logging level is WARN for Hive releases prior to 0
原创 2021-08-07 18:34:07
4940阅读
hive的调优优化的主要考虑方面:环境方面:服务器的配置、容器的配置、环境搭建具体软件配置参数:代码级别的优化优的主要原则: 20/80原则非常重要,简单的说80%的程序时间执行时间花费在20%的代码上,所以重点就先要 找到这关键的20%代码做重点优化.1.explain 和 explain extendedexplain : 只有对hql语句的解释。explain extended:对hql语句
转载 2023-11-03 10:34:46
141阅读
Hive架构1)用户接口:命令行工具;启动方式:hive 或者 hive --service cli通过Thrift对外提供服务,默认端口是10000;启动方式:hive --service hiveserver   WEBUI(浏览器访问hive):通过浏览器访问hive,默认端口是9999;启动方式:hive --service hwi 2)元数据存储(Metastore)
转载 2023-09-02 16:12:37
242阅读
Hive简介          Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能,Hive底层是将SQL语句转换为MapReduce任务运行(类似于插件Pig\impala\Spark Sql)为什么使用HIVE直接使用 Hadoop 所面临的问题:人员学习成本太高项目周期要求
原创 2021-09-29 16:20:08
2145阅读
一. 数据仓库架构设计数据仓库的主要工作就是ETL,即是英文 Extract-Transform-Load 的缩写,用来描述数据从来源端经过装载(load)、抽取(extract)、转换(transform)至目的端的过程。数据仓库架构设计,即为公司针对自身业务场景实现的水平分层、垂直分主题的数据仓库构建过程的顶层设计。1. 数据架构架构原则:先水平分层,再垂直分主题域。数据架构分三层源数据落地区
原创 2021-10-24 17:59:00
987阅读
1. 求累计频数SELECT ioverduedays, sum(overdue_num) AS overdue_num, SUM(SUM(overdue_nRECEDING A...
原创 2022-08-04 17:30:04
232阅读
前言 公用表表达式(CTE)是从WITH子句中指定的简单查询派生的临时结果集(会把查询的表数
原创 2022-11-03 14:44:12
1073阅读
  • 1
  • 2
  • 3
  • 4
  • 5