DDL:data definittion language  数据定义语言   主要是定义或改变表的结构、数据类型、表之间的链接和约束等初始化操作 DML:data manipulation language  数据操作语言   主要是对数据库的数据进行增删改查操作,如select、insert、delete、update等
转载 2023-07-12 10:24:32
76阅读
HIVE分区(partitions)分区主要用于提高性能 分区列的值将表划分为很多segments(文件夹) 查询时使用分区列和常规列类似 查询时HIVE自动过滤不用与提高性能的分区分区主要分为静态分区和动态分区HIVE分区操作静态分区:create table mypart( userid int, username string, gender string, score int
转载 2023-07-10 23:31:23
65阅读
排序1、order by——全局排序2、sort by——内部排序3、distribute by——分区排序4、cluster by 排序在一些业务场景中是不可缺少的一步,而Hive中支持的排序方式有四种,区别和应用场景又是什么呢?下面一起来探讨一下吧! order bysort bydistribute bycluster by1、order by——全局排序作用:对数据进行全局排序,只在一个
# HDFS和Hive的介绍和使用 ## 引言 在大数据领域,处理海量数据是一项重要的任务。在这个领域中,Hadoop生态系统提供了许多强大的工具和框架来管理和处理这些海量数据。其中,HDFS和Hive是最为常用和重要的工具之一。本文将介绍HDFS和Hive的概念、原理和使用方法,并通过代码示例进行演示。 ## HDFS概述 HDFS(Hadoop Distributed File Syste
原创 2023-08-26 05:07:22
122阅读
文章目录参考分布式文件系统定义各类系统对比图各类文件系统简介shepdogshepdog基本架构CephFastDFSfastDFS介绍Tracker server 追踪服务器Storage server 储存服务器客户端Client读写操作:写入数据下载文件 分布式文件系统定义分布式文件系统(Distributed File System,DFS)是指文件系统管理的物理存储资源不一定直接连接在
注:技术交流可以加我VX:k-loop,昵称:默读者。1,创建用户表   create table tmp_user( uid string comment'用户ID', name string comment'用户名' )comment'用户表' ; 插入测试数据   insert into tmp_user(uid,name) values('A','理
转载 2024-03-11 06:22:54
63阅读
使用分布式文件系统 (DFS),系统管理员可以使用户方便地访问和管理物理上分布在网络各处的文件。通过 DFS,可以使分布在多个服务器上的文件如同位于网络上的一个位置一样显示在用户面前。您可采用两种方式实施分布式文件系统:一种是独立的根目录分布式文件系统,另一种是域分布式文件系统。独立的 DFS 根目录:不使用 Active Directory。 至多只能有一个根目录级别的目标。 使用文件复制服务不
转载 2009-01-18 13:10:22
2744阅读
目录0 引言1 CTE 的使用1 命令格式2 示例3 CTE作用 小结0 引言 Hive with 语句该子句紧跟在SELECT或INSERT关键字之前,可以在Hive SELECT,INSERT,  CREATE TABLE AS SELECT或CREATE VIEW AS SELECT语句中使用一个或多个CTE 。union等集合操作中。&nb
转载 2023-08-25 22:57:29
4304阅读
# Hive 版本与 DFS 命令的支持情况 在学习 Apache Hive 的过程中,了解不同版本的变更和支持的命令是非常重要的。特别是,某些命令在新版中可能被废弃,这对日常开发具有直接影响。本文将指导你,如何查询 Hive 哪个版本开始不支持 `dfs` 命令的。我们会通过制定流程步骤来帮助你理解,每个步骤都会配上需要用到的代码示例,并对其进行详细解释。 ## 过程概述 我们将用以下步骤
原创 2024-08-05 07:20:54
7阅读
# Java不使用递归实现深度优先搜索(DFS) 深度优先搜索(DFS)是一种用于遍历或搜索树或图的算法。通常,DFS是通过递归的方式实现的,但在某些情况下,我们可能希望使用非递归的方法。本文将讨论在Java中如何实现无递归的DFS。 ## 什么是深度优先搜索? 深度优先搜索是一种遍历图形结构的方法,对于每一个节点,它会尽可能深地探索每一个分支,当该分支完全探索完后,退回到上一个节点并继续其
原创 10月前
77阅读
Hive是一个开源的数据仓库基础设施工具,它构建在Hadoop之上,用于处理大规模的结构化和半结构化数据。Hive提供了类似于SQL的查询语言,称为HiveQL,使得可以用类似于传统数据库的方式来查询和分析数据。 ### Hive的基本概念和组件 在深入了解Hive如何使用之前,让我们先了解一些基本概念和组件。 - **HiveQL**:HiveQL是Hive的查询语言,它类似于SQL。通过
原创 2024-01-30 06:31:34
52阅读
词法、语法解析模块会先介绍一下antlr环境(上)。然后举实际案例说明怎么使用antlr工具、利用antlr生成的Lexer、Parser、TreeParser代码,获取asttree。这些都是hive获取asttree的过程,理解了这些,再理解hive的asttree就很容易了(中)。 最后 详细介绍hive词法、语法解析的源码 以及hive AstTree的使用 (下) 1、什么是
hive基本使用
原创 2017-05-21 08:30:32
340阅读
package Main;import java.sql.SQLException;import java.sql.Connection;import java.sql.ResultSet;import java...
转载 2019-03-22 09:42:00
73阅读
2评论
# 如何使用Hive的WITH语句 ## 1. 概述 在Hive中,使用WITH关键字可以创建临时表,方便我们在查询中多次引用这个临时表。对于刚入行的小白来说,掌握这个功能可以提高查询效率和简化代码逻辑。 ## 2. 实现步骤 下面是使用WITH语句的一般流程,我们可以通过表格展示每个步骤: ```mermaid journey title 使用Hive的WITH语句流程 s
原创 2024-03-10 06:06:40
234阅读
Java中的图形:深度优先搜索(DFS)   介绍图形是存储某些类型的数据的便捷方法。该概念是从数学移植而来的,适合于计算机科学的需求。由于许多事物可以用图形表示,因此图形遍历已成为一项常见的任务,尤其是在数据科学和机器学习中。Java中的图用代码表示图深度优先搜索(DFS)广度优先搜索(BFS)Dijkstra的算法深度优先搜索深度优先搜索(DFS)沿一个分支尽可能远地搜
文章目录一、启动hive1. hive启动的前置条件2. 启动方式一: hive命令3. 方式二:使用jdbc连接hive二、Hive常用交互命令1. hive -help 命令2. hive -e 命令3. hive -f 命令4. 退出hive窗口5. 在hive窗口中执行dfs -ls /;三、Hive语法1.DDL语句1.1 创建数据库1.2 两种方式查询数据库1.3 显示数据库信息1.
转载 2024-06-21 13:47:35
86阅读
前言Hive是一个基于Hadoop的数据仓库基础架构,它提供了一种类SQL的查询语言,称为HiveQL,用于分析和处理大规模的结构化数据。Hive的主要特点包括:可扩展性:Hive可以处理大规模的数据,支持高性能的并行化执行。数据抽象:Hive将数据抽象为表,可以通过HiveQL进行查询和分析。它支持表的分区、桶和索引,以提高查询性能。扩展性:Hive支持用户自定义函数(UDFs)和用户自定义聚合
文章目录hql的执行流程1、建库2、查询数据库3、删除数据库4、切换数据库5、查看数据库里面的表6、添加表创建内部表(Managered_Table)创建外部表(External_Table)外部表与内部表对比※※※:创建分区表1、分区表的实质2、二级分区:3、创建结构相同的表:4、建表的同时插入数据(把查询结果保存在一张表中)5、存储为不同格式创建分桶表分区表和分桶表的对比※※※:7、删除表8
转载 2023-07-12 20:34:08
112阅读
1,前言书接上回,接着对上一个hive安装后环境下的hive使用。 
转载 2023-06-14 21:50:09
73阅读
  • 1
  • 2
  • 3
  • 4
  • 5