目录一.前言二.hive的启动与连接2.1 启动hadoop2.2 启动hive2.3 一些注意事项一.前言        太久没用hive了,今天想重新熟悉一下,结果发现自己甚至忘记了怎么启动。。于是特此记录篇笔记,便于以后忘记时查阅,不会写的太细。     &nbs
转载 2023-09-01 08:40:37
183阅读
前言文本已收录至我的GitHub仓库,欢迎Star:https://github.com/bin392328206/six-finger种一棵树最好的时间是十年前,其次是现在叨絮hadoop 完成之后,就是hive了。。今天我们就来看看hive小六六学大数据之 Hadoop(一)小六六学大数据之 Hadoop(二)什么是 HiveHive:由 Facebook 开源用于解决海量结构化日志的数据统计
# Hive 连接 Hadoop 的详细解析 Apache Hive 是一个数据仓库工具,用于处理存储在 Hadoop 分布式文件系统(HDFS)中的大数据。通过 SQL 类似的查询语言,Hive 使得数据分析变得更加简单和高效。在本文中,我们将探讨如何将 Hive 连接Hadoop,并提供代码示例和步骤流程图,以帮助你更好地理解这个过程。 ## 1. 环境准备 在使用 Hive 之前,
原创 10月前
298阅读
# 如何实现 Hive 连接平台:新手开发者的指南 在大数据时代,Hive 是一个常用的数据仓库工具,它能够方便地使用 SQL 语言进行数据分析。对于刚入行的小白来说,理解如何建立 Hive 连接是首先要迈出的重要一步。本文将详细描述如何实现 Hive 连接平台流程,并提供实际的代码示例。 ## Hive 连接步骤 以下是实现 Hive 连接的基本流程: | 步骤 | 描述
原创 2024-09-12 03:43:11
45阅读
目录一、概述二、EFAK kafka鉴权配置(zookeeper无鉴权)1)kafka Kerberos 鉴权 配置1、启动zookeeper服务2、启动kafka服务3、配置EFAK4、把配置copy到几个节点5、启动EFAK服务6、测试验证2)kafka 账号密码鉴权 配置1、启动zookeeper服务2、启动kafka服务3、配置EFAK4、把配置copy到几个节点5、启动EFAK服务6、测
转载 2023-12-13 21:49:37
147阅读
0. 引言hadoop 集群,初学者顺利将它搭起来,肯定要经过很多的坑。经过一个星期的折腾,我总算将集群正常跑起来了,所以,想将集群搭建的过程整理记录,分享出来,让大家作一个参考。由于搭建过程比较漫长,所以,这篇文章应该也会很长,希望大家能耐心看完。1. 集群环境和版本说明3台CentOS 7.4 的服务器,4CPU,8G内存; jdk 1.8 hadoop 2.7.7 spark 2.3.0
转载 2024-05-01 17:37:08
341阅读
HadoopHadoop是一个开源框架来存储和处理大型数据在分布式环境中。它包含两个模块,一个是MapReduce,另外一个是Hadoop分布式文件系统(HDFS)。MapReduce:它是一种并行编程模型在大型集群普通硬件可用于处理大型结构化,半结构化和非结构化数据。HDFS:Hadoop分布式文件系统是Hadoop的框架的一部分,用于存储和处理数据集。它提供了一个容错文件系统在普通硬件上运行。
转载 2023-07-14 19:55:18
109阅读
版权声明: 作者:虚无境 博客园出处: CSDN出处:     个人博客出处:http://www.panchengming.com 原创不易,转载请标明出处,谢谢!引言在大数据学习系列之一 —– Hadoop环境搭建(单机) 成功的搭建了Hadoop的环境,在大数据学习系列之二 —– HBase环境搭建(单机)成功搭建了HBase的环境以及相关使用介绍。本文主要讲解如何搭建Hadoop
转载 2024-09-06 00:04:40
92阅读
Apache hive数据仓库:英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进监视时间、成本、质量以及控制。 Apache Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,
转载 2023-09-22 20:17:46
75阅读
一、Hive是什么? Hive的本质就是:将HQL/SQL转化为MapReduce程序在Hadoop上运行,可以看成 是一个SQL解析引擎 Hive是基于Hadoop的一个 数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 Hive表是HDFS的文件目录,一个表对应一个目录名,如果有分区的话, 则分区值对应子目录。  
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建。 本地模式需要采用MySQL数据库存储数据。1 环境介绍一台阿里云ECS服务器:master操作系统:CentOS 7.3Hadoophadoop-2.7.3.tar.gz Java: jdk-8u77-linux-x64.tar.gz Hive:apache-hi
转载 2024-05-18 17:49:56
109阅读
要在windows下连接虚拟机上的HDFS首先要保证windows下有java环境和hadoop环境    这里给出hadoop在windows下的配置方法跳转windows下hadoop环境配置,java环境的配置可以搜相关教程。 IDEA实现虚拟机上HDFS的文件操作 IDEA连接虚拟机上的HDFS 一、环境准备 二、big data tools插件连接
转载 2023-07-12 23:49:20
306阅读
<dependencies> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>3.8.1</version> <scope>test</scope> </dependency> <..
原创 2021-04-07 15:47:58
207阅读
Hadoop平台的搭建流程之单机/伪分布配置所需工具:VMware Workstation / Virtual Box 虚拟机; Hadoop安装文件;实验环境:Ubuntu 32位或64位系统 / CentOS系统;ps:该实验教程采用Ubuntu 64位系统进行讲解。   Ubuntu安装系统:请参考http://dblab.xmu.edu.cn/blog/337-2/   如果使用CentO
转载 2024-02-05 15:03:47
55阅读
Hive介绍Hadoop开发存在的问题只能用java语言开发,如果是c语言或其他语言的程序员用Hadoop,存 在语言门槛。 需要对Hadoop底层原理,api比较了解才能做开发。Hive概述Hive是基于Hadoop的一个数据仓库工具。可以将结构化的数据文件映射为 一张表,并提供完整的sql查询功能,可以将 sql语句转换为 MapReduce任 务进行运行。其优点是学习成本低,可以通过类 SQ
转载 2023-07-13 16:35:38
114阅读
# 通过DBeaver连接Hive的完整指南 ## 引言 在数据分析和大数据处理的领域,Hive是一个广泛使用的工具。通过DBeaver,即一个开源的数据库管理工具,我们可以方便地连接和管理Hive。本文将引导你一步步解决在通过URL连接Hive时可能遇到的报错问题,并提供相关代码示例及解释。 ## 整体流程 我们将通过以下步骤来完成Hive连接: | 步骤 | 内容
原创 11月前
383阅读
一、Hive基本概念1、概念 Hive:由Facebook开源用于解决海量结构化日志的数据统计。 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质是:将HQL转化成MapReduce程序 HQL转化成MapReduce (1)Hive处理的数据存储在HDFS(2)Hive分析数据底层的实
转载 2023-08-30 19:26:13
106阅读
目录一、概述1)Impala优点2)Impala缺点二、Impala架构1)Impala组件组成1、Client2、Impalad3、Statestore4、Catalog5、数据存储服务2)Impalad服务的三种角色3)Impala运行原理1、启动服务时执行的操作2、查询SQL的运行流程3、数据计算流程三、Impala环境部署(CDH集成)1)添加服务2)自定义角色分配3)审核更改4)安装完成
转载 2023-05-29 10:29:22
141阅读
初始Hadoop   google的三篇论文(GFS,MapReduce,BigTable)很快促进了hadoop的面世,hadoop实际上起源于Nutch项目,于2006年2月正式启动,2008年开始hadoop正式火起来了。 Apache HadoopHadoop 生态系统Common:一系列组件和接口,用于分布式文件系统和通用I/O Avro : 一种序列化系统,用于支持高效,
转载 2023-07-12 11:15:11
109阅读
Hadoop是一个分布式计算的开源框架,包含三大核心组件:HDFS(Hadoop Distributed System分布式文件系统)、HIVE(数据仓库工具)、HBASEHDFSHDFS是Hadoop生态圈最基础的存储引擎,请注意HDFS的设计主要为大文件存储,为高吞吐量的读取和写入服务,HDFS不适合存储小文件,也不支持大量的随机读写。Hive专门处理存储在HDFS数据仓库工具,通过Hive
转载 2023-08-16 06:28:07
68阅读
  • 1
  • 2
  • 3
  • 4
  • 5