package com.uniclues.hbase;import java.io.IOException;import java.util.HashSet;import java.util.List;import java.util.Set;import java.util.TreeSet;import org.apache.hadoop.conf.Configuration;...
原创 2021-11-12 17:27:14
287阅读
参考链接:https://github.com/yangjf2019/learning-spark-group/blob/master/s
原创 2022-11-03 14:06:12
105阅读
问题导读: 1.如何初始化sparkContext? 2.如何设置查询条件? 3.如何获得hbase查询结果Result? 由于spark提供的hbaseTest是scala版本,并没有提供java版。我将scala版本改为java版本,并根据数据做了些计算操作。 程序目的:查询出hbase满足条件的用户,统计各个等级个数。 代码如下,西面使用的hbase是0.94注释已经写详细: pack
转载 2023-08-13 23:28:31
73阅读
hbase安装1、解压tar-zxvf/hbase-1.2.9-bin.tar.gz-C/usr/localmvhbase-1.2.9hbase2、修改配置文件:conf/hbase-env.shcdhbasevimconf/hbase-env.shexportHBASE_MANAGES_ZK=falseexportJAVA_HOME=/usr/local/jdk1.8exportHBASE_CL
原创 2019-01-09 17:48:46
4025阅读
1点赞
hbase之前版本有些api已经deprecated了,下面是1.2的api,没有deprecatedimport java.io.IOException;import java.util.ArrayList;import java.util.List;import java.util.concurrent.ExecutorService;import java.util.concu
原创 2022-07-28 16:35:52
124阅读
spark读取hbase数据 0.我们有这样一个表,表名为Student1.在Hbase中创建一个表表明为student,列族为info2.插入数据我们这里采用put来插入数据格式如下   put  ‘表命’,‘行键’,‘列族:列’,‘值’  我们知道Hbase 四个键确定一个值,一般查询的时候我们需要提供  表
转载 2023-07-12 10:59:21
41阅读
HBase概念:HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。它经常被描述为一种稀疏的,分布式的,持久花的,多维有序映射, 基于行键rowkey,列簇column family和时间戳timestemp.HBase生态环境HBase时Google Bigtable的开
转载 2023-07-21 15:47:56
47阅读
可登录(完成操作后记得改回来)##这里没有全部显示[root...
原创 2023-05-06 14:56:50
128阅读
1. HBase    一个构建在HDFS上的高可靠、高性能、面向列、可伸缩、分布式列存储开源数据库,主要用于存储海量数据,同时使用mapreduce处理HBase中的数据,利用zookeeper作为协同服务。读写相对简单,不支持条件查询2. HBase与HDFS对比    都具有良好的容错性和扩展性 &nb
原创 2016-08-18 15:56:37
1298阅读
一.前言MapReduce早已经对接了HBase,以HBase作为数据源,完成批量数据的读写。如今继MapReduce之后的Spark在大数据领域有着举足轻重的地位,无论跑批,流处理,甚至图计算等都有它的用武之地。Spark对接HBase成为不少用户的需求。二.SparkOnHBase1.可以解决的问题SparkHBase无缝对接意味着我们不再需要关心安全和RDD与HBase交互的细节。更方便应
原创 2021-04-01 20:59:00
551阅读
MapReduce早已经对接了HBase,以HBase为数据源,完成批量数据的读写。继MapReduce之后Spark在大数据领域有着举足轻重的地位,无论跑批流处理,甚至图计算等都有它的用武之地。Spark对接HBase成为不少用户的需求。
转载 2021-07-27 16:30:09
242阅读
环境搭建及接口调用一、基础环境搭建1.节点基础网络配置2.配置 SSH 免密码登录3.安装 JDK、Scala4.配置完全分布式的 Hadoop5.配置完全分布式的 HBase6.配置 StandAlone 模式的 Spark7.安装和配置 MySQL8.Hbase操作二、存储接口设计及使用说明1.存储接口设计2.存储数据请求标准json格式3.存储接口调用4.存储返回状态码5.参数属性表、设备
1、遇到错误,认真查看日志,这才是解决问题的王道啊!不过很多时候,尤其是开始摸索的时候,一下要接触的东西太多了,学东西也太赶了,加上boss不停的催进度,结果欲速则不达,最近接触大数据,由于平台是别人搭建的,搭没搭好不知道,也不清楚细节,出了问题也不知道是自己这边的还是平台的问题。有的时候就是小问题忽略了,结果花了好多时间又才重新发现。 提交job:./spark-submit --cl
转载 2024-06-17 17:30:05
44阅读
大数据云平台平台部署1.Hadoop平台2.HDFS3.Hbase数据库4.Hive5.MapReduceHbase表结构设计1.Hbase简介2.Hbase设计存储与查询接口设计1.存储接口设计2.查询接口设计后台数据仓库设计数据仓库设计 涉及范围 Linux系统环境搭建Hadoop + Spark + Hbase 平台部署Hbase表结构设计数据存储及查询接口的设计与实现基于Hbase的数据
1. HBase读写的方式概况主要分为:纯Java API读写HBase的方式;Spark读写HBase的方式;Flink读写HBase的方式;HBase通过Phoenix读写的方式;第一种方式是HBase自身提供的比较原始的高效操作方式,而第二、第三则分别是Spark、Flink集成HBase的方式,最后一种是第三方插件Phoenix集成的JDBC方式,Phoenix集成的JDBC操作
1.sparkspark是一个数据分析、计算引擎,本身不负责存储;可以对接多种数据源,包括:结构化、半结构化、非结构化的数据;其分析处理数据的方式有多种发,包括:sql、Java、Scala、python、R等;其中spark-sql用来对结构化数据分析处理,它将数据的计算任务通过SQL的形式转换成了RDD的计算。2.hive数据仓库,主要负责数据存储和管理,看作MapReduce计算引擎+HDF
转载 2023-09-01 10:59:11
125阅读
HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。
转载 2023-07-12 07:54:43
131阅读
1.开发环境SpringBoot:2.3.10 HBase:2.3.5 JDK:1.8 本文基于已经搭建好的HBase开发环境,若不清楚的可以阅读另一篇win10搭建Hadoop3.2.2和HBase2.3.5单机版2.引入maven依赖新建springboot-hbase模块,在pom.xml中引入如下依赖:<dependency> <groupId>org.ap
转载 2023-06-14 16:53:01
18阅读
从昨天开始研究通过SparkHBase中插入数据,开始在GitHub上面找了一段代码,但是调试起来不好用;于是到今天下午一直在研究这个代码,本来对于Python不太熟悉,对于PySpark更是不熟悉;而且还少一些包; 后来突然想到其实Spark还有Java版本的,PySpark和它都是Spark
转载 2017-08-13 22:13:00
100阅读
2评论
一、概述    Ha,已经有两个月没有更新blog了。由于近排公司需要引入Spark相关技术,我也是作为技术攻关人员之一,在这段时间使用Spark遇到了挺多问题,跌的坑也比较多,这篇blog主要总结一下这段时间使用Spark遇到的一些问题。二、遇到的"坑"和爬坑思路1、SparkSql on yarn-client模式遇到找不到mysql驱动包问题。解决方案
推荐 原创 2014-12-30 18:31:36
10000+阅读
3点赞
4评论
  • 1
  • 2
  • 3
  • 4
  • 5